微软 OmniParser V2.0 是新一代 AI 视觉解析工具,可将 GUI 界面转换为结构化数据,具有更快的处理速度和更高的检测准确率,支持多平台输入并可与主流 LLM 无缝集成。
CogAgent-9B: 智谱AI与清华大学联合打造的革命性GUI智能体,以9B参数量实现卓越的界面理解与自动化交互能力,在MM-Vet等多项基准测试中大幅领先现有模型