
微软 OmniParser V2.0 重磅发布:AI 视觉解析迎来重大升级,自动化与可访问性迈向新高度
微软 OmniParser V2.0 是新一代 AI 视觉解析工具,可将 GUI 界面转换为结构化数据,具有更快的处理速度和更高的检测准确率,支持多平台输入并可与主流 LLM 无缝集成。
微软 OmniParser V2.0 是新一代 AI 视觉解析工具,可将 GUI 界面转换为结构化数据,具有更快的处理速度和更高的检测准确率,支持多平台输入并可与主流 LLM 无缝集成。
字节跳动联合港大推出的Goku视频生成模型在VBench基准测试中取得84.85的优异成绩,展现出强大的视频生成能力和商业应用潜力。该模型支持文本到视频、图像到视频等多种生成任务,在画面质量、采样、人物动作等多个维度均表现出色。
DeepSeek R1 是 DeepSeek 公司推出的一款基于强化学习的大语言模型,它在推理能力上取得了重大突破,甚至能与 OpenAI 的 o1-1217 相媲美。
Let's Encrypt 宣布将在2025年推出6天有效期证书选项和IP地址证书支持。这一重大更新将进一步提升Web PKI的安全性,同时为基于IP地址的服务提供更灵活的SSL/TLS证书解决方案。
字节跳动开源基于 Golang 的大模型应用开发框架 Eino,提供稳定、可扩展的开发体验。Eino 基于明确的组件定义和强大的流程编排能力,覆盖开发全流程,帮助开发者快速构建高质量的大模型应用。框架具有内核稳定、敏捷扩展、高可靠易维护等特点,并提供丰富的工具生态支持。
VLC在CES 2025展会上发布重大更新,基于本地离线开源AI模型实现自动字幕生成和翻译功能,无需联网即可完成视频字幕提取和多语言翻译。该功能完全基于设备本地运算,采用开源AI模型,支持多语言互译,针对不同性能设备进行了优化,确保用户隐私安全的同时提供强大的AI辅助能力,开创了媒体播放器与AI技术结合的新纪元
CES 2025 | 英伟达(NVIDIA)最新旗舰显卡RTX 5090震撼曝光,搭载32GB GDDR7显存,21760个CUDA核心,最高2.00TB/s显存带宽,开启显卡新纪元。本文详细解析RTX 5090的核心参数、性能特点、散热设计等重要信息
在CES 2025即将开幕之际,让我们回顾2024年CES消费电子展的精彩亮点,涵盖AI PC、可折叠设备、智能汽车等重点领域的创新产品与技术趋势。深入分析展会成果,展望未来科技发展方向。
One API Docker Hub官方镜像疑似被投毒,植入挖矿程序
"DeepSeek - V3 模型深度剖析。其架构融合 MLA 与 DeepSeekMoE,负载均衡策略创新。14.8 万亿 tokens 预训练,HAI - LLM 框架与 FP8 技术助力。MTP 等创新技术加持,性能超开源、近闭源,多领域出色。成本效益优,训练与 API 价格低,是 AI 关键参考,推动语言模型发展。”