标签: deepseek

共 4 篇文章

DeepSeek V3.1：混合推理、强劲编程与 Agent 能力，支持Claude Code，性价比再升级

DeepSeek V3.1 DeepSeek 混合推理编程 Agent Anthropic API Claude Code

DeepSeek V3.1 支持Claude Code，混合推理架构：引入 Think/Non‑Think ，编程与智能体（Agent）能力大幅提升，128K 长上下文与 MoE 带来高性能与低成本的最佳平衡。

Aug 22, 2025 • 7 min read

News

开源DeepSeek推理引擎：推动AI基础设施的社区协作新篇章

deepseek vLLM MoE

"DeepSeek宣布开源其推理引擎，与vLLM社区深度协作。引擎融合多项创新技术：跨节点专家并行、多头潜注意力(MLA)、动态负载均衡等。通过Day-0支持策略和社区协作，降低AI开发门槛，推动基础设施标准化。开源计划展现对开放科学的承诺，为AI生态系统发展注入新动力。"

Apr 14, 2025 • 9 min read

News

LLM-Reasoner：让你的大语言模型像DeepSeek R1一样深度思考

LLM-Reasoner 大模型思维链 DeepSeek 深度思考

探索如何使用LLM-Reasoner框架让模型像DeepSeek R1一样进行深度思考，通过结构化推理提升大语言模型的逻辑分析能力。包含完整的配置和部署指南，助您打造具备强大推理能力的AI系统。

Feb 7, 2025 • 6 min read

AIGC

DeepSeek-V3 模型深度剖析：AI 新时代的璀璨之星

deepseek-v3 deepseek 人工智能深度求索大模型

"DeepSeek - V3 模型深度剖析。其架构融合 MLA 与 DeepSeekMoE，负载均衡策略创新。14.8 万亿 tokens 预训练，HAI - LLM 框架与 FP8 技术助力。MTP 等创新技术加持，性能超开源、近闭源，多领域出色。成本效益优，训练与 API 价格低，是 AI 关键参考，推动语言模型发展。”

Dec 27, 2024 • 11 min read

News