Qwen3-Next 系列发布:Gated DeltaNet × Gated Attention 混合架构,80B 总参仅激活约 3B,实现长上下文、高并发与低延迟;Instruct 与 Thinking 分工明确,覆盖从生产对话到深度推理的全场景。
"DeepSeek宣布开源其推理引擎,与vLLM社区深度协作。引擎融合多项创新技术:跨节点专家并行、 多头潜注意力(MLA)、动态负载均衡等。通过Day-0支持策略和社区协作,降低AI开发门槛, 推动基础设施标准化。开源计划展现对开放科学的承诺,为AI生态系统发展注入新动力。"