[CNMO科技消息]8月21日胜亿优配,深度求索(DeepSeek)正式发布其最新大语言模型DeepSeek-V3.1,标志着该系列模型在架构设计与智能体能力上的又一次重要跃升。此次更新不仅优化了模型推理效率,更在工具调用、多任务处理和实际应用场景中实现了显著突破,旨在为用户提供更高效、更可靠的AI服务。
本次发布的V3.1版本引入混合推理架构,支持“思考模式”与“非思考模式”自由切换。用户可通过官方App或网页端的“深度思考”按钮选择不同模式,兼顾响应速度与推理深度。据官方介绍,新模型在保持性能不变的前提下,输出token数量较前代R1-0528减少20%至50%,显著提升了响应效率。在AIME2025、GPQA等基准测试中,V3.1-Think表现与前代持平甚至略有提升,同时资源消耗更低。
胜亿优配
在智能体(Agent)能力方面,V3.1通过后训练优化,在编程、搜索及复杂任务执行中展现出更强的工具调用能力。在SWE代码修复与Terminal-Bench终端任务测试中,其完成效率优于此前版本。搜索智能体测评显示,V3.1在多步推理与跨学科难题处理中表现突出,大幅领先R1-0528。此外,API已同步升级,提供deepseek-chat(非思考)与deepseek-reasoner(思考)两个接口,上下文长度均扩展至128K,并支持strict模式的函数调用,确保输出符合预定义schema。
为提升兼容性,API现已支持Anthropic格式,便于集成至Claude生态。模型方面,V3.1Base已在HuggingFace与魔搭平台开源,包含重新训练的840Btokens,采用FP8精度,并更新了分词器与对话模板。官方提醒开发者注意版本差异。
此外,价格方面,DeepSeek自9月6日起将调整API计费标准,取消夜间优惠胜亿优配,具体以平台公告为准。
富腾优配提示:文章来自网络,不代表本站观点。