AI导读:

Anthropic宣布推出混合推理模型Claude 3.7 Sonnet,该模型既能快速响应也能提供分步思考,并推出代理编码工具Claude Code。同时,公司即将完成35亿美元融资,估值达615亿美元。全球AI界掀起推理模型热潮。

  被视为OpenAI竞争对手的美国AI(人工智能)初创公司Anthropic宣布推出“迄今为止最智能的首款混合推理模型”Claude 3.7 Sonnet,此举引发业界广泛关注。当地时间2月24日,由亚马逊投资支持的Anthropic正式揭晓这一新模型,并将其定位为“市面上首款混合推理模型”。该模型既能快速响应,也能提供分步思考,后者仅限付费用户。同时,公司还推出了代理编码工具Claude Code。

  据官方介绍,Claude 3.7 Sonnet在编码和Web开发领域展现出显著进步,且价格友好,每百万输入token定价3美元,输出则为15美元,相比之下,OpenAI的o1模型定价更高。Anthropic强调,新模型融合快速反应与深度思考,为用户带来无缝体验,这也是其区别于市场上其他推理模型的关键。

  Claude 3.7 Sonnet分为标准模式和扩展思维模式。在标准模式下,它是Claude 3.5的升级版;而在扩展模式下,模型会进行自我反思,提升数学、物理和编码等任务表现。用户可通过API控制“思考预算”,以在速度、成本和答案质量间找到平衡。

  新模型在解决实际问题方面表现出色,在SWE-Bench Verified测试中得分大幅提升。此外,Claude 3.7 Sonnet在指令遵循、推理、多模态和代理编码方面均取得优异成绩,扩展思维模式则在数学和科学领域展现显著提升。

  Claude 3.7 Sonnet在不同模式下的测试得分。来源:Anthropic

  同时,Anthropic推出首款代理编码工具Claude Code,具备搜索、读取、编辑代码等功能,已开放预览版。据悉,该工具在早期测试中表现出色,大幅缩短手动操作时间。

  融资方面,Anthropic宣布即将完成35亿美元融资,公司估值达615亿美元。本轮融资参与者包括Lightspeed Venture Partners等,亚马逊已累计投资80亿美元。尽管面临竞争压力,Anthropic仍计划利用新融资支持AI模型训练。

  近期,全球AI界掀起推理模型热潮。中国AI初创公司深度求索推出Deepseek-R1,OpenAI发布o3-mini,谷歌推出Gemini 2.0 Flash Thinking等。此外,阿里通义Qwen也发布推理模型QWQ-Max-Preview预览版。

(文章来源:澎湃新闻)