3044am永利官网-Anthropic推出全新旗舰Claude Sonnet 4.5 模型，创下AI编码记录

作者：3044am永利发布时间：2025-12-02

Anthropic推出全新旗舰Claude Sonnet 4.5 模型，创下AI编码记录作者：时间：2025-09-30 来源：加入技术交流群扫码加入和技术大咖面对面交流海量资料库查询

Anthropic PBC 今天推出了其最新的大型语言模型 Claude Sonnet 4.5 和用于构建人工智能代理的工具包。

该公司将 LLM 描述为世界上最好的编码模型。此外，它还表示 Sonnet 4.5 在旨在评估神经网络工具使用能力的基准测试上创下了记录。

Sonnet 4.5 是一种混合推理模型，这意味着它有两种模式。当用户输入相对简单的查询时，LLM 会使用有限的计算能力快速生成响应。当收到更复杂的问题时，Sonnet 4.5 可以花费大量时间来回答答案。这种方法以更高的硬件使用率为代价提高了输出质量。

Anthropic 使用名为 SWE-bench Verify 的基准测试评估了该模型的编程能力。Sonnet 4.5 以 82% 的得分创造了新的行业纪录。接下来的两个最高分也是 Anthropic 模型获得的，而第四名是 GPT-5 Codex，它正确回答了 74.5% 的问题。

Sonnet 4.5 还在名为 OSWorld 的第二个基准测试中创下了记录。它用于衡量神经网络与数据库等外部应用程序的交互程度。Sonnet 4.5 取得了 61.4% 的创纪录分数，比四个月前发布的 Sonnet 4 模型 Anthropic 提高了近 20%。

该公司声称，其最新的法学硕士在六多个其他基准测试中也优于竞争对手。据 Anthropic 称，这些测试评估人工智能模型执行解释图表和分析财务数据等任务的能力。

Sonnet 4.5 可通过 Anthropic 的 Claude 聊天机器人服务、Claude Code 编程助手及其应用程序编程接口获得。后两款产品今天随着 LLM 的发布而收到了更新。

开发人员通过在命令行界面中输入指令来与 Claude Code 进行交互。作为今天更新的一部分，Anthropic 对该界面进行了多项可用性改进。此外，它还推出了一个扩展，将 Claude Code 嵌入到流行的 Visual Studio Code 编程工具中。该扩展目前处于测试阶段。

Claude Code 的另一个主要新增功能是一项功能，该功能在每次重大更改后自动保存用户的代码。如果工作流程中出现错误，开发人员可以将他们的代码倒回到早期的可靠版本。

这些升级与名为 Claude Agent SDK 的开发工具包一起推出。据 Anthropic 称，其工程师最初构建该工具包是为了支持 Claude Code。客户可以使用它来构建 AI 代理。

Claude Agent SDK 使代理能够将工作委托给所谓的子代理，这些子代理可以并行执行多个任务，从而加快处理速度。此外，该工具包可以更轻松地构建可以与外部系统交互的 AI 应用程序。为了降低幻觉的风险，使用 Claude Agent SDK 构建的代理可以检查其输出是否存在准确性问题。

该工具包可以与 Claude API 一起使用，它现在提供对 Sonnet 4.5 的访问。LLM 还加入了其他几个增强功能。

据 Anthropic 称，开发人员现在可以让其人工智能模型访问“专用内存目录”，其中包含可以帮助他们回答提示的信息。当不再需要该信息时，可以使用新的上下文编辑工具将其从模型的上下文窗口中删除。Anthropic 表示，这些增强功能将使 Claude API 能够处理比以前更复杂的任务。

-3044am永利官网