ChatGPT 升级,节日 GPT-4.1 API

Source

品玩5月15日讯,据 OpenAI 官网消息,OpenAI 目前已经在 API 中接入新产品,GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。

这些型号的性能全面超越了 GPT-4o 和 GPT-4o mini,在编码和指令跟踪方面都有显著提升。它们还拥有更大的语境窗口--支持多达 100 万个语境词块,并能更好地利用语境,提高长语境理解能力。它们的特点是更新知识截止日期为 2024 年 6 月。

GPT-4.1 在以下行业标准指标方面表现出色:

编码: GPT-4.1 在 SWE 基准验证中的得分率为 54.6%,比 GPT-4o 提高了 21.4%abs,比 GPT-4.5 提高了 26.6%abs,成为领先的编码模型。

指令跟随: 在 Scale 的 MultiChallenge(在新窗口中打开)基准测试中,GPT-4.1 的得分率为 38.3%,比 GPT-4o 提高了 10.5%abs。

长背景: 在视频-MME(在新窗口中打开)这一衡量多模态长语境理解能力的基准测试中,GPT-4.1 在无字幕长语境类别中取得了 72.0% 的成绩,与 GPT-4o 相比提高了 6.7%abs ,创造了新的一流成绩。