阶跃星辰发布多模态推理模型Step-R1-V-Mini

Source

品玩4月9日讯，据阶跃星辰官方消息，正式发布全新多模态推理模型——Step-R1-V-Mini，支持图文输入、文字输出、有良好的指令遵循和通用能力，能够高精度感知图像并完成复杂推理任务。

Step-R1-V-Mini 在多个公开榜单中表现亮眼，在MathVision 视觉推理榜单位列国内第一，在视觉推理、数学逻辑和代码等方面表现优异。其训练路径基于 PPO 强化学习策略，在图像空间引入 verifiable reward 来解决图片空间推理链路复杂、容易产生混淆的相关和因果推理错误的问题。相较 DPO 等方法，在处理图像空间的复杂链路时更具泛化性与鲁棒性。

Step-R1-V-Mini 已正式上线阶跃AI 网页端，并在阶跃星辰开放平台提供 API 接口。