阶跃星辰发布多模态推理模型Step-R1-V-Mini

Source

品玩4月9日讯,据阶跃星辰官方消息,正式发布全新多模态推理模型——Step-R1-V-Mini,支持图文输入、文字输出、有良好的指令遵循和通用能力,能够高精度感知图像并完成复杂推理任务。

Step-R1-V-Mini 在多个公开榜单中表现亮眼,在MathVision 视觉推理榜单位列国内第一,在视觉推理、数学逻辑和代码等方面表现优异。其训练路径基于 PPO 强化学习策略,在图像空间引入 verifiable reward 来解决图片空间推理链路复杂、容易产生混淆的相关和因果推理错误的问题。相较 DPO 等方法,在处理图像空间的复杂链路时更具泛化性与鲁棒性。

Step-R1-V-Mini 已正式上线阶跃AI 网页端,并在阶跃星辰开放平台提供 API 接口。