MiniMax Audio推Speech- 02语音模型，一次性可以输入20万字符

Source

品玩4月2日讯，据 AIBase 报道，MiniMax Audio正式发布了其全新的Speech-02系列语音模型，支持30多种语音，一次性可以输入20万字符。为用户带来更真实、更流畅、更便捷的音频体验。

全新的Speech-02系列是本次更新的核心亮点。据官方介绍，该系列在多语言覆盖能力上实现了显著提升，能够更准确、更地道地呈现多种语言的发音。Speech-02的人声相似度高达99%，这意味着合成的语音听起来更加自然、贴近真人. 此外，该模型还实现了零节奏故障，彻底解决了音频播放过程中可能出现的卡顿和节奏不稳问题，保证了听感的连贯性和流畅性。

除了核心的语音合成技术的提升，MiniMax Audio还推出了多项实用新功能。全新的“Read Anything”功能允许用户通过上传本地文件或粘贴网络URL，即可随时随地收听各类内容，极大地拓展了用户获取音频信息的渠道，我们之前的对话]。无论是文档、电子书还是网页文章，用户都可以轻松转化为自己喜欢的音色进行聆听。