开云体育(中国)官方网站并保留原有立场辅导为止智商-ky体育官网登录入口网页版(中国)有限公司官网
发布日期:2026-04-30 08:40 点击次数:125
凤凰网科技讯 4月24日,继前一日MiMo-V2.5系列大模子公测后,小米本事团队当天再次加码,认真发布MiMo-V2.5-TTS系列与MiMo-V2.5-ASR,补皆语音输入与输出全链路。

其中,TTS系列包含三款模子,均撑捏通过当然说话辅导致密同样声息发达。MiMo-V2.5-TTS:内置多款极品音色,开箱即用,撑捏语速、厚谊为止。MiMo-V2.5-TTS-VoiceDesign:撑捏一句话从零生周详新音色,无需参考音频。MiMo-V2.5-TTS-VoiceClone:数秒参考音频即可高保真复刻打算音色,并保留原有立场辅导为止智商。官方演示显露,模子能遵照“狠毒尖刻、谄上骄下”等复杂辅导,并撑捏在文本中插入音频标签进行致密化为止。
当作听觉基座,MiMo-V2.5-ASR当天认真开源(包括模子权重与代码)。该模子面向复杂真正场景,撑捏吴语、粤语等中语方言,以及中英文混说、强杂音、多东谈主对话等场景,并原生输出标点象征,转写效力即拿即用。
当今开云体育(中国)官方网站,TTS系列已在MiMo Studio绽开快速体验,ASR代码与权重可在GitHub和HuggingFace赢得。小米预报,下一步将向通用音频生成(音效、音乐)及更强的险峻文交融智商扩张。
