制声音的感情、语速、场景等

2026-03-06 06:26

    

  生僻字句错率由15.2%降低到5.3%。基于参考音频的声音克隆模子Fun-CosyVoice3.5、无参考音频的音色设想模子Fun-AudioGen-VD。节制声音的感情、语速、场景等。据引见,还能同步模仿复杂的听觉,阿里发布两款语音新模子,Fun-CosyVoice3.5支撑freestyle指令节制,此中,处理了保守克隆模子只会仿照不克不及指定脚色的痛点。合用于有声书、逛戏、客服、播客、教育、曲播等多个场景。其可用freestyle(气概模式)定制脚色,两款模子通过利用DiffRO和GRPO,该模子不只能按照描述定制音色和感情,

福建PA视讯信息技术有限公司


                                                     


返回新闻列表
上一篇:告白声明:文内含有的对外跳转链接(包罗不限 下一篇:他才认识到——那底子不