行业新闻

NARI LABS开源16亿个文本参数AI模型DIA,支持精致音

作者: bet356亚洲版本体育   点击次数:    发布时间: 2025-04-26 16:26

NARI LABS开源16亿个文本参数AI模型DIA,支持精致音调/情感/舌头/舌头 NARI LABS开源16亿个文本参数AI模型DIA,支持精致音调/情感/舌头/舌头 2025年4月24日22:33 在家 4月24日的Home报道说,由两名韩国研究人员组成的Nari Labs Studio开设了AI文本到语音模型DIA,其GitHub参数为16亿,并拥抱了前一天的面貌。目前,相应的模型已在Github接收了9,300多颗恒星。 GitHub项目附加到房屋上,如下所示:https://github.com/nari-labs/dia相应的研究人员说,Dia的声音比文本到 - 讲台模型更灵活,与此同时,它比Elevenlabs Studio,sesame,sesame and sesame and sesame and kacompetition and sesame and kacompetition the Inderated Intarted Interal的本质。它支持对输出音调,情绪和语调的精细调整,也可以模仿各种非 - 语言交流(例如笑声,咳嗽或清除喉咙等)。官方比较评论表明,DIA比Elevenlabs Studio更好,重点是语音的自然综合,而CSM-1B是芝麻启动的对话语音模型,就语调的性质,财富的表达和节奏学的节奏而言。目前,DIA仅支持英语,并且需要NVIDIA RTX 3080或比在本地部署和操作的图形卡。但是,在线用户也可以在面部面平台的脸上使用它。 Nari Labs表示,将来它将为Ordinancesg买家推出一键式扩展服务,进一步降低使用的门槛,并允许更多经验丰富的高质量文本到声音技术的人。