关闭广告

IDEA研究院发布LEMAS:首个15万小时多语言语音数据集

科技行者2616人阅读


科技发展到今天,人工智能已经能够模仿人类的声音说话了。然而,如果你曾经尝试过让AI说其他语言,比如让一个英语AI说中文,你可能会发现它的口音怪异,发音不准,甚至完全听不懂在说什么。这就像是一个只会说英语的人硬要说中文,结果说得让人啼笑皆非。这背后的根本问题是什么呢?缺乏高质量的多语言语音数据。

由国际数字经济研究院(IDEA)主导的研究团队最近发表了一项突破性成果,这项研究发表于2025年1月的arXiv预印本服务器上,论文编号为arXiv:2601.04233v1。感兴趣的读者可以通过这个编号查询完整论文。研究团队构建了一个名为LEMAS的庞大语音数据集,包含超过15万小时的多语言语音数据,覆盖10种主要语言,并且每个词都有精确的时间戳标注。基于这个数据集,他们还开发了两个强大的AI模型:LEMAS-TTS和LEMAS-Edit,前者专门负责语音合成,后者专门负责语音编辑。

为了理解这项研究的重要性,我们可以把语音AI比作一位多语言播音员。传统的播音员要想掌握多种语言,需要大量的训练素材和精确的指导。同样,AI要想说好多种语言,也需要海量的高质量语音数据作为"教材"。但现有的多语言语音数据存在许多问题:要么

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

将于二季度上市 蔚来ES9实车曝光还有双色车身

网易汽车 浏览 2658

51岁周迅又穿成人间香奈儿,这个搭配思路确实好用

黎贝卡的异想世界 浏览 3780

热度破5000!李行亮麦琳刚走,又来2大活宝,芒果台又出王炸综艺

娱乐圈笔娱君 浏览 3713

临危受命18个月,横琴人寿董事长或“功成身退”!

独角金融 浏览 2421

波兰称考虑禁止中国电动汽车进入其军事基地 中方回应

财联社 浏览 6980

小区居民被大型空调设备震得神经衰弱 多次报警仍无果

环球网资讯 浏览 6779

海南“半价豪车”真相:代购违规,15年强制报废还得补缴巨款

国际金融报 浏览 2887

新规在路上!基金销售要“变天”?

国际金融报 浏览 3029

中年返贫,一场无声的凌迟

识局 浏览 3580

记者:法比安-鲁伊斯因左膝伤势将会继续缺席巴黎与纽卡的比赛

懂球帝 浏览 2429

光伏“卖铲人”去年净利腰斩

网易财经 浏览 2198

产品力再提升 全新雪佛兰Bolt EV新车图解

车质网 浏览 3532

2028年4月投产 全新宝马iX6效果图曝光

车质网 浏览 338

98年翻版金城武,“正统男港星”终于又出现了

时尚COSMO 浏览 2985

特朗普:继续陈兵伊朗及周边

极目新闻 浏览 1069

曾随海港4次夺冠!33岁名将告别中超 不舍离开将屈尊B队+征战中乙

我爱英超 浏览 2410

黎巴嫩真主党证实其高级领导人遭以军空袭身亡

环球网资讯 浏览 3297

38岁的陈晓让整个娱乐圈“沉默”了?

包饺子ai剪辑 浏览 3337

坠机身亡主播"唐飞机"是驻村干部 曾被约谈"不要飞"

澎湃新闻 浏览 39475

模速为核 智领未来——徐汇人工智能产业的蝶变之路|“十四五”答卷

上观新闻 浏览 3266

美职联季后赛东部对阵:迈阿密国际VS纳什维尔,赛制三局两胜

懂球帝 浏览 3734
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1