关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4415人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

马卡:皇马目前没考虑施洛特贝克,弗里克很欣赏他但转会不易

懂球帝 浏览 2651

美防长:已做好战争准备 谁开第一枪就见不到明天太阳

军机Talk 浏览 8522

中秋看热巴的嫦娥装,又双叒叕被撩到了

时尚COSMO 浏览 3033

飞檐走壁"猴哥"闯进小区多日 居民开启直播播报其行踪

极目新闻 浏览 8242

斯坦福大学团队推出「许可证神谕」:让AI学会说「我不知道」

科技行者 浏览 2597

特朗普公开对伊开战真正原因

极目新闻 浏览 747

新中式,才是属于我们的时尚与生活

LinkFashion 浏览 3069

397场,凯尔-沃克追平英超历史边后卫首发次数纪录

懂球帝 浏览 3613

蚂蚁集团突破性研究:一个视觉"万能钥匙"让AI同时理解和创造图像

科技行者 浏览 3444

比亚迪元PLUS迎来史诗级升级,续航或超650km!

刘哥谈体育 浏览 3500

以色列攻入加沙城 多国寻求将其逐出联合国

看看新闻Knews 浏览 4465

共谋细胞与基因治疗产业创新发展!珠海举行前沿技术交流会

南方都市报 浏览 4372

台媒:解放军演习戳破“美日救台”迷梦

参考消息 浏览 17181

2026年开年看什么?这些新剧已经帮你挑好了

桃桃淘电影 浏览 2702

定位大型SUV 腾势N8L将于10月28日上市

车质网 浏览 3541

ESPN:因内马尔的身体状况和高额薪资,桑托斯不急于和他续约

懂球帝 浏览 3758

冬天从60分穿到80分,只需要这个实用单品

黎贝卡的异想世界 浏览 3178

业主反映多户顶楼业主违规加盖房屋 持续多年无法拆除

红星新闻 浏览 7463

豪掷近5000万买豪宅,曾被马云看重的男人身家68亿

雷达财经 浏览 3531

国家外汇管理局副局长刘斌:研究长期限、多品种、小币种等外汇市场发展问题|2025外滩年会

国际金融报 浏览 3645

高市早苗斗不过中国邀6国反华 马克龙拆台打退堂鼓

基斯默默 浏览 12894
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1