关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家1662人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

精兵天降!空降兵某旅开展集群伞降战斗演练

环球网资讯 浏览 18971

杨学增:连续客战使队伍出现一些伤病和疲劳 与浙江实力差距较大

直播吧 浏览 19204

美国国会的监督机构对联邦住房金融管理局局长Pulte展开调查

华尔街见闻官方 浏览 191

波音圣路易斯地区罢工持续近三月,谈判陷入僵局

国际金融报 浏览 806

E句话| 她出来否认丈夫出轨了?

仙女事件簿 浏览 601

香港科技大学发现图片压缩优化AI内存效率

科技行者 浏览 601

外交部回应收复台湾言论,美国人又在骗军费了

趣看热点 浏览 430451

超80部电影定档,2024暑假档成龙沈腾马丽神仙打架,谁能成黑马?

毒舌电影 浏览 10599

苹果首款低价MacBook来了!搭载iPhone处理器 对标入门Windows PC

快科技 浏览 711

袁隆平在农业杂交水稻上很有作为,提高粮食产量解决了温饱问题

趣看热点 浏览 25431

销量持续回暖,谁说燃油车不行了?

汽车公社 浏览 970

维珍银河将于6月下旬开始商业飞行 股价大涨13%

网易科技报道 浏览 18506

浙商银行前三季度经营稳健,总营收489.31亿元

证券市场周刊 浏览 789

微胖夏天怎么穿?这篇太值得借鉴了

LinkFashion 浏览 16000

杨幂出走,没了“印钞机”的嘉行还“行”吗?

雷达财经 浏览 18152

曝王灿兮杜淳分房睡!女方深夜发声否认:谁说的?我咋不知道?

扒虾侃娱 浏览 803

四轮单独控制,现代摩比斯MOBION概念车正式亮相

天天汽车 浏览 12842

售20万元起,2024款极氪X正式上市

天天汽车 浏览 12406

普京主持"秘密会议" 或与乌计划展开报复措施有关

环球网资讯 浏览 14696

国产首艘大型邮轮“爱达·魔都号”完成首航

上证报 浏览 12464

整形医生称泰勒·斯威夫特怀孕了

阿废冷眼观察所 浏览 948
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1