关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4422人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

广东为胡明轩庆生!杜锋高待遇,多人摁头往蛋糕砸,想报复却未果

篮球资讯达人 浏览 1863

爆款刚诞生,德邦基金为何急下“谢客令”?

独角金融 浏览 2629

博洛尼亚-佛罗伦萨,瓦诺利:“这场胜利是为了带来喜悦。将罗科留下的价值观带到场上”

绿茵情报局 浏览 2669

光伏涨幅王涨到“停牌”!国晟科技营收暴跌股价反飙升超500%,跨界固态电池含金量几何?

时代周报 浏览 2630

美联储112年来最富的主席,要改规矩了!

米筐投资 浏览 486

美国国会的监督机构对联邦住房金融管理局局长Pulte展开调查

华尔街见闻官方 浏览 3021

车企不敢!专家:希望推出伤亡率车型榜单,新能源车极端事故不多

小李车评李建红 浏览 3240

9.79万起 2026款比亚迪海狮05压迫感有多强?

网易汽车 浏览 754

斯基拉:前米兰队长卡拉布里亚想回意甲,索要200万欧年薪

懂球帝 浏览 2518

阿联酋:禁止本国公民前往伊朗、黎巴嫩和伊拉克

上观新闻 浏览 307

林心如曝霍建华消费观

科学发掘 浏览 2851

数读“十四五”答卷︱世界第一、全球领先!一组数据看我国科技事业历史性成就

海外网 浏览 4463

首艘美国船被罚之际 特朗普调2艘航母部署中国周边

现代小青青慕慕 浏览 7243

U23国足遭暴击!鲍世蒙8分钟闪退,抢断王出场,媒体人:因祸得福

奥拜尔 浏览 2662

许绍雄葬礼设公祭时段,开放公众致意,曝他去年查出肾脏有肿瘤

扒虾侃娱 浏览 3405

都有哪些业绩稳健的基金?

阿尔法工场 浏览 2931

王欣瑜不敌小白菜生涯首冠继续迟到,中国网球仍成奥克兰最大赢家

网球之家 浏览 2672

《伟大的长征》首发预告,于和伟饰演毛泽东,总觉得差点意思

最爱酷影视 浏览 3739

欧尔班:乌克兰和欧盟认为匈牙利很碍事 企图更迭政府

文汇报 浏览 3679

乌外长公布无人机从匈牙利进入路线 匈外长否认

环球网资讯 浏览 4180

伊朗:战争必须以一种让敌人永远不敢再侵略的方式结束

大象新闻 浏览 118106
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1