关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4413人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

商务部回应审查Meta收购Manus:须符合中国法律法规

财联社 浏览 13336

以色列和哈马斯代表团将于5日在埃及举行间接会晤

国际在线 浏览 3782

今年冬天最火搭配:毛衣+毛衣,放松穿更好看!

LinkFashion 浏览 2540

高市早苗称想去参拜靖国神社 专家:欲获反华势力支持

环球网资讯 浏览 33781

“这个风格”今年冬天又火了!谁穿谁高级

LinkFashion 浏览 2532

新加坡主权基金起诉蔚来,股价迎中、美、新“三国杀”!

野马财经 浏览 3690

同济发布全球首部《工程智能白皮书》,发起“国际工程智能联盟”全球倡议

上观新闻 浏览 2966

投资铜条1公斤280元 网友再也不敢叫"破铜烂铁"了

北京商报 浏览 7109

俄称乌企图袭击普京官邸

界面新闻 浏览 2754

美军:不会容忍伊朗在军演中的“不安全行为”

新华社 浏览 2430

特斯拉三季度净利同比暴跌4成!马斯克透露五大关键进展,为天价薪酬拉票

车东西 浏览 3609

报告称机械硬盘价格触底反弹,平静2年后将迎新一轮涨价潮

IT之家 浏览 2994

曝古二家人被骚扰!90多岁外婆被人找上门,难怪放录音重锤王家卫

萌神木木 浏览 3519

联合国官员:加沙惨状如末日电影

上观新闻 浏览 2889

史上最牛妖股!149个涨停板,暴涨55000%......

中国基金报 浏览 2812

农夫山泉的冰杯,比哈尔滨冰雪大世界的冰还赚钱?

BT财经 浏览 2681

53岁蔡少芬累到虚脱 15岁就开始为母还债 好辛苦

疯说时尚 浏览 3243

跨年档票房惨淡!5部新片全部倒挂,《寻秦记》情怀满满却难回本

萌神木木 浏览 2858

皇马官方:卡瓦哈尔比目鱼肌受伤

体坛周报 浏览 4200

解码东道主意大利的冲金版图 丰塔纳的最后一舞

体坛周报 浏览 2349

特朗普拿中俄当幌子被北欧官员拆穿:完全不属实

上观新闻 浏览 2733
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1