关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4417人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

39集《沉默的荣耀》大结局前瞻,5人再无反转,黎晴成唯一变数

娱乐圈笔娱君 浏览 3688

中国曾经也有一家“OpenAI”

虎嗅APP 浏览 3240

梅努的哥哥现身老特拉福德,衣服上写着“给科比-梅努自由”

懂球帝 浏览 2842

大众中国市场2025年交付269.38万辆,同比减少8%

IT之家 浏览 2596

鲁媒:洛佩斯需证明自己,否则很可能不在泰山队未来计划中

懂球帝 浏览 3776

图卢兹vs梅斯:雷斯特、西迪贝首发,巴洛-图雷、哈比卜-迪亚洛出战

懂球帝 浏览 3678

方永飞怼雷军,“行业不敢说的话全被他讲透了”

车轱辘话V 浏览 2926

何小鹏“扒皮”验真身 国产人形机器人“摊牌了”

汽势传媒 浏览 3444

王天辰十年蛰伏终获认可 双剧同播展演技高光

老王的视角 浏览 2024

预警!到2100年!韩国或再也种不了苹果

看看新闻Knews 浏览 3736

近11战1胜10负!哈登缺阵快船惨败雷霆 近两战合计净负39分

Emily说个球 浏览 2999

快手UniMixer:推荐系统实现三合一规模化智能优化能力突破

科技行者 浏览 1126

女子代购海外"不老药" 疑遭职业打假人起诉"退一赔十"

大风新闻 浏览 5176

大范围宕机!苹果天气App突发加载异常

环球网资讯 浏览 525

假期4大变量共振 哪些是A股正向催化剂?

财联社 浏览 2066

哈马斯同意“20点计划”提议:释放所有以色列人质

央视新闻客户端 浏览 3866

贾国龙服软了!

数字财经智库 浏览 2566

当奥迪走上“对抗路”,特斯拉开始疲于招架

车市雷达 浏览 3651

联想 ThinkPad P1 2026 AI 元启版 10 月 20 日首销,25999 元起

IT之家 浏览 3806

胡歌现身为电影宣传,现场人山人海全场欢呼,胡歌照顾后辈好暖心

扒虾侃娱 浏览 3402

国台办:对于迫害大陆配偶的"台独"帮凶爪牙决不轻饶

环球网资讯 浏览 16019
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1