关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者884人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

媒体:马克龙因"法国18年来最严重骚乱"面临严峻危机

上观新闻 浏览 93871

杉杉集团重整突生变数,“民营船王”695亿资本局悬了?

野马财经 浏览 690

氢能汽车的十字路口:巨头的撤退与坚守

车质网 浏览 508

北极恐将夏季无冰,更多的城市将被海水淹没

趣看热点 浏览 25630

产品力全面提升 问界M7新老款车型对比

车质网 浏览 834

指挥官紧急送肉 台军慌忙平息“马祖缺肉风波”

环球网资讯 浏览 18868

四足机器人首次同时「思考+走路」,北大提出链式推理MobileVLA-R1

新智元 浏览 179

赛更达冲乙 朱骏开出400万奖金

体坛周报 浏览 1016

贝克汉姆家闹出大瓜!豪门大戏再添新章

观察鉴娱 浏览 1431

这新片牛,比《沙丘2》更高级

独立鱼 浏览 12012

俄媒:美国社会撕裂程度接近美国内战时期

环球网资讯 浏览 12861

飞天茅台批价首次跌破1700元,机构称“白酒需求仍在磨底阶段”

YOUNG财经 浏览 746

颧骨突出就会显老显凶?做到这2点就能高级有气质

小陈聊搭配 浏览 15115

OrangePi 6 Plus 开发板公布:12 核 CPU,双 M.2 SSD 双 5GbE

IT之家 浏览 968

媒体:巴以冲突外溢 美国乱了阵脚

直新闻 浏览 74619

六大行集体下调存款利率 100万存5年利息少7500元

时代财经 浏览 16678

为朝廷鞠躬尽瘁,绝对中兴之臣,死后却险遭皇帝鞭尸,原因很简单

趣看热点 浏览 26279

首个有期徒刑正式宣判,恒大、中植“关键人”一个都跑不了!

深蓝财经 浏览 629

李靓蕾律师分享离婚官司内幕:称赞女方内心强大

素素娱乐 浏览 16665

2024年了,最好看的还是这件毛衣!

LinkFashion 浏览 13424

NBA官方最新MVP榜:约基奇连续9周第一剑指3连庄 字母哥次席

醉卧浮生的体育世界 浏览 19339
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1