关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者893人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

李开复筹组新公司定名零一万物:数十名核心成员到位

雷递 浏览 15769

NBA战报:尼克斯134-98狂胜篮网取NBA4连胜,唐斯28+12+2

懂球帝 浏览 620

Temu、Shein合规压力变大

晚点LatePost 浏览 10946

德甲欧战,还是只能靠拜仁、多特撑着

体坛周报 浏览 803

两冠的斯波拿了8年1.2亿,四冠的科尔该拿多少?

OnFire 浏览 12650

NBA战报:勇士主场105-141惨败鹈鹕,库里仅15分

懂球帝 浏览 12859

最新流行烫发 短中长全都有!

镜子发型 浏览 15135

又一个!郭源元自曝在范范孕期遭到陈建州性骚扰

网易娱乐 浏览 15800

岚图冲刺港股0融资:车型“偏科”,年销目标前9月完成48.5%

尺度商业 浏览 1005

贝克汉姆当街熊抱12岁女儿 小七瘦身后越发漂亮了

译言 浏览 12837

覆盖超2400公里 蔚来打通青藏充换电线路

网易汽车 浏览 20767

特朗普突然"通知"中国:带3样东西来谈 否则后果自负

博览历史 浏览 9678

E句话| 他也宣布退圈了?

仙女事件簿 浏览 988

苹果的大屏可折叠 iPad 可能因开发问题而延期到 2029 年

威锋网 浏览 878

中国第一代超模回归了 状态太好!

一条 浏览 16915

宏胜集团法定代表人变更,郑群娣接棒祝丽丹

21世纪经济报道 浏览 665

全国最年轻公安厅长 不再担任省发改委党组书记

上观新闻 浏览 93691

不退役!记者:克罗斯计划与皇马续约一年

直播吧 浏览 18863

一场跨亚欧大陆的国际科技合作,为何在成都这个实验室展开?丨成都有客来

红星新闻 浏览 10834

体图:格纳布里愿意接受较低薪资,拜仁可能和他续约两年

懂球帝 浏览 828

5天破3亿!“屌丝”大鹏,不愿学沈腾

金错刀 浏览 12686
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1