爆点资讯

这项由牛津大学视觉几何组(VGG)团队开展的研究发表于2025年1月，论文编号为arXiv:2601.09499v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

想象一下，当你在看一段视频时，你的大脑能够同时理解画面中物体的三维形状、它们的运动轨迹，以及摄像机的移动。现在，牛津大学的研究人员成功让计算机也具备了这种"立体视觉"能力。他们开发的V-DPM系统能够从一段普通视频中同时重建出场景的3D结构、物体的运动轨迹，甚至摄像机的参数——这就像给机器装上了一双能够"看透"视频背后三维世界的眼睛。

这项技术的突破性在于，它是首个能够在单次处理中完成所有这些任务的系统。以往的方法要么只能处理静态场景，要么需要多个步骤才能分别处理形状和运动。而V-DPM就像一位全能的"视频分析师"，能够一眼看出视频中的所有三维信息。更令人惊叹的是，研究团队巧妙地利用了在静态场景上训练的现有模型VGGT，通过相对少量的动态数据微调，就让它学会了处理复杂的动态场景——这就像让一位擅长画静物的画家，通过少量练习就学会了画动态人像。

这项研究解决了计算机视觉领域一个长期存在的挑战：如何让机器同

牛津VGG团队突破：单一网络实现视频动态3D重建

郑智化发声道...

33岁的张一...

星华新材再落...

布云朝克特遭...

宁德时代与易...

全运会女足综...

从北京到平壤的火车线路被指将于周四开通外交部回应

华硕灵耀14双屏2026来袭：酷睿Ultra X9加持，移动办公集大成者

奥迪A6L e-tron四驱版公布双电机爆发405 kW

一笑随歌李沁陈哲远短短37秒吻戏床戏都上尺度了

沈建光：从国庆长假看消费前景

西安市委书记方红卫任上落马 7月刚表态韩松被查

莱巴透露战斯瓦泰克的两大关键，丝袜称气温还这么高会手足无措

哪些措施能有效阻止美国充当＂世界治安官＂外交部回应

Qwen登顶AI赚钱大赛只是开始？“弃GPT投Qwen”已在硅谷蔓延开来

张馨予晒妈妈织的围巾！被称呼为宝宝好幸福

男子夜钓被误认为是猎物头部遭枪击 20余天仍昏迷不醒

美媒：特朗普声称美将＂统治＂委其真实意图逐渐明朗

马杜罗不认罪称＂被绑架＂＂仍是总统＂外交部回应

台湾艺人修杰楷、陈柏霖涉嫌逃避兵役被台检拘提问话

76岁著名演员许绍雄被指病危多位圈中好友已赶到医院

多给2分钟来背锅？大帝25分钟20+6丢绝杀马克西才该为失利担责

抢占日本本土K-car市场比亚迪Racco亮相

印度发射该国迄今最重军用卫星用于提升印海军远洋作战能力

动力新提升全新方程豹钛3将于上半年上市

中国女导演在柬坠亡监控显示其随一法国籍男子进门

保壳悬了？*ST赛隆预计2025年营收猛增，审计机构却上任不足半月“闪辞”

非足联官方：强烈谴责决赛期间不当行为，目前正审查相关画面

华尔街主流投行也要参与！高盛CEO称正在探索预测市场机会

本田宣布将终止与通用汽车合资公司的燃料电池生产