通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  上校

注册:2007-10-2919
跳转到指定楼层
1#
发表于 2025-12-8 15:59:02 |只看该作者 |倒序浏览

平时一看机器人比赛,就说遥操,遥操。今儿个,鼓励“自力更生的”,来了!

就在上周末刚刚收官的ATEC2025线下挑战赛,主办方不仅鼓励机器人自主完成任务,还首次在无遥操的情况下,把机器人从实验室拉到户外遛了一圈。



拱桥、山地、缓坡、吊桥、操场,全靠AI自主闯关,而且还是one-shot。

对于这次比赛的难度,作为“出题人”的主办方可谓相当自信,比赛还未开打,就提前透露:
这可能会是一场翻车无数的比赛!
只不过,有看头的比赛从来不缺反转。

原以为是主办方预判的翻车局,选手们却一个比一个能整活,奇招不断,狠狠破局。

经过两天的激烈较量,前三赛队新鲜出炉:浙江大学Wongtsai摘得桂冠,上海交通大学IRMV和北京理工大学CyberPrime团队紧随其后,分获亚军、季军。(均为机器狗方案)





更离谱的是——浙大团队在夺冠后还“凡尔赛”地说,他们其实准备了更难的预案。

所以,这究竟是一场怎样的“机器人大赛”?

赛前预警翻车?选手:不存在的

这次第五届ATEC科技精英赛线下赛由香港中文大学主办、ATEC前沿科技探索社区、北京大学、北京师范大学、蚂蚁集团联合承办,于12月6-7日周末两天,在港中文岭南体育场与 “小桥流水” 生态区正式打响。

本次赛事的专家评审阵容包括刘云辉谢立华Masayoshi Tomizuka等多位国际知名机器人学者。

线下赛共设置:垃圾分拣自主浇花定向越野吊桥穿越四个真实世界挑战,将基础操作到跨地形移动一网打尽:

垃圾分拣:机器人从初始位置出发(下同),识别香蕉皮、透明塑料瓶和纸盒、抓取、移动、放入对应颜色的垃圾桶。这一任务旨在考察机器人视觉感知、目标识别、移动操作与长程任务的能力。



自主浇花:完成拿水壶、接水、找到花篮、浇花和把水壶放回原处等一系列操作,这对机器人的空间定位、稳定抓取和精细操作都是考验。



定向越野:自主穿越拱桥、山地、陡峭楼梯等复杂户外路线,这里的重点是全局规划、地形理解与长程稳定行走。



吊桥穿越:穿过三段间距不等的吊桥,并在第三段拉绳搭桥,使中断处可通过,这一任务旨在考察机器人在不同路面行走的鲁棒性以及工具使用能力。



总体而言,比赛规则强调鼓励自主、限制干预:遥操作越少,自主完成越多,得分就越高。

针对这一规则,选手在实际比赛中普遍采取了先遥操保底、再自主冲高分的策略,而在具体的项目上,则更是临场发挥,奇招尽出。

比如,为了挺过吊桥,选手们纷纷给机器人安上了“大脚板”和“雪橇”,以防机器人的足部卡在缝隙中。



而上交的IRMV赛队甚至干脆略过拉绳搭桥的环节,让机器狗跳过50cm的空隙。



浇花任务也称得上是百花齐放:横握、倒抓、夹持、撑开……各种“拿壶姿势”,一看一个不吱声。



在垃圾分拣任务中,冠亚军队伍Wongtsai和IRMV表现出了极强的统治力,各自的机器狗完全依靠自主模块通关,稳稳拿下无遥操的额外加分。



户外越野方面,Wongtsai则继续领先,成为比赛中第一个全自主跑完越野赛题的四足机器人队伍。



最终,Wongtsai凭借在机器人全自主智能方面的卓越表现,摘得15万美元冠军大奖。

不是黑历史,而是具身智能的来时路

除了选手们的精彩临场发挥,作为全球首个聚焦实景极端环境的人工智能与机器人赛事,比赛内容也着实暴露了不少在实验室环境中不易看到的问题,主要集中在以下四个层面:

本体——人形VS四足差距明显

如果按“一场论”来说:四足机器人(机器狗)在所有任务的表现均明显优于双足(人形)



在人形机器人“失手”最多的定向越野项目中,解说员表示:人形机器人重心高、触点少,在复杂地形明显吃亏,上坡、陡梯、碎石路都显得十分吃力。

而在浇花、垃圾分拣这类需要稳定抓取和精细操作的项目里,人形机器人同样表现不佳——

结构复杂、控制链条长,一旦定位不准或手部调节稍有偏差,就难以完成有效抓取。即便有遥操作辅助,也依然容易失手。



相比之下,四足机器人则稳得多,既能在浇花、分拣等任务中用背部夹爪完成任务,又在户外越野和吊桥穿越中展现出了统治级的表现。



最令人惊喜的是,Wongtsai和CyberPrime的机器狗甚至实现了全自主的垃圾分拣任务。

此外,在比赛中,并非所有队伍的“临时改装”都带来了正向效果。上面提到的“物理外挂”还引发了软硬件协同的co-design问题。

例如,一些队伍为了提升稳定性临时把脚板加宽,反而导致了机器人的感知与步态控制失衡,从而卡脚摔倒。



感知——室外带来的非线性难度跃升

这次全户外的环境也给机器人的感知能力带来了不小的挑战:来自光照、风、阴影等细微环境变化的扰动会不断累积成误差,成为影响任务成功率的关键变量。

在垃圾分拣任务中,透明的塑料瓶在室外由于反光以及背景等因素,导致机器人经常识别失败。



而在户外越野任务中,树荫下的局部强/弱光交替则增加了机器人感知外界环境的难度。

甚至一点“风吹草动”,也会影响物体的位置,进而改变可抓取姿态,迫使affordance估计必须实时更新。

在比赛中,上一秒香蕉皮的位置还很准确,但当机器人准备下爪抓取时,一阵风吹来,香蕉皮被吹偏,感知瞬间被打乱。



此外,相比于室内,在信号弱的野外,机器人更依赖自身IMU(惯性测量单元)、激光雷达与本地推理能力,难度再上台阶。

规划——能做动作,却不知道下一步怎么接

在规划层面,赛场上暴露出的一个普遍现象是:机器人即便能完成单个动作,也常常出现“拿起香蕉后不知道接下来做什么”的现象。

在吊桥任务中,尽管多数队伍能在遥控的辅助下通过不连续的木板,但几乎没有队伍能在无辅助的情况下“把绳子拉下、把木板当桥板用”,这暴露出当前机器人在多步骤关联推理环境改造能力上的明显短板。



操作——上半身与下半身的解耦

在这次比赛中,与长程任务同等重要的,还有对loco-manipulation(移动操作)的考验。

这要求机器人在移动过程中精准完成定位与姿态调整,以实现抓取或其他精细操作。

在比赛中,常见的失败模式包括:

机器人无法精确停到抓取位,导致执行器无法接触目标。

在抓取或搬运时出现力控/稳定性失衡(抓取位置不当,物体脱落),无法完成后续动作。

对于这一现象,我们在赛后采访中得知,多数队伍采用的是上半身操作与下半身移动解耦的架构。

也就是说,机器人缺少一套统一的全身运动与操作控制框架。

结果在赛场上常见的场景是:下半身可以自主行走,但机械臂与夹爪还得靠人工遥控完成关键操作

这一现象并非偶然。

当前许多前沿VLA型模型(如 RT-2、OpenVLA、RDT、Pi0.5)主要聚焦上半身操作能力——解决“手如何推断、如何执行”的问题,但对“移动-操作”的端到端整合的支持仍十分有限。

从这个角度看,未来真正值得期待的突破,可能来自能同时统一移动与操作、实现全身自主控制的端到端机器人模型。

这或许将成为下一代具身智能的重要方向,也将决定机器人能否真正走向复杂的真实世界。

真实世界,才是最终考场

总的来说,这次比赛不仅是一片检验机器人真实能力的练兵场,也像是给未来机器人测评体系递来的一张草图。

现有的具身智能benchmark,无论是偏仿真的ManiSkill,还是偏室内流程的RoboChallenge更像是切片式测评,只能看到机器人的某一面。

而像ATEC这样的真实世界挑战,则给行业提供了另一种可能:既更接近机器人最终要面对的场景,也更有机会推动我们重新思考“能力”以及“如何衡量能力”这两个根本问题。

或许几年后回头看,这场比赛的意义不会只在于谁走上了坡、谁没踩稳拱桥,而在于它让整个行业看到:机器人离“走进世界”还有多远,又应该往哪个方向继续补课。

正如赛事专家委员会主席、香港工程院院士刘云辉教授所说:
我们希望通过极限挑战,推动机器人从演示可行,走向应用可靠。
作为赛事发起单位之一,蚂蚁集团技术战略部负责人表示,蚂蚁集团长期支持ATEC赛事,源于一个信念:
AGI技术发展的未来,是实现机器智能与物理世界的深度融合,让机器人面对真实世界的扰动。因此,ATEC设计的每一道题,都不是为了让它“完成得好看”,而是为了让它在碰撞中暴露真正的弱点。因为如果问题不是真实的,就不会牵引出真实的技术进步。只有“真问题”,才能让行业知道下一步要突破什么。
换句话说,实验室里永远不会出现的光照、气流、遮挡,踩空与翻车恰恰是让机器人迈向可用、可信的真正门槛。


来源:36kr

举报本楼

本帖有 6 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2025-12-8 19:35 , Processed in 0.226882 second(s), 17 queries , Gzip On.

Copyright © 1999-2025 C114 All Rights Reserved

Discuz Licensed

回顶部