UnrealZoo

Paper:UnrealZoo: Enriching Photo-realistic Virtual Worlds for Embodied AI,ICCV 2025

image.png

当前具身智能智能体大多被局限在简单的室内环境,难以适应复杂的、非结构化的世界。

具体瓶颈有三:

  • 环境多样性不足。
  • 形态单一。缺乏不同形态(人、动物、四足机器人、无人机)的交互支持。
  • 性能瓶颈。

论文提出了 UnrealZoo,包含100个照片级真实感的3D场景,涵盖了从室内到超大规模室外的多种环境。分为四个尺度:室内(Indoor)、建筑(Building)、社区(Community)和景观(Landscape)四个级别。

另外系统提供了7类67种可以操作的实体,包括19种人类角色,27种动物,14种四足机器人以及无人机车辆等。

为了解决训练效率问题,作者对传统的 UnrealCV 进行了重构,明明为 UnrealCV+。

论文设计了两个任务来评估智能体。第一个是视觉导航任务。

其中前一项代表比上一时刻更近了就给正向奖励,使用tanh是为了让奖励更加平滑。后一项是如果面朝的方向偏离了目标方向,就扣分。

第二个是主动视觉跟踪,要求智能体保持在目标人物前方2.5米处。奖励函数为:

目标是让当前位置 逼近理想位置 是距离,是偏角。


UnrealZoo
https://d4wnnn.github.io/2026/04/20/Notion/UnrealZoo/
作者
D4wn
发布于
2026年4月20日
许可协议