UnrealZoo
Paper:UnrealZoo: Enriching Photo-realistic Virtual Worlds for Embodied AI,ICCV 2025
当前具身智能智能体大多被局限在简单的室内环境,难以适应复杂的、非结构化的世界。
具体瓶颈有三:
- 环境多样性不足。
- 形态单一。缺乏不同形态(人、动物、四足机器人、无人机)的交互支持。
- 性能瓶颈。
论文提出了 UnrealZoo,包含100个照片级真实感的3D场景,涵盖了从室内到超大规模室外的多种环境。分为四个尺度:室内(Indoor)、建筑(Building)、社区(Community)和景观(Landscape)四个级别。
另外系统提供了7类67种可以操作的实体,包括19种人类角色,27种动物,14种四足机器人以及无人机车辆等。
为了解决训练效率问题,作者对传统的 UnrealCV 进行了重构,明明为 UnrealCV+。
论文设计了两个任务来评估智能体。第一个是视觉导航任务。
其中前一项代表比上一时刻更近了就给正向奖励,使用tanh是为了让奖励更加平滑。后一项是如果面朝的方向偏离了目标方向,就扣分。
第二个是主动视觉跟踪,要求智能体保持在目标人物前方2.5米处。奖励函数为:
目标是让当前位置
UnrealZoo
https://d4wnnn.github.io/2026/04/20/Notion/UnrealZoo/