课程价格 :
¥100.01
剩余名额
82
000000000000000000000000000
- 第1章: 测试章
- 1:测试任务
- 2:测试测试
- 3:测试2
实践项目介绍
项目1:R2R任务
R2R(Room-to-Room)是首个大规模视觉语言导航数据集,基于Matterport3D室内扫描场景,提供自然语言指令与实际路径对齐标注,涵盖多样化建筑布局与复杂空间关系,用于训练和评估智能体在真实三维室内环境中根据语言指令完成导航任务的能力,是VLN研究的重要基准。
基于真实Matterport3D室内场景构建
提供自然语言指令与离散导航路径对齐标注
场景多样,适合VLN基线模型训练与评测

项目2:VLN-CE任务
VLN-CE(Vision-Language Navigation in Continuous
Environments)将R2R扩展至连续动作空间,提供真实感物理碰撞与运动约束。基于Matterport3D和Habitat平台,支持物理可行的连续运动与传感输入模拟。相比离散环境,它更贴近现实机器人导航,强调感知、避障与路径规划的综合能力评估。
扩展R2R至连续动作空间,更贴近真实机器人导航
使用高精度3D网格并考虑物理可行性
强调感知、避障与路径规划的综合能力

项目3:REVERIE任务
REVERIE(Remote Embodied Visual Referring Expression in Real Indoor
Environments)将视觉导航与物体定位结合,要求智能体在复杂室内场景中根据远程描述找到特定目标物品。数据基于Matterport3D,包含丰富的自然语言指令与目标物体标注,任务难度高,需要结合全局导航规划与局部视觉识别。
将视觉导航与精细物体定位任务结合
提供自然语言远程描述与物体标注
评估智能体的全局路径规划与局部识别能力

项目4:AerialVLN任务
AerialVLN是首个低空无人机视觉语言导航数据集,涵盖多样城市与自然场景,结合航拍视觉特征与自然语言导航指令,强调三维空间理解与飞行路径规划能力。任务场景中存在地标识别、飞行高度控制和避障需求,推动了具身智能体在空中环境中的多模态导航研究。
首个低空无人机视觉语言导航数据集
结合航拍视觉与自然语言指令
涵盖高度控制、避障与三维空间理解任务

1111111111111111111111111111111