奥克兰大学 本次发布的数据集 MMS-VPR, MMS-VPR是一个大型多模态数据集,用于复杂、行人专用环境中的街道级位置识别。该数据集包含78,575张注释图像和2,512个视频剪辑,跨越中国成都约70,800平方米的开放式商业区中的207个地点。每张图像都标注有精确的GPS坐标、时间戳和文本元数据,涵盖了不同的光照条件、视角和时间框架。数据集遵循系统和可复制的数据收集协议,降低了可扩展数据集创建的门槛。重要的是,该数据集形成一个固有的空间图,具有125个边缘、81个节点和1个子图,使结构感知位置识别成为可能。我们进一步定义了两个特定于应用程序的子集——Dataset_Edges和Dataset_Points,以支持细粒度和基于图的评估任务。使用传统VPR模型、图神经网络和多模态基线的广泛基准测试表明,利用多模态和结构线索可以获得显着改进。MMS-VPR促进了计算机视觉、地理空间理解和多模态推理交叉领域的未来研究。该数据集可在https://huggingface.co/datasets/Yiwei-Ou/MMS-VPR公开获取。

查看MMS-VPR

Dataset card 内容:

Files and versions 内容:

关于 奥克兰大学 , 奥克兰大学是位于新西兰的一所综合性公立大学,以其卓越的教学和研究在国际上享有盛誉。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。