Niantic新AI模型或由无意中发现的宝可梦Go玩家开发,背后隐藏哪些AI技术秘密?

AR技术与地理空间模型的最新发展

Pokémon GO游戏截图

技术升级:Niantic的地理空间模型(LGM)

2024年11月22日,Niantic公司确认,过去五年来公司一直致力于通过人工智能技术构建大型地理空间模型(Large Geospatial Model,简称LGM)。这一模型采用机器学习算法,旨在“理解场景并将其与全球数百万个场景相连接”。当玩家选择分享自己的AR扫描数据时,这些数据会成为模型训练的重要来源。公司强调,玩家的个人信息“未被出售给任何机构”。

实景扫描技术的应用

Niantic以其著名的《口袋妖怪GO》(Pokémon GO)中的“宝可梦站点扫描功能”,作为其技术的典范。通过这一功能,Niantic能够“生成真实世界物体的精准、动态的三维地图,帮助设备实现实时理解环境”。2024年11月13日,Niantic在一篇博文中还详细介绍了这一实验姓AR功能,特别提到玩家在全球范围内支持大量扫描工作,为公司带来了丰富的空间数据,从而实现创新的AR游戏玩法。

全球化的空间数据积累

公司发言人表示,未来,Niantic将利用已有的小型AI模型,构建一个面向全球的更大规模模型,“为更多玩家提供服务”。

Pokémon GO游戏截图

模型技术的背景与数据来源

Niantic宣布,其LGM模型采用了类似大型语言模型(Large Language Model, LLM)的方法,从全球真实场景中采集数据。公司表示,截止2024年7月15日,全球范围内公司已扫描超过一千万个地点,每周新增约一百万个扫描数据。这些数据主要通过旗下《口袋妖怪GO》和《Ingress》(Ingress)等增强现实(AR)游戏收集,玩家在探索中无意中为模型建设做出了贡献。这些空间数据“以行人视角”为基础,涵盖许多车辆无法触达的区域,从而为模型提供了丰富而细致的地理信息。”

技术优势与潜力

类似于大型语言模型的处理方式,Niantic的空间模型能从现实世界地点提取信息,未来还希望推动“计算机不仅能够感知和理解物理空间,还能以新颖的方式与环境互动”。公司的数据强调“以行人视角采集,包含许多车辆和交通工具难以到达的地区”,使得模型更贴近人们的实际感知场景。

政策与用户权益

根据2024年7月15日更新的政策,Niantic明确表示其利用地理空间技术和玩家录制内容“构建真实世界地点的三维理解”,旨在为用户提供更丰富的AR体验。用户可以选择加入(Opt-in),随时关闭相关功能,且此项技术被视为公司AR战略的重要组成部分。

未来展望:从LLM到LGM的演变

公司在官方博客中指出:“从大型语言模型(LLM)到大型地理空间模型(LGM)是人工智能发展的新阶段。未来的操作系统将融合实体与虚拟空间,为人们创造一个以空间计算为核心的数字世界体系。”

游戏行业对生成式人工智能(GenAI)的探索

大公司如NVIDIA和OpenAI曾在利用AI技术方面引发争议。有报道称,NVIDIA在开发AI工具过程中,曾大量采集YouTube上的受版权保护内容,尽管对此公司声称“完全符合版权相关法律”。

对于生成式AI,尤其是涉及创意内容的技术,侵犯内容创作者权益一直是行业关注的重点。声音演员对自己的声线被未经授权的模组使用表示担忧,部分音频公司也被批评在未经许可的情况下使用演员的表演,以训练AI模型。

创新与风险并存的开发应用

一些游戏开发者利用生成式AI技术,减轻开发负担,解决循环姓难题。这些技术不仅在内容创作方面展现潜力,还被视作未来开发新游戏创意的重要手段。行业领军企业高层普遍认为:AI有望推动游戏创新,为玩家带来全新体验。

企业声明与未来动向

我们已向Niantic公司发出询问,了解其地理空间数据的采集方式及数据使用的透明度。将持续关注并更新最新信息。

常见问题

Q: Niantic的地理空间模型(LGM)是如何构建的?

A: 通过玩家在《宝可梦GO》和《Ingress》等游戏中的空间扫描数据,结合机器学习算法逐步建立起全球的三维地理模型。

Q: 玩家分享的空间数据是否会被出售?

A: Niantic强调,玩家的个人信息未被出售,数据仅用于模型训练和增强现实体验的改进。

Q: 未来这些技术会带来哪些变化?

A: 预计将实现更真实、更沉浸的AR体验,同时推动空间计算和虚实结合的新应用,提升游戏和现实场景融合的程度。

THE END
喜欢就支持一下吧
点赞57 分享