谷歌近日宣布,开发者现在可以通过Gemini API调用谷歌地图工具,将位置感知功能无缝集成到各类应用程序中。这一举措使得应用开发者能够直接利用谷歌地图庞大的地理数据库,涵盖超过2.5亿个地点信息,为用户提供基于实时数据的精准服务。
在实际应用中,Gemini与谷歌地图的结合已展现出强大潜力。例如,谷歌AI Studio负责人Logan Kilpatrick演示了如何通过语音指令,让AI在芝加哥地区快速推荐排名前三的意大利餐厅。当他补充一家特定餐厅的名称后,AI通过尝试多种拼写方式,成功完成了精准搜索。Logan Kilpatrick评价道:“这种体验非常个性化且直观,真正实现了人与技术的自然交互。”
用户还可以通过该功能实时获取餐厅营业时间、路况等信息。例如,在确定目的地后,AI能立即调取谷歌地图的实时数据,帮助用户规划最优行程。目前,开发者可在谷歌AI Studio体验这一功能,并通过设置面板切换模型、语音模式,甚至自定义系统提示词。例如,提示词可设定为:“你是一个友好的对话式智能体,任务是通过规划下午行程(城市→餐厅→活动)展示‘Google Maps定位’功能。”
这一技术适用于多个场景:准确回答地理位置相关问题、构建对话式旅行规划工具、根据用户偏好推荐地点、为社交或外卖服务打造基于位置的体验。网友对此评价称:“AI刚刚获得了位置感知能力”“将AI融入实时世界模型,是迈向自主系统的第一步”。
事实上,国内企业在此领域也早有布局。以高德地图为例,其推出的“小高老师”智能体能根据用户所处时空,实时提供出行与生活服务方案。例如,用户只需说明“喜欢独处且怕冷”,AI即可结合位置数据,快速生成包含导航、服务调用的完整计划,避免了跨应用操作的繁琐。
无论是谷歌的Gemini API,还是高德的智能体与扫街榜,核心目标均是将AI从“屏幕内”延伸至“现实世界”。传统地图仅提供路线规划,而AI赋能后的地图能理解用户身份、目的地及动机,甚至预测需求。例如,高德的“小高老师”本质是在地图上叠加了一个世界模型,可感知空间动态并预测用户下一步行动。
随着数据量的增长,地图的功能边界将持续扩展。从导航工具到空间智能体,AI正在重构地图的形态——它不再是一个静态的平面工具,而是演变为动态的立体智能空间,连接虚拟与现实。