谷歌首席执行官桑达尔・皮查伊上周四宣布,将负责公司 Gemini AI 助理应用程序的团队转移到其 DeepMind 研究实验室,继续整合公司在人工智能领域工作的各个团队。长期以来,谷歌在全球范围内占据搜索引擎的主导地位,但过去两年里,其在推出生成式 AI 工具和服务方面的表现被认为落后于微软、OpenAI 等初创公司。
近日,来自谷歌和德国柏林工业大学的一组人工智能研究人员公布了史上最大视觉语言模型 PaLM-E(全称 Pathways Language Model with Embodied)。作为一种多模态具身视觉语言模型 (VLM),PaLM-E 能将视觉和语言集成到机器人控制中。谷歌和柏林工业大学称,PaLM-E 是迄今为止人类开发的最大规模 VLM,其可以在不需要再训练的情况下执行各种任务。此外,通过