谷歌对人工智能的关注成为 I/O 2023 大会的焦点,推出了 PaLM 2 学习语言模型以及对 Bard、搜索、地图、工作区和其他产品的基于人工智能的改进。 周二,这家搜索巨头展示了其许多核心产品的新功能,所有这些产品都是为了利用不断增长的人工智能趋势而设计的。
PaLM 2 大语言模型
推动新产品和改进产品的将是 PaLM 2(Pathways 语言模型的缩写),这是一种新的大型语言模型,旨在成为 Google 最先进的人工智能平台。 PaLM 2 专为处理各种任务而设计,将成为 25 种不同 Google 产品和服务开发背后的人工智能引擎。 尽管谷歌没有透露有关 PaLM 2 的更多细节,但该公司确实吹嘘该模型可以处理 100 多种语言,并具有在它们之间进行翻译的能力。
PaLM 2 LLM 已接受医疗领域 Google Cloud 客户的测试,其分支 Med-PaLM 2 将回答医生和其他医疗保健专业人员的问题。 除了在医学领域部署 PaLM 2 之外,谷歌还宣传了 LLM 将如何在安全、数学、计算机编码等领域使用。 举个例子,人工智能将能够为照片和其他文件提供水印,作为区分真假的一种方式。
Bard AI 的改进
谷歌的 Bard AI 于今年 2 月推出,旨在作为 OpenAI 的 ChatGPT 和微软的 Bing AI 的替代品和竞争对手。 但巴德受到的评价褒贬不一,因为与竞争对手相比,它似乎动力不足且发展不足。 现在,谷歌正在将巴德重新定位为更聪明、更有能力。
首先,Google 取消了 Bard 候补名单,并将该服务从仅限美国和英国的早期采用者扩展到 180 多个国家和地区的所有人。 除了仅支持英语之外,Bard 现在还提供日语和韩语版本,并计划总共处理 40 种语言。
其次,Bard 现在将由 PaLM 2 提供支持,此举将帮助其解决一系列任务,特别是在数学、推理和编程领域。 谷歌表示,Bard 将能够生成和调试 20 多种不同编程语言的代码。 此外,人工智能可以通过解释如何以及为何使用生成的代码来帮助用户理解生成的代码。 作为 I/O 2023 上展示的一个示例,Google 演示了 Bard 如何使用 Python 语言对特定的国际象棋动作进行编程。
谷歌还解释了巴德如何与谷歌和第三方的其他工具和服务联系起来。 用户可以要求巴德创建电子邮件或文档,然后将内容直接导出到 Gmail 或 Google Docs。 巴德还将与谷歌镜头合作,因为用户可以将图像上传到人工智能进行分析,然后要求它提供标题或其他内容。
巴德还将通过在其响应中显示图像、表格和其他类型的格式来采用更加视觉化的风格。 用户可以要求巴德精确定位回复中引用的特定地点或地标,人工智能将通过谷歌地图向他们显示其位置。 如果作为响应的一部分创建表格,用户可以将该表格移动到 Google Sheets 等程序中,并保留其格式。
此外,巴德将能够通过支持的扩展与第三方产品、应用程序和服务进行通信。 作为一个示例,Bard 可以使用 Adobe Firefly 图像生成器创建图像。
Google 搜索的增强功能
谷歌的核心搜索页面也将受益于PaLM 2提供的人工智能增强功能。新的搜索页面将把基于人工智能的信息与通常的结果集成起来。 为了帮助用户关注关键细节,搜索将在单个快照中总结其发现结果。 该快照将包含用户可以跟踪以深入了解更多详细信息的指针和链接。
谷歌表示,新的搜索也旨在提高效率。 用户可以输入更复杂、更详细的查询,而不是试图弄清楚如何表达搜索查询或将其分解为几个不同的问题。 然后,谷歌搜索将能够更好地为他们解析它,并立即提供更准确的结果。
在某些情况下,搜索会提示用户提出后续问题或显示他们可能会问的潜在问题。 选择一个问题将使他们进入对话模式,他们将能够与搜索工具聊天以继续缩小他们需要的信息范围。
Google Workspace 的增强功能
Google Workspace 是另一款通过 PaLM 2 注入人工智能的产品。Gmail 和 Google Apps 中提供了一项名为 Help Me Write 的新功能,可根据请求和说明自动创建电子邮件和其他内容。 该选项将于 6 月份向早期测试人员提供,然后将在今年晚些时候向商业用户推出,作为名为 Duet AI for Workspace 的新 AI 功能的一部分。
Sidekick 是一款旨在帮助人们更好地使用人工智能的工具。 使用人工智能时,编写正确的请求或提示可能具有挑战性。 正确类型的提示可以对响应产生很大的影响。 为了在这方面提供帮助,Sidekick 将分析和总结文档,然后建议用户可能想要发送的提示以改进内容。 作为 I/O 2023 上展示的一个示例,Sidekick 建议在 Google 幻灯片中的演示文稿中添加演讲者备注。
地图和照片的改进
随着地图提供世界各地的方向和信息,它也将从人工智能中受益。 地图正在采用一种名为“沉浸式路线视图”的新选项。 如果用户正在规划步行、驾车或骑自行车的路线,沉浸式视图将直观地显示从起点到终点的路线,甚至提供沿途的天气和交通预测。 该选项将于夏季推出,并为包括纽约和旧金山在内的几个主要城市提供支持。
Google Photos 是另一款通过名为 Magic Editor 的工具使用 AI 进行增强的产品。 Magic Editor 扩展了当前可以擦除照片中项目的 Magic Eraser 工具,更进一步。 它不仅会擦除照片中的人和物体,而且实际上会移动照片中的人和物体。 如果用户将照片边缘附近的物体移动到靠近中心的位置,Magic Editor 将使用 AI 来填充缺失的区域。
AI 还将在 I/O 2023 上推出的其他产品中发挥作用,包括新款 Pixel 7a、Pixel Fold 和 Pixel Tablet。 为了个性化设备,用户可以根据发送给人工智能的提示创建自己的壁纸。
如何以及在哪里访问新功能
那么人们如何利用谷歌基于人工智能的新产品和服务呢? 尽管其中大多数要在几个月内才能正式推出,但任何想要先睹为快的人都可以通过 Google 实验室进行尝试。 通过注册成为 Labs 的早期测试者,用户可以查看新的搜索和新的 Google Workspace 以及其他两个工具:一个名为 Project Tailwind 的基于人工智能的笔记记录器和一个名为 MusicLM 的将文本转换为音乐的工具。