Gemini 2.0简介

December 14, 2024

Gemini 2.0 Flash

Gemini 2.0 Flash 以 1.5 Flash 的成功为基础，这是我们目前最受开发者欢迎的版本，在同样快速的响应时间下具有增强的性能。值得注意的是，2.0 Flash 在关键基准测试中甚至比 1.5 Pro 更快，速度是 1.5 Pro 的两倍。2.0 Flash 还具有新功能。除了支持图像、视频和音频等多模式输入外，2.0 Flash 现在还支持多模式输出，例如与文本混合的原生生成的图像和可操纵的文本转语音 (TTS) 多语言音频。它还可以原生调用 Google 搜索、代码执行以及第三方用户定义函数等工具。

model compare

我们的目标是将我们的模型安全快速地交到人们手中。过去一个月，我们一直在分享 Gemini 2.0 的早期实验版本，并得到了开发人员的积极反馈。

Gemini 2.0 Flash 现已作为实验模型通过Google AI Studio和Vertex AI中的 Gemini API 向开发者提供，所有开发者均可使用多模式输入和文本输出，早期合作伙伴可使用文本转语音和原生图像生成功能。1 月份将全面上市，同时将推出更多模型尺寸。

为了帮助开发人员构建动态和交互式应用程序，我们还发布了新的 Multimodal Live API，它具有实时音频、视频流输入以及使用多个组合工具的能力。有关 2.0 Flash 和 Multimodal Live API 的更多信息，请参阅我们的开发人员博客。

我们的 AI 助手 Gemini 应用程序中提供 Gemini 2.0 此外，从今天开始，全球Gemini用户可以通过在桌面和移动网络上的模型下拉菜单中选择聊天优化版 2.0 Flash 实验版来访问该版本，该版本将很快在 Gemini 移动应用中推出。借助这一新模型，用户可以体验到更加实用的 Gemini 助手。

明年初，我们将把 Gemini 2.0 扩展到更多 Google 产品。

通过 Gemini 2.0 解锁代理体验

Gemini 2.0 Flash 的原生用户界面操作能力，以及其他改进，如多模式推理、长上下文理解、复杂指令跟踪和规划、组合函数调用、原生工具使用和改进的延迟，共同作用以实现新一类的代理体验。

人工智能代理的实际应用是一个充满令人兴奋的可能性的研究领域。我们正在通过一系列原型探索这一新领域，这些原型可以帮助人们完成任务并完成工作。其中包括对 Project Astra 的更新，这是我们的研究原型，旨在探索通用人工智能助手的未来功能；新 Project Mariner，它从浏览器开始探索人机交互的未来；以及 Jules，一个可以帮助开发人员的人工智能代码代理。

我们仍处于开发的早期阶段，但我们很高兴看到值得信赖的测试人员如何使用这些新功能以及我们可以学到什么经验教训，以便我们可以在未来的产品中更广泛地使用它们。

原文：Google Blog