谷歌公布Gemini2.5系列模型最新进展 6月初推轻量级Flash版

【太平洋科技快讯】5月21日,谷歌在Google I/O 2025开发者大会上,公布了其Gemini 2.5系列大模型的最新进展。该系列包含两款模型:轻量级的Gemini 2.5 Flash和功能更强大的Gemini 2.5 Pro。据悉,Gemini 2.5 Flash将于6月初正式推出,而Gemini 2.5 Pro则将在后续发布。

Gemini 2.5 Flash模型在几乎所有方面都比其前代产品有所提升。它将支持一项新的文本转语音功能,能够生成更自然的声音,甚至可以模拟耳语效果。此外,Gemini 2.5 Flash还能够在不同的语言之间使用同一种声音进行切换。

谷歌强调,Gemini 2.5 Flash是其迄今为止最安全的模型之一,并且在效率上比上一代提升了22%,同时也更加省电。这款轻量级模型还能够“显示思考过程”,让用户看到它是如何得出答案和处理查询的,从而提供了更多的透明度。

此外,谷歌还将推出功能更强大的Gemini 2.5 Pro。Demis Hassabis表示,这款模型是世界上最智能的AI模型,它能够模拟整个城市,也是学习的领先模型。Gemini 2.5 Pro将迎来一种新的增强推理模式——“Deep Think”,以应对更复杂的任务。但谷歌表示,Gemini 2.5 Pro不会在今天发布。相反,该公司计划在向公众发布之前进行额外的安全测试,以确保模型的稳定性和可靠性。

Gemini 2.5 Flash的一大亮点是其混合推理模式。用户可以根据需要开启或关闭推理能力,并设置“思考预算”来灵活调整推理深度。这种模式允许用户在性能、成本和延迟之间找到平衡点。例如,对于简单任务,可以选择低预算以保持低延迟和低成本;而对于复杂任务,则可以选择高预算以生成更准确、全面的答案。

此外,Gemini 2.5 Flash还具备动态推理资源管理能力,能够根据任务复杂度自动调整资源,实现更高效的计算。在多项基准测试中,例如ME 2025和多模态推理(MMMU),Gemini 2.5 Flash都展现了优异的性能,与OpenAI的o4-mini不相上下。