谷歌于2026年5月19日在Google I/O大会上发布了新一代AI模型Gemini 3.5 Flash,该模型专为智能代理任务和编程优化,已全球上线,包括Gemini应用、谷歌搜索AI模式及开发者平台 [1, 2, 3, 4, 5, 6]。
Gemini 3.5 Flash在多个基准测试中表现优异,Terminal-Bench 2.1得分76.2%,GDPval-AA Elo评分1656,MCP Atlas得分83.6%,CharXiv推理得分84.2%,均超越之前旗舰模型Gemini 3.1 Pro [1, 2, 5, 6]。谷歌技术总监Koray Kavukcuoglu称,“3.5 Flash在质量和低延迟方面表现极佳,几乎所有基准测试均优于3.1 Pro” [2]。
该模型的输出速率达到每秒约280个词元,速度是同类前沿模型的4倍,支持高效长流程自主任务执行 [1, 7, 2, 3, 5, 6]。谷歌高级产品总监Tulsee Doshi表示,用户反馈正助力模型后期训练,增强了代码和工具使用性能 [7]。
此外,Gemini 3.5 Flash的运行成本不到同类模型的一半,有时甚至三分之一,显著降低企业使用门槛 [1, 3, 5]。
谷歌新开发的“Antigravity”多智能体协作平台针对Gemini 3.5 Flash进行了优化,支持协同多代理工作流及编程流水线 [1, 2, 5, 6]。该模型还支撑了基于Google Cloud的个人AI代理Gemini Spark,实现持续运行,无需用户硬件 [8, 9]。
Google CEO Sundar Pichai强调,Gemini 3.5 Flash是将“前沿智能与行动结合”的系列模型的开端,回应了实用性需求 [3, 5]。他预计更强大的Gemini 3.5 Pro将在内部测试后,于2026年6月对外发布,并称“知道大家急于体验,给我们直到下个月” [10, 11]。
同日,谷歌还推出多模态视频生成与编辑模型Gemini Omni Flash,向Google AI Plus、Pro及Ultra订阅用户及YouTube内容创作者开放 [3, 5]。
预计Gemini 3.5 Pro将进一步提升AI在复杂编码任务上的表现,完善用户反馈反馈驱动的能力,能否再度提升性能备受关注 [10, 11]。