谷歌推出Omni Flash模型，助力Flow实现AI视频头像与多模态创作

谷歌在加州山景城举办的2025年I/O开发者大会上发布了Omni Flash模型，用于提升其AI创作工具Flow的视频生成能力，改善细节和人物一致性，并支持多模态内容创作。 ^[1]

Flow是谷歌实验室于去年推出的人工智能创意工具，允许用户生成和二次创作AI视频及图像。 ^{[1, 2]}新模型能从多种输入生成视频，包括视频素材，借助先进的推理和媒体生成技术提高作品质量。 ^[2]

用户可通过扫描自己的面部生成数字头像，借此在AI视频中插入自己的数字克隆。谷歌产品管理副总裁Elias Roman表示，“这是为想把自己带入内容创作但又不想拍摄真人视频的创作者设计的。” ^[1]

此外，Flow新增了基于Gemini的协作型AI助手Flow Agent，协助用户进行脑暴、脚本创作、编辑和工作流程自动化。 ^[2]

2026年初谷歌推出Flow Music，利用Lyria 3 Pro音乐模型帮助艺术家创作和剪辑高质量歌曲。今年6月，Omni Flash功能扩展至Flow Music，能够生成由对话提示控制的AI音乐视频。 ^[2]

Flow与Flow Music均推出移动应用，Flow Android版测试版已向18岁以上用户开放，iOS版本计划尽快发布；Flow Music iOS已上线，Android版本即将推出。 ^[2]

谷歌Flow目前覆盖超过140个国家和地区，持续推动AI创意工具的大众化应用。 ^[2]

相关图片