英国《金融时报》5月18日报道称,中国AI团队在视频生成技术方面已超越美国竞争对手,这一领域是生成式AI应用中增长迅速的关键环节,涵盖广告、电商和娱乐 [1, 2]

中国公司字节跳动、快手、声叔科技和智谱AI等已将生成视频系统商业化,并将其整合进拥有超过5.15亿用户的生态系统,带来巨大收入。2025年,快手旗下Kling AI营收达10.4亿元人民币,年经常性收入接近5亿美元,估值潜力高达200亿美元 [3]

视频生成模型需要大量高质量视频数据训练,中国企业依托其庞大短视频平台和数据优势,在模型表现和产品可用性上领先美国对手。字节跳动推出的Seedance 2.0可生成1080p影院级视频,融合文本、图片、音频和视频输入,已嵌入抖音和TikTok平台 [1, 3, 2]

相比之下,美国OpenAI、谷歌和Anthropic仍在大规模语言模型和代码生成领域占优,但在视频生成工具质量和易用性方面落后。部分专家认为,美国公司受限于更严格的版权法规,限制了其训练数据获取 [1, 2]

谷歌的Veo 3模型因能访问YouTube视频数据保持竞争力,但对开发者内容限制较多。生成视频算力成本远高于文本和音频,普遍部署仍较昂贵。中国产品价格更亲民且自由度高,支持订阅和按需付费,方便个人创作者快速尝试和应用 [1, 2]

Firework首席执行官杨文森表示,过去AI视频“尴尬又生硬”,难达品牌标准,“现在已进展到难以分辨是真人还是AI生成”,大大降低了电商客户的制作成本 [1, 2]

中国AI团队还在软硬件一体化优化,减少对英伟达硬件的依赖。智谱AI的GLM-5模型拥有7440亿参数,是向GPU独立迈出的重要一步 [3]

中国公司将生成模型直接融入高频社交和电商平台,加速变现,助力2026年中国生成式AI工具用户超过5.15亿,行业产值逾5000亿元人民币(约720亿美元) [3]