谷歌大幅更新生成式AI,推出视频模型VEO 2和最新版Imagen3

2025-05-14 来源|AI图库吧

谷歌的旗舰AI研究实验室Google DeepMind周一大幅升级其人工智能驱动的内容生成工具,推出了Veo 2视频生成模型和增强版Imagen 3图像模型,挑战OpenAI在AI图像和视频生成的领先地位。谷歌表示,这些更新有望彻底改变创意工作流程,为视频和图像创作者提供更高的真实感和定制化体验。

谷歌介绍,Veo 2是谷歌的视频生成工具,能够生成多样化主题和风格的高质量视频。谷歌在博客中表示,这款模型在真实感方面表现卓越,能够捕捉到人类表情和电影效果等细节。其增强的物理和电影学理解能力使用户能够生成令人惊叹的内容,包括跟踪镜头和广角构图等。

例如,Veo 2熟悉电影拍摄语言,用户可以要求某种类型的风格,指定镜头,建议电影效果,Veo 2都会以高达4K分辨率并延长到数分钟的视频长度来呈现。比如,要求“低角度跟踪镜头穿越场景中央”或“特写科学家通过显微镜观察”的镜头,Veo 2都能实现。提示“18mm镜头”,Veo 2知道生成广角镜头;要求“浅景深”,它会模糊背景,突出主体。

值得注意的是,这一分辨率是OpenAI sora模型的4倍,视频时长更是其6倍以上。

不过,目前这些优势仍是理论上的。在谷歌的实验性视频创作工具VideoFX中,Veo 2生成的视频被限制为720p分辨率、8秒的长度。(相比之下,Sora的最大输出为1080p、20秒的短片。)

谷歌表示,虽然视频生成模型往往会“幻象化”出不需要的细节,例如多余的手指或意外的物体,但Veo 2在这一方面的表现更为真实,生成错误的频率较低。

此外,Veo 2生成的视频包括不可见的SynthID水印,用于标记它们为AI生成的内容,从而减少误用或错误归属的风险。

DeepMind产品副总裁Eli Collins对媒体表示,随着模型逐渐具备规模化使用的准备,谷歌将通过其Vertex AI开发者平台提供Veo 2。

“未来几个月,我们将根据用户反馈持续迭代,并寻求将Veo 2的更新能力整合到谷歌生态系统中的相关应用中……我们预计明年会分享更多的更新内容。”

开发者和创作者目前可以通过谷歌实验室(Google Labs)访问该工具,预计到2025年,它将广泛集成至诸如YouTube Shorts等平台。

同时,Imagen 3模型在图像构图和细节准确性方面得到了增强,支持从写实到抽象的各种风格,能够生成更丰富的纹理,并更加忠实地回应用户提示。

最新
更多

谷歌大幅更新生成式AI,推出视频模型VEO 2和最新版Imagen3

谷歌的旗舰AI研究实验室Google DeepMind周一大幅升级其人工智能驱动的内容生成工具,推出了Veo 2视频生成模型和增强版Imagen 3图像模型,挑战OpenAI在AI图像和视频生成的领先地位。谷歌表示,这些更新有望彻底改

让AI“开口说话”:复杂模型的解释不再晦涩

机器学习模型虽然功能强大,但可能会出错,并且通常难以使用。为了帮助用户了解何时以及如何信任模型的预测,科学家们开发了各种解释方法。然而,这些解释往往十分复杂,可能涉及数百个模型特征,有时还以多层次

Kimi埋头打造AI应用

在仲裁风波中前行的Kimi及其创始人杨植麟,正将目光牢牢锁定在自家AI应用的创新之路上。继上月推出数学模型k0—math后,Kimi再度发力。 12月16日,Kimi揭开了视觉思考模型k1的神秘面纱,该模型基于强化学习技

哲学专家和人工智能领域学者齐聚一堂,首届人工智能哲学与伦理论坛在汉举行

AI如何赋能与向善?12月14日,首届人工智能哲学与伦理论坛在华中科技大学举行。大会由华中科技大学哲学学院主办,旨在加快华中科技大学《人工智能的哲学与伦理》课程建设。围绕“人工智能:赋能与向善”,来自清华

美年健康:大模型与AI Agent赋能 引领医疗人工智能应用

随着科技迅猛发展,人工智能已悄然融入生活各个角落。在12月14日结束的第七场发布上,OpenAI作为全球AI领域的先行者,再次展示了其在人工智能领域持续迭代与创新的强劲势头,从ChatGPT的广泛应用,到后来依次发布

2024中国医学人工智能大会成功举办

12月14日,2024中国医学人工智能大会在上海徐汇成功举办,本届大会以“人工智能赋能医疗卫生健康”为主题。市经济信息化委主任张英出席大会并致辞。 张英表示,上海正在加快实施“模塑申城”工程,推动垂类大模型在医

网站地图