全新通用大模型Gemini基准测评30项碾压GPT-4,谷歌演示视频上演现实版的“贾维斯”

2025-04-28 来源|AI图库吧

最新更新:当地时间12月8日,谷歌发言人在外媒彭博社的采访中承认,官方发布的 Gemini 演示视频并非真实交互效果实时录制。换而言之,仅仅只是广告效果。


谷歌于2023年12月8日发布了Gemini大模型,这是一款由6000亿个参数组成的多模态语言模型。Gemini是谷歌人工智能团队在LaMDA和PaLM的基础上开发的,能够处理文本、代码、音频、图像和视频等多种格式的信息。 Gemini在32项学术基准测试中都达到了SOTA水平,在MMLU测试中,Gemini Ultra的得分率高达90.0%,是第一个超过人类专家的模型。

谷歌Gemini大模型里边体积最小的Gemini Nano搭配AICore, 可用 LoRA 来做 Fine Tune。

这天迟早要来,但没想到这么快!

简单的一张架构图,开启在智能手机上实现大语言模型和生成式 AI 的序幕。

变革应该只是开始而已,将来做 IC 设计 、 AI Compute Architecture 和手机上的生成式 AI 应用的等等,未来几年有得忙了!

这段谷歌的Gemini演示Demo视频,简直可谓是现实版的“贾维斯”,非常震撼,很好的展示了多模态大模型的未来!

【视频简介】

视频中展示了谷歌Gemini大模型的各种功能,如识别使用者画的图、猜出手部游戏的答案等,甚至还能理解手绘图中的逻辑并播放音乐。这标志着谷歌在AI领域取得了巨大进步。

【视频时间戳】

谷歌全新多模态大型语言模型Gemini,涵盖文字、声音、图像和影片处理,适用于不同应用场景。

00:01谷歌发布多模态大型语言模型Gemini

00:31 鸭子识别:Gemini能够识别使用者画的鸭子并调侃鸭子的颜色

01:08手绘图识别:Gemini能够识别手绘图,并推理出其中的逻辑,还能够识别手绘图中的文字

最新
更多

全新通用大模型Gemini基准测评30项碾压GPT-4,谷歌演示视频上演现实版的“贾维斯”

谷歌于2023年12月8日发布了Gemini大模型,这是一款由6000亿个参数组成的多模态语言模型。在官方公布的30项基准测评指标中,Gemini碾压GPT-4。

经典手机游戏《会说话的汤姆猫》接入谷歌大模型与ChatGPT,变身“会聊天的汤姆猫”

随着今年AIGC技术的突然崛起,在接入了AI聊天机器人的API接口后,原本的《会说话的汤姆猫》也升级为《会聊天的汤姆猫》。

借助AI修复与香港“老”电影重逢

20世纪以来,香港电影产业蓬勃发展,先后创作了逾万部影片,赢得了“东方好莱坞”的盛誉。然而,随着高清数字电影格式的兴起,胶片电影逐渐淡出主流视野,许多珍贵的胶片影像资料面临老化损坏的困境。为了使这些经

李飞飞团队AI视频生成模型介绍_扩散模型W.A.L.T

视频大数据时代,真的来了!刚刚,李飞飞的斯坦福团队同谷歌合作,推出了用于生成逼真视频的扩散模型W A L T。这是一个在共享潜在空间中训练图像和视频生成的,基于Transformer的扩散模型。

张旭代表:把北京建设成人工智能赋能科学研究的全球中心城市

1月14日至18日,北京市第十六届人民代表大会第三次会议举行。北京市人大代表、十四届全国政协提案委员会委员,九三学社中央副秘书长张旭在现场接受新京报记者采访时表示,他本次上会,带来了关于建设人工智能赋能

Soul发布AI聊天机器人“苟蛋”丨李飞飞团队×谷歌发布视频生成大模型W.A.L.T丨Runway研发AI视频“通用世界模型”

【AI奇点网2023年12月13日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。

网站地图