近日谷歌 DeepMind 推出两款新型 AI 模型,旨在帮助机器人完成更多现实世界中的任务。
其中一款名为 Gemini Robotics,是一款视觉语言行动模型,能够使机器人在没有进行过专门训练的情况下理解新的情境。
Gemini Robotics 基于谷歌最新版本的 AI 旗舰模型 ——Gemini 2.0。谷歌 DeepMind 机器人部门高级总监 Carolina Parada 曾表示,Gemini Robotics 依托 Gemini 的多模态世界理解能力,通过加入物理行动的新模态,将其应用到现实世界中。
该模型在谷歌 DeepMind 认为构建高效机器人所需的三大核心领域取得了进展:通用性、互动性和灵活性。除了能够应对新的情境外,Gemini Robotics 在与人类及环境的互动上表现更好,且能够执行更精确的物理操作,比如折纸或打开瓶盖。
另一款则是 Gemini Robotics-ER(具象推理)模型,公司称其为一种先进的视觉语言模型,能够“理解复杂且动态的世界”。
Parada 进一步解释道,当你在装便当盒时,桌上的物品摆放位置和如何操作是你必须考虑的内容。Gemini Robotics-ER 正是为此类推理任务而设计,机器人专家可通过该模型与现有的低级控制系统对接,开启由 Gemini Robotics-ER 驱动的新功能。
谷歌 DeepMind 的研究员 Vikas Sindhwani 表示,公司正在开发一种“分层安全策略”,并称 Gemini Robotics-ER 模型已被训练用于评估在特定情况下某个动作是否安全。公司还发布了新的基准和框架,推动 AI 领域的安全研究。据IT之家了解,去年,谷歌 DeepMind 推出了“机器人宪法”,这是一套受艾萨克・阿西莫夫启发的机器人行为规范。
据外媒 The Verge,谷歌 DeepMind 与 Apptronik 合作,共同致力于“打造下一代人形机器人”。此外,谷歌还向包括 agile Robots、Agility Robotics、波士顿动力和 Enchanted Tools 在内的“受信任的测试者”开放了 Gemini Robotics-ER 模型。Parada 表示:“我们专注于打造能够理解物理世界并在其中行动的智能,我们非常期待将这一技术应用于多个领域和多种表现形式。”
上一篇:360周鸿祎:大部分企业只需要百亿参数模型即可,多了浪费
近日谷歌 DeepMind 推出两款新型 AI 模型,旨在帮助机器人完成更多现实世界中的任务。 其中一款名为 Gemini Robotics,是一款视觉语言行动模型,能够使机器人在没有进行过专门训练的情况下理解新的情境。 Gemini
本文讨论了构建安全可信的人工智能以及人工智能赋能百行千业的主题。文章提到了360自研的认知大模型智脑在该领域的探索,并分享了一些实践中得到的经验和思考。
百度创始人、董事长兼首席执行官李彦宏在世界互联网大会的演讲中强调了大模型在重塑数字世界方面的重要性。他指出大模型是全球科技创新的焦点和人工智能竞赛的主战场,同时带来了数字经济发展的巨大机遇和治理挑战。
上海市公安局闵行分局近日破获一起犯罪团伙利用AI生成美女视频,“广撒网式”的电信网络诈骗案,涉案资金200余万元。 市民刘先生是受害者之一。2024年6月,刘先生通过一则短视频结交了网友“焦女士”,并发展为恋人
「发财了,一个视频回本,收益300多。」一位群友在群里发布了自己的视频号截图。另一位群友不语,只是发布了自己同话题的视频,显示收益800多。 群主此时发来拇指点赞,适时总结:「动物警示现在很猛。」 「
阿里巴巴集团董事会主席兼首席执行官张勇在世界互联网大会数字文明尼山对话主论坛上表示,人工智能技术的发展必须符合社会规范,为人类创造更多美好。他指出人工智能在中国具备基础扎实、场景丰富、数据实践融合等优势,而构建安全可信的人工智能已成为行业共识,相关法律法规正在完善。
AI小聚
ZeroGPT
Aiundetect
WordfixerBot
Ai Sofiya
WriteAI.Tech
Cowriter
Seenapse AI
CreativAI
网站地图
谷歌 DeepMind 推出两款新型 AI 模型,旨在帮助机器人完成更多现实世界中的任务
近日谷歌 DeepMind 推出两款新型 AI 模型,旨在帮助机器人完成更多现实世界中的任务。
其中一款名为 Gemini Robotics,是一款视觉语言行动模型,能够使机器人在没有进行过专门训练的情况下理解新的情境。
Gemini Robotics 基于谷歌最新版本的 AI 旗舰模型 ——Gemini 2.0。谷歌 DeepMind 机器人部门高级总监 Carolina Parada 曾表示,Gemini Robotics 依托 Gemini 的多模态世界理解能力,通过加入物理行动的新模态,将其应用到现实世界中。
该模型在谷歌 DeepMind 认为构建高效机器人所需的三大核心领域取得了进展:通用性、互动性和灵活性。除了能够应对新的情境外,Gemini Robotics 在与人类及环境的互动上表现更好,且能够执行更精确的物理操作,比如折纸或打开瓶盖。
另一款则是 Gemini Robotics-ER(具象推理)模型,公司称其为一种先进的视觉语言模型,能够“理解复杂且动态的世界”。
Parada 进一步解释道,当你在装便当盒时,桌上的物品摆放位置和如何操作是你必须考虑的内容。Gemini Robotics-ER 正是为此类推理任务而设计,机器人专家可通过该模型与现有的低级控制系统对接,开启由 Gemini Robotics-ER 驱动的新功能。
谷歌 DeepMind 的研究员 Vikas Sindhwani 表示,公司正在开发一种“分层安全策略”,并称 Gemini Robotics-ER 模型已被训练用于评估在特定情况下某个动作是否安全。公司还发布了新的基准和框架,推动 AI 领域的安全研究。据IT之家了解,去年,谷歌 DeepMind 推出了“机器人宪法”,这是一套受艾萨克・阿西莫夫启发的机器人行为规范。
据外媒 The Verge,谷歌 DeepMind 与 Apptronik 合作,共同致力于“打造下一代人形机器人”。此外,谷歌还向包括 agile Robots、Agility Robotics、波士顿动力和 Enchanted Tools 在内的“受信任的测试者”开放了 Gemini Robotics-ER 模型。Parada 表示:“我们专注于打造能够理解物理世界并在其中行动的智能,我们非常期待将这一技术应用于多个领域和多种表现形式。”
上一篇:360周鸿祎:大部分企业只需要百亿参数模型即可,多了浪费
谷歌 DeepMind 推出两款新型 AI 模型,旨在帮助机器人完成更多现实世界中的任务
近日谷歌 DeepMind 推出两款新型 AI 模型,旨在帮助机器人完成更多现实世界中的任务。 其中一款名为 Gemini Robotics,是一款视觉语言行动模型,能够使机器人在没有进行过专门训练的情况下理解新的情境。 Gemini
360周鸿祎:大部分企业只需要百亿参数模型即可,多了浪费
本文讨论了构建安全可信的人工智能以及人工智能赋能百行千业的主题。文章提到了360自研的认知大模型智脑在该领域的探索,并分享了一些实践中得到的经验和思考。
李彦宏:大模型即将重塑数字世界,文心大模型更新至 V3.5版本
百度创始人、董事长兼首席执行官李彦宏在世界互联网大会的演讲中强调了大模型在重塑数字世界方面的重要性。他指出大模型是全球科技创新的焦点和人工智能竞赛的主战场,同时带来了数字经济发展的巨大机遇和治理挑战。
上海市公安局闵行分局近日破获一起犯罪团伙利用AI生成美女视频
上海市公安局闵行分局近日破获一起犯罪团伙利用AI生成美女视频,“广撒网式”的电信网络诈骗案,涉案资金200余万元。 市民刘先生是受害者之一。2024年6月,刘先生通过一则短视频结交了网友“焦女士”,并发展为恋人
警惕:AI视频渗透老年朋友圈,假孙子、情感代偿和新时代微商
「发财了,一个视频回本,收益300多。」一位群友在群里发布了自己的视频号截图。另一位群友不语,只是发布了自己同话题的视频,显示收益800多。 群主此时发来拇指点赞,适时总结:「动物警示现在很猛。」 「
阿里巴巴张勇:人工智能技术必须符合社会规范,为人类带来更多美好
阿里巴巴集团董事会主席兼首席执行官张勇在世界互联网大会数字文明尼山对话主论坛上表示,人工智能技术的发展必须符合社会规范,为人类创造更多美好。他指出人工智能在中国具备基础扎实、场景丰富、数据实践融合等优势,而构建安全可信的人工智能已成为行业共识,相关法律法规正在完善。
AI小聚
ZeroGPT
Aiundetect
WordfixerBot
Ai Sofiya
WriteAI.Tech
Cowriter
AI小聚
ZeroGPT
Aiundetect
WordfixerBot
Ai Sofiya
WriteAI.Tech
Cowriter
Seenapse AI
CreativAI