新研究提升人工智能决策算法适用性

2025-07-10 来源|AI图库吧
近日,由北京大学人工智能研究院、工学院、计算机学院和伦敦国王学院共同完成的论文——《大规模多智能体系统的高效强化学习》在国际学术期刊《自然·机器智能》上发表。这一成果首次在大规模多智能体系统中实现高效去中心化协同决策,有利于提升人工智能决策算法的扩展性和适用性。多智能体系统主要以庞大的智能体交互数据为基础,利用大量计算资源驱动每个智能体学习如何与其他智能体合作执行复杂任务,其核心范式是多智能体强化学习。“比如一个无人机编队,每架无人机都由人工智能控制,我们把每架飞机的控制器叫作智能体,这个无人机编队由多个智能体构成,就是一个多智能体系统。”论文第一作者、北京大学人工智能研究院博士生马成栋解释。马成栋说,在真实大规模系统中,各个控制单位之间、控制单位与环境之间的交互成本往往非常高昂。这些系统中经常存在客观通信限制,如通信距离太远、全局通信有隐私泄露风险、通信能耗限制等。控制单位之间难以实现全局信息交换,阻碍了人工智能决策算法在大规模系统中的扩展和应用。当前,去中心化的多智能体强化学习成为国际学术界的研究热点,其旨在探索一种算法,即在有限数据和资源条件下,将决策能力扩展到包含大量智能体的复杂真实系统中。马成栋说,去中心化的多智能体强化学习,以不依赖全局信息的方式让每个智能体实现高效去中心化协同决策,展现出独特优势。论文通讯作者、北京大学人工智能研究院助理教授杨耀东介绍,研究团队通过网络化结构解耦系统的全局动态特性,使智能体能独立学习局部状态转移、邻域信息价值和去中心化策略,将复杂的大规模决策难题转化为更容易求解的问题。得益于此,即使在样本数据和信息交互受限的情况下,大型人工智能系统也能展现令人满意的决策性能。研究团队在较为复杂的城市交通和电力网络中,对包含数百个智能体的场景进行了测试。结果显示,与中心化多智能体学习方法相比,去中心化的方法可将信息交换成本降低70%或更多。而且,随着智能体数量不断增长,这一比例还会显著下降。同时,样本效率可提升50%以上。“这一研究成果对于将人工智能模型扩展到大型电力网络、城市交通信号控制等大规模多智能体系统具有重要价值。”马成栋举例说,在大型电网系统中,节点之间信息交换和传输过于频繁,难免会产生干扰。某些节点一旦发生故障,就会严重影响其他节点的性能。去中心化可以降低这一风险,提高电网系统稳定性和安全性。
最新
更多

新研究提升人工智能决策算法适用性

近日,由北京大学人工智能研究院、工学院、计算机学院和伦敦国王学院共同完成的论文——《大规模多智能体系统的高效强化学习》在国际学术期刊《自然·机器智能》上发表。这一成果首次在大规模多智能体系统中实现高效

政策加码 央企深度“拥抱”人工智能

《经济参考报》9月10日刊发记者王璐采写的文章《政策供给加码 央企深度“拥抱”人工智能》。文章称,近期,哈尔滨等多地智算中心建成投产,电力、油气等领域人工智能产品密集亮相,这一系列动作的背后是中央企业全

人工智能发展和安全并重的法治探究——以人形机器人为例

一、问题的提出 作为具身智能产物的人形机器人,通过使用以大数据为基础的多模态模型,在高算力的基础上,通过强算法能够进行高质量的感知、规划和行动,并可以通过自然语言同人类连贯高效地智能交互。2023年工业

AI“耐心时刻”结束!OpenAI推出全新 o1 系列模型,推理能力再上新台阶

北京时间2024年9月13日凌晨,OpenAI 公司宣布推出两款新的 AI 模型:o1-preview 和 o1-mini。这两款模型旨在解决各种复杂任务,在推理数学、编程及科学问题的能力上取得了显著进步。o1-mini 不仅速度更快,而且比

初创企业“卖身”成风,AI泡沫来了?

知名企业收购人工智能(AI)初创公司的脚步越来越快了。 今年二季度,全球AI公司获得的资金环比增长了一倍多,达到240亿美元,占当季初创企业融资总额的30%,是近年来AI融资额度最高的一个季度。 初创公

手机无战事,把AI留到明年

顶着科技春晚的名头,苹果的新品发布会也和春晚在缓缓趋同。 “史上最强的标准版iPhone”和祖传的60hz交相辉映,录播的现场充斥切片剪辑,而作为苹果的首款“AI手机”,中国大陆的消费者甚至都没有一个确切的体验

网站地图