西南交通大学大模型边缘推理优化技术取得新成绩

2025-07-17 来源|AI图库吧

今年7月底,第二届中国计算机学会(CCF)芯片大会在上海举办。近两千名国内外计算机和微电子等学科领域从事芯片相关研究与技术开发的专家学者、研究人员、企业代表参会,共同探讨芯片设计与EDA、新型体系架构、容错计算、新兴计算机工程与工艺等方面的理论创新、技术研发、应用示范与产业发展话题。

在本届芯片大会体系结构专委组织的“CCFTCarch定制计算挑战赛”(消费级显卡的LLM部署加速)上,西南交通大学冯力教授带领的研究团队凭借其在大模型边缘推理优化方面的卓越表现,荣获了全国第二名的优异成绩。

在此次竞赛中,冯力团队采用了一系列创新技术来应对大模型边缘推理面临的挑战,其中包括算子融合技术。该技术通过将多个独立的运算操作合并,减少了显存的频繁读写,显著提升了计算效率。

据冯力介绍,通过算子融合,团队成功地将计算时间缩短了80%以上,极大地提高了计算资源的利用效率。此外,团队还实施了精度量化技术,将部分计算从浮点运算转换为定点运算。虽然这在一定程度上带来了精度上的损失,但整体上仍实现了计算速度的大幅提升和能耗的降低。

冯力强调,此次竞赛的成功离不开团队成员之间的紧密合作。尽管参赛的学生们在大模型领域缺乏经验,但他们展现出了非凡的学习能力和勇于探索的精神。通过与国际顶尖学者的合作,特别是与英国布里斯托大学的跨国交流,学生们不仅拓宽了视野,也积累了宝贵的经验。冯力表示:“我们的学生非常年轻,但他们充满热情,勇于面对挑战。通过大量的文献阅读和技术研讨,他们迅速掌握了相关领域的最新进展,并将理论知识转化为实践成果。”

谈及未来的发展方向,冯力表示,随着大模型技术的进步,特别是在隐私保护和私有化部署方面的需求日益增加,团队的研究成果将具有广阔的应用前景。例如,在金融、交通和航空等领域,许多敏感数据不适合传输到云端处理,而是在本地进行分析,这就需要高效的大模型边缘推理技术。冯力透露,目前团队正在积极与多家企业和研究机构合作,致力于将研究成果应用于网络安全漏洞分析和交通大数据处理等方面,推动科研成果的商业化转化。

最新
更多

西南交通大学大模型边缘推理优化技术取得新成绩

今年7月底,第二届中国计算机学会(CCF)芯片大会在上海举办。近两千名国内外计算机和微电子等学科领域从事芯片相关研究与技术开发的专家学者、研究人员、企业代表参会,共同探讨芯片设计与EDA、新型体系架构、容错

MiniMax闫俊杰:大模型快就是好 可有时候慢是为了更快

大模型是拼速度的领域,但有时候慢可能是另一种快。 8月31日,国内AI独角兽企业MiniMax上海稀宇科技有限公司(以下简称“MiniMax”)在首届开发者大会“MiniMaxLink伙伴日”上低调发布视频模型abab-video-1,输入

监督帮扶大模型上线,未来拟向全国推广!

“能即时回复,而且内容详细,有些我们没想到的事项也会包括在答复里。” 作为参加2024年第七轮次重点区域空气质量改善夏季监督帮扶的执法同志,来自河南省濮阳市生态环境局的彭建志向“监督帮扶智能答疑模型”咨询相

杭州字节方舟取得一种基于人工智能的区块链大数据推荐方法的专利,使推荐系统能更精确地匹配用户的兴趣点

专利摘要显示,本发明公开了一种基于人工智能的区块链大数据推荐方法,涉及区块链技术领域,该推荐方法的步骤为:S1、收集用户的行为数据,并采用区块链技术存储加密行为数据;S2、对行为数据进行预处理,并从行

高盛:AI浪潮可能在未来10年拖累油价

高盛本周发表研报指出,目前围绕AI对能源行业影响的讨论主要集中在需求侧,如AI算力需求增加,导致电力需求上升,这可能推高能源需求和价格。然而,供给侧的影响更加复杂,AI可以极大提升石油勘探和生产的效率,

生成式AI会让人类思考力退化吗?这场大会将揭示十大热点话题答案

越来越多工作岗位可能被AI替代,如何实现人的劳动诉求和人生价值?当AI开始弥补甚至取代情感陪伴这一曾经独属于人类的体验,将带来哪些新可能和新问题? 9 月 3 日,外滩大会官微发布2024 Inclusion·外滩大会

网站地图