首页 AI教程资讯新华社测评AI大模型谁更强_国产AI大模型谁家强

新华社测评AI大模型谁更强_国产AI大模型谁家强

2024-12-16 来源｜AI图库吧

最近一年，人工智能技术迎来了大变革，伴随着ChatGPT的异军突起，科技企业们纷纷加大投入，AIGC大模型的发展日新月异、推陈出新。

为直观感受国内科技大厂所推出的大模型产品的现状、优势及特点。8月12日，新华社研究院对外发布《人工智能大模型体验报告2.0》，通过抓取7月31日~8月4日最新的网络数据组成复合型问答测试卷，以人机互动问答等形式，对国内主流大模型进行使用体验的横向测评。

本次测评在今年6月发布的《人工智能大模型体验报告1.0》基础上，在题目设定、对标Benchmark参照（人类）、人工打分权重、专家测评团队四大方面进行了全面升级：

在题目设置方面，测评题目由6月的300道扩展至8月的500道，并完善了题目分类；在对标Benchmark方面，本次测评将以接受过高等教育的人类作为对照组；在人工打分项目上，本次测评根据对产业、生活的实际价值，引入了人工打分的权重指数；在测评团队方面，邀请了北大文化与传播研究所的专家学者参与。

报告首先提出，大模型概念红利正在逐渐消失，大模型产品的估值将被重新衡量，回归实际应用。事实上，最近两个月AI概念一直在降温，ChatGPT官网的月活访问也在不断下行。报告认为，主流大模型架构的开发进程已过半，在竞争的下半场，如何将AI真正走进千家万户成为关注焦点。

为了更好地还原国内大模型的真实表现，本次测评的对象将围绕以下这些国内企业的大模型产品开展：360智脑、百度文心一言、澜舟科技Mchat、讯飞星火、昆仑万维天工、阿里通义千问、商汤商量、智谱科技ChatGLM（排名不分先后）。

上一篇：钉钉个人版怎么样_钉钉个人版测评_钉钉个人版怎么用

下一篇：如何利用AI翻译视频_如何利用AI工具进行配音_AIGC如何应用于视频翻译配音

最新

更多

小度全新AI硬件将于百度世界大会发布丨智谱AI、即梦AI上线新一代视频生成模型丨OpenAI安全系统团队负责人离职

【AI奇点网2024年11月11日早报】本站每日播报AI业界最新资讯，触摸时代脉搏，掌握未来科技动向。事不宜迟，点击查看今日AI资讯早餐。

字节跳动内测豆包通用图像编辑模型SeedEdit丨Grok聊天机器人免费版内测丨月之暗面Kimi创始人被提起仲裁

【AI奇点网2024年11月12日早报】本站每日播报AI业界最新资讯，触摸时代脉搏，掌握未来科技动向。事不宜迟，点击查看今日AI资讯早餐。

李彦宏：文心大模型日调用量超15亿丨百度发布文心「iRAG」文生图技术丨小度AI智能眼镜发布，搭载大模型边走边问

【AI奇点网2024年11月13日早报】本站每日播报AI业界最新资讯，触摸时代脉搏，掌握未来科技动向。事不宜迟，点击查看今日AI资讯早餐。

巧妙利用这两个AI产品，让你的国庆出行没有废片

这两天就有朋友来问我，有没有那种能修图的AI，就是扩图+消除啥的傻瓜好用的。大家大概的需求总结一下其实就两，AI消除+AI扩图。

OpenAI初步谈妥融资70亿美元：最大金主微软追加投资10亿，苹果退出

据华尔街日报报道，苹果公司退出了对 OpenAI 的新一轮融资谈判，而微软则计划向 OpenAI 追加约 10 亿美元的投资。

详解Meta全新大模型Llama 3.2系列：多模态视觉识别能力媲美OpenAI GPT-4o

Meta公司推出了Llama 3 2，也是它首款能够理解图像和文本的旗舰视觉模型。包含中型和小型两个版本，以及更轻量化可用于手机端侧的纯文本模型。

最新录入

更多

飞书智能伙伴

飞书智能伙伴

必剪

Hi Echo — 网易有道

Hi Echo — 网易有道

堆友

360AI搜索

360AI搜索

Wink Studio

Wink Studio

通义效率

通义效率

热门工具

飞书智能伙伴

飞书智能伙伴

必剪

Hi Echo — 网易有道

Hi Echo — 网易有道

堆友

360AI搜索

360AI搜索

Wink Studio

Wink Studio

通义效率

通义效率

360AI助手

360AI助手

腾讯文档AI

腾讯文档AI

热门