国内大模型争霸赛,你最看好哪家?这是你心目中的大模型排名吗?

知乎:绝密伏击
地址:https://www.zhihu.com/question/598051793/answer/3034073973
深度学习自然语言处理 分享

进NLP群—>加入NLP交流群

OpenAI Vs Google

d5623ee991b8e833090e970607b84f4a.png

目前大模型 top2 应该就是 OpenAI 的 GPT-4,以及谷歌的PALM-2。这两家公司早已布局,而且技术实力雄厚。国内大模型和 GPT-4 相比,还是有比较大的差距。

但是国内的势头目前不错,百家齐鸣,还没有一家有绝对的优势。

让人头晕的排名

6de705ef62975f718a1b173850fafd50.png

之前有媒体给出了目前国内Top-5的大模型公司,分别是:百度的文心一言、阿里的通义千问、腾讯的混元、华为的盘古以及360的智脑

而最近,中文通用大模型基准(SuperCLUE)评测公布了最新结果,GPT-4 遥遥领先,而国内成绩最好的是科大讯飞的星火认知大模型。这里面文心一言居然排在了最后一名,甚至比ChatGLM-6B的得分还低,实在难以置信

9b945e90879e36e3ce78c762884d873f.png

但是我又仔细看了一下这个评测。妈呀,评测集是SuperCLUE,而非SuperGLUE

众所周知,在国际NLP领域,有大名鼎鼎的数据集 GLUE 和 SuperGLUE,非常权威,OpenAI、谷歌等的大模型都在上面评测,极大推动了 NLP 领域的发展。

这次这份 SuperCLUE 评测的发起方为 Chinese GLUE 组织 (简称 CLUE),CLUE 是仿照 GLUE由国内民间组织的评测,权威度和影响力与 GLUE 相比差很远,其微信账号主体属性为个人。但这也迷惑了不少圈内人,GLUE和 CLUE 分不清楚,堪称李逵和李鬼

还有一点存疑,评测榜单发布当天5月9日,其官网显示信息,中文基准测评成员顾问中排名第一的是崔一鸣,身份为学术顾问委员会主任,哈工大讯飞联合实验室(HFL)资深级研究员。而5月10日,官网已删除此条顾问的信息。

而001号创始会员徐亮,是会长,相当于这个榜单的实际负责人。昵称 brightmart,中文任务基准测评发起人。多个预训练模型中文版、文本分类和数据集开源项目作者。

徐亮还有另一个身份,在5月9日官网中显示,他是杭州实在智能算法专家,也就是元语智能的创始人,曾在2月份发布自称“国内首个功能对话大模型ChatYuan”,不仅无法测试,发布几天即被监管叫停。4月,又被报道套壳推出开源组件。有分析人士认为,不排除创业公司有融资压力,蹭热度吸引投资人关注。

该 SpuerClue 榜单发起方,001号顾问是讯飞身份背景、001号基准发起人是创业公司创始人。在榜单发布后,担心行业质疑其公平、公正,相关信息还被删除。这就有点不言而喻了。

仅用100道评测题目就出来了一份“权威报告”

最后来说下这个榜单本身,业内人士一眼就可以看出来,评测的很不合理,首先,没有公布评估数据,以及具体的评估方式。同时从它的公开表述,可推断总共题目就 100 道题目。这个题目量少到难以置信。专业人士可能有参与过,像国际权威 SuperGlue 榜单,题目一般都得有 2 万多道,离权威可是差了几万倍。况且,它的评测得分榜首都是人类,那这个评分的基准到底是什么?是否有很多主观性因素在里面?是否某些大模型提前在这个数据集上已经训练过?

任务设计太武断,所谓“通用”基准,是用以测试通用的人工认知能力的,那么我们自然希望,评测任务是参考了模型想要模拟的认知能力及相关理论,系统化地选择出来的。而实际上,我们观察到的则是,基准的作者们在选择任务的时候,更像是图方便、省事。以往,CLUE 中存在着部分数据集,一味考虑任务的复杂性,却在最起码的分布边界划分上(如NER各个类别的边界,如场所、景点类,组织机构及其子类),模糊不清,且数据的一致性无法保证。

要么别比,要比就来点正规的比赛。自己出题自己考,说不准还抢跑,自己还是评委,那这是欺不负了解真相的吃瓜群众。投机取巧,终皆散去。苦练内功,才是王道。

国内大模型排名(仅供参考)

抛开这些,从模型规模、模型效果、市场占有率等多个角度,百度的文心一言、华为的盘古、阿里的通义千问、腾讯的混元排在前四,应该是比较合理的,至于后面的排名,就不大能保证了。不过下面的排名也可以参考一下:

203711b83785ea7b73af8948de67c849.png

下面是一份完整的名单:

42957c4e1ec4c349ba0a9c4bba8fa49e.png 5cf637df0bdcfc900ffc9d374990448e.png

按发布时间排序:

08b189155cfa050adba838759d95f433.png

百度:文心一言

作为国内最早发布的大模型,百度的文心一言在今年3月16号就发布了,随后经过了多个版本的迭代。目前已经有上千家企业接入。文心一言支持图片、语音等多模态。

3月16日,百度在全球大厂中率先发布对标 ChatGPT 的大模型产品文心一言。据了解,文心一言内测一个多月,就完成了4次大的技术升级,大模型推理性能提升近10倍。

李彦宏在5月4日百度内部活动中表示,百度之所以能够在Google、Meta、Amazon等大厂之前率先发布生成式大模型产品,是因为百度在芯片、框架、模型、应用等四个层面做到全栈布局、层层领先。

360:360智脑

百度是国内搜索市场排名第一公司,而排名第二就是360。

大模型依靠的算力、数据、算法、场景,这两家公司都具备,这也是搜索公司的优势,有业务和数据支撑大模型研发和落地。

5月16日,360集团和智谱AI宣布达成战略合作,双方共同研发的千亿级大模型“360GLM”已具备新一代认知智能通用模型水准。

而在今天的世界智能大会上,周鸿祎展示了“360智脑”的多轮对话和“360鸿图”的AI生图两个能力。

fbbaa093ed9e8fb949fcc9882ee27c02.png

就像谷歌和微软,一个拥有谷歌搜索,一个拥有必应。国内的百度和360,一个拥有百度搜索,一个拥有360搜索。

搜索公司应该是这场大模型争霸赛最后的赢家。(只是个人看法)


进NLP群—> 加入NLP交流群

zenRRan
关注 关注
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
未来已来?国内11家AI大模型盘点(附体验网址)
流苏的博客
03-21 4万+
未来已来?国内11家AI大模型盘点及体验网址,一起来看看吧!
大语言模型应用指南:自主Agent系统案例分析
程序员光剑
05-07 1201
早期的语言模型主要基于统计方法,例如N-gram模型,其原理是根据文本词语出现的频率统计来预测下一个词语。这类模型简单易于实现,但缺乏对语言深层语义的理解,表达能力有限。自主Agent是指能够在特定环境自主感知、决策、行动的智能体。能够根据环境变化和自身目标自主做出决策和行动。能够从经验学习,不断优化自身的行为策略。能够适应不同的环境和任务,具有较强的泛化能力。随着计算能力的提升和数据量的增长,未来将会出现更大规模、更强大的语言模型
国产AI大模型哪家强?十大维度横评四款主流大模型
2301_76161259的博客
04-29 1911
这部分的最后,我们来看看四款大模型对文本的总结提炼能力。小编从IT之家随机选择了一篇新闻资讯,分别让四款大模型将这篇新闻总结成一句话的摘要。先看文心一言的表现,虽然是总结了,意思也正确,但总结得比较啰嗦,而且不符合“一句话”的要求:通义千问也有类似的问题,总结啰嗦,而且超过一句话的限制:360 智脑在这一项表现不错,一句话准确总结了这段文章的大意:讯飞星火提炼得也很精炼,一句话搞定,而且意思准确。在这一环节,四款大模型产品的得分分别为:讯飞星火:10 分通义千问:8 分(摘要提炼 - 2)
目前最全的!国产AI大模型名单!大模型已百家争鸣!
2301_81888214的博客
08-14 1582
目前最全的!国产AI大模型名单!大模型已百家争鸣!
目前最全的!国内AI大模型名单!百家争鸣!
yXIAOyu_的博客
07-26 901
短短半年多时间,百川智能便接连发布了Baichuan-7B/13B、Baichuan2-7B/13B四款开源可免费商用大模型,以及Baichuan-53B、Baichuan2-53B两款闭源大模型,平均每28天就会有一款新的大模型问世。它不仅提供卓越的文本生成和创作服务,支持文本或图片输入生成高质量、多风格的图像,更拥有强大的智能编辑功能,无损放大、智能消除、智能抠图等操作一应具备,助您轻松创作精彩图像。科大讯飞倾力打造的星火认知大模型,作为新一代的认知智能典范,展现了跨领域的知识和语言理解能力。
「小白必读」国内超火的 8 款 AI 大模型,你的副业都来自它
python12345678_的博客
06-03 3238
大家好,最近好多朋友在问我,国内是否有好用的大模型,今天我就整理好 8 款大模型,大家可以多尝试,一定会有不一样的感觉。01HOTSPOTKimiKimi 是由月之暗面科技有限公司开发的人工智能助手。它擅长英文对话,能够提供安全、有帮助、准确的回答。同时能够阅读和理解用户上传的文件,访问互联网,并且结合搜索结果来回答问题。也能够处理多种文件格式,包括但不限于TXT、PDF、Word文档、PPT幻灯片和Excel电子表格。02HOTSPOT智普清言。
盘点2024国内热门AI大模型:哪个最好!
helphelptongxue的博客
07-12 2441
近年来,国AI技术迅猛发展,特别是在大模型领域取得了显著成就。众多科技巨头和初创企业纷纷推出各具特色的AI大模型,这些模型在智能问答、知识推理、内容创作等多个方面展现出强大的能力。今天,我们来盘点一下国内几个主流的AI大模型
魔兽争霸孙悟空模型
04-25
《魔兽争霸》是一款深受玩家喜爱的即时战略游戏,其包含了丰富的自定义元素,如地图编辑器和模型替换等。在这款游戏的世界,玩家可以利用这些工具创造出属于自己的独特体验。"魔兽争霸孙悟空模型"就是玩家对游戏...
魔兽争霸WAR3模型查看编辑动作查看
06-24
《魔兽争霸WAR3模型查看编辑动作查看》 在电子游戏界,魔兽争霸III(WAR3)无疑是一款具有里程碑意义的作品,其丰富的游戏性和强大的自定义功能吸引了无数玩家和创作者。模型是游戏角色、单位和环境的基础,而MDX...
魔兽争霸3模型查看器.zip
10-10
《魔兽争霸3模型查看器》是一款专为《魔兽争霸3》玩家和地图编辑者设计的实用工具,它允许用户在不启动游戏的情况下查看、研究和分析游戏模型资源。这款软件对于想要深入了解游戏美术设计或者进行自定义地图开发...
【大模型应用开发 动手做AI Agent】Agent的大脑:大模型的通用推理能力
程序员光剑
06-14 820
1.背景介绍 大模型人工智能领域已经引起了广泛的关注和研究。作为一种新的人工智能技术,大模型通过构建大规模的神经网络模型,能够在处理复杂任务时表现出强大的表现力和灵活性。这些模型的应用范围从自然语言处理到计算机视觉,再到强化学习等领域,都取得了显著的成果。 在这篇文章,我们将深入探讨大模型的核心概念,以及如何利用大模型的通用推理能力来
AI大模型发明专利排行榜(国内企业)
idol24的博客
03-27 1310
本文编辑来源 创新奇智近日,全球知识产权综合信息服务提供商IPRdaily发布“人工智能模型企业发明专利排行榜(TOP 50)”。基于对人工智能模型技术的理解,IPRdaily通过对相关的关键词和分类号进行限定,数据统计2017年1月1日至2023年3月17日在国申请并公开的人工智能模型专利(同申请号合并),发布人工智能模型企业发明专利排行榜(TOP 50)。备注:本榜单采用的专...
我对比了7家国内外大模型
赵侠客
07-23 1202
模型呈现出百花齐放、百家争鸣的景象,国内除了各家大厂纷纷推出各自大模型后,各种小厂也推出了各种各样的大模型。本文选取了国内模型第一梯队的阿里-通义千问、百度-文心一言、科大讯飞-星火、清华-ChatGLM-6B与国外第一梯队的Google-Bard、微软-Bing、ChatGPT进行一场真枪实弹的对比,看看是不是网友所说的大模型是国外是”不能用“,国内是”不能用“
目前比较火爆的国产AI大模型有哪些?它们分别有什么特色和优缺点?
文章主要涉及嵌入式软件开发、测试、项目管理等,欢迎交流,共同进步。
08-16 1179
2023年被誉为AI大模型的元年,从OpenAI先后推出了多个版本的GPT,再到国内外大模型的密集发布、技术与应用的突破、行业生态的初步形成以及社会影响的广泛化。这一年标志着AI大模型的发展进入了一个新的阶段并将在未来继续引领人工智能技术的发展和应用落地。时至今日,目前有哪些国产AI大模型在激烈的竞争脱颖而出了呢?今天一起来盘点一下。尽管AI大模型在技术和应用上取得了显著进展,但仍面临诸多挑战。例如,如何进一步提高模型的精度和效率、如何降低模型的训练成本、如何确保模型的安全性和可靠性等。
值得收藏!十大国流行的AI大模型企业及平台汇总
kaka0722ww的博客
05-16 5903
在当今这个信息化迅速发展的时代,人工智能技术已经成为推动社会进步的重要力量。特别是在我国,AI大模型技术的发展速度令人瞩目,各种平台纷纷涌现,表现出强大的技术实力和广泛的应用前景。
【揭秘】国内十大顶尖AI大模型,引领智能科技新纪元
Java癫疯的博客
08-25 1005
【揭秘】国内十大顶尖AI大模型,引领智能科技新纪元
人工智能】未来已来,国内10家AI大模型盘点
2301_76168381的博客
06-14 4412
阿里达摩院推出的大模型,拥有千亿参数,可用于智能问答、知识检索、文案创作等场景。
2024年国内8个常用AI大模型的适用性比较
最新发布
Python单行客的博客
08-25 729
2024年国内8个常用AI大模型的适用性比较
目前最全的国内AI大模型117家名单。。。
算法channel
07-07 1446
你好,我是郭震AI大模型正在飞速发展,一年多时间国内已有很多大模型公司。这篇文章咱们就来看看,这应该是目前最全面的国内AI大模型公司名单。第一节是117家AI大模型公司表格;第二节是前20家一个介绍,117个介绍放在一篇阅读体感差,两个方法:1) PDF阅读;2) 在线阅读1 AI大模型117家名单117家已备案的AI大模型名称、所属公司、主要应用领域。铁铁们收藏好了, 这应该是目前最全面的一...
写文章

热门文章

  • 大数定律和中心极限定理的区别和联系 24983
  • nlp中的实体关系抽取方法总结 22624
  • 一分钟搞懂的算法之BPE算法 21509
  • 【知识图谱】知识图谱嵌入模型简介 19326
  • 哪些软件翻译英文文献比较准确呢? 17073

分类专栏

  • nlp 26篇
  • 深度学习 28篇
  • 其他 2篇
  • 机器学习 27篇
  • linux 3篇
  • python 8篇
  • 数学 3篇

最新评论

  • 论文解读:KAN: Kolmogorov–Arnold Networks

    aotian__: 作者您好,有些公式没有显示出来,能否麻烦您补全?

  • 十分钟读懂旋转编码(RoPE)

    格子瑞风: 公式全都没有了表情包

  • 阿里+中科院提出:将角度margin引入到对比学习目标函数中并建模句子间不同相似程度...

    1415*: 请问是不是没开源代码

  • 前紧后松:清华读博前两年的焦虑与成长

    恋try: 谢谢你激励了我,先紧后松才能出高质量的文章,我也赞同这个说法。

大家在看

  • SystemExit: 系统退出异常的完美解决方法⚙️
  • 计算机低能儿从0刷leetcode | 11.盛最多水的容器 159
  • Apifox 「定时任务」操作指南,解锁自动化测试的新利器
  • GitHub连接方式
  • Spring Boot 项目 与 其他依赖版本兼容对应表 779

最新文章

  • 实现一个简洁的代码模型评测框架(以Qwen2.5-coder 评测Humaneval为例)
  • Qwen2.5-Coder 技术报告详细解读
  • tokenizer简述
2024
09月 40篇
08月 33篇
07月 32篇
06月 27篇
05月 18篇
04月 60篇
03月 76篇
02月 39篇
01月 62篇
2023年794篇
2022年550篇
2021年758篇
2020年896篇
2019年476篇
2018年181篇
2017年1篇

目录

目录

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家浮雕长城玻璃钢雕塑玻璃钢雕塑是固定资产吗四平校园玻璃钢雕塑制作江苏商场主题创意商业美陈报价成都玻璃钢造型雕塑选择好的玻璃钢人物雕塑横栏商场美陈河南主题公园玻璃钢雕塑厂家上海主题商场美陈采购商场户外秋季美陈顺义区服务好商场美陈山东商场美陈销售商场美陈报价预算广东大型玻璃钢雕塑供应商铜川frp玻璃钢雕塑广州小品系列玻璃钢雕塑公司重庆玻璃钢雕塑摆件石景山玻璃钢花盆安徽景区玻璃钢雕塑制作莱芜园林玻璃钢雕塑加工东营玻璃钢雕塑定制红塔区玻璃钢雕塑价格玻璃钢雕塑产品报价佛像玻璃钢雕塑公司哪家好顺义玻璃钢花盆花器衢州佛像玻璃钢雕塑销售电话端州玻璃钢雕塑价格雕塑玻璃钢雕塑制作河南艺术商场美陈价格安阳玻璃钢卡通雕塑生产厂家香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化