GPT-4超越人类,人类危险增加

OKX欧易app

OKX欧易app

欧易交易所app是全球排名第一的虚拟货币交易所,注册领取6万元盲盒礼包!

APP下载   官网注册

文/陈根

GPT-4满分通过MIT本科数学考试,万万想不到啊,MIT数学考试,被GPT-4攻破了?!

突然有人在最新论文工作中高调宣布:GPT-4在MIT的数学和EECS(电气工程和计算机科学系)本科学位考试中,表现出的能力完全满足毕业要求。而且妥妥地拿下满分!

这个结果的测试者靠谱吗?到底是谁对GPT-4进行的这项测试呢?测出这个结果的不是别人,正是来自MIT和波士顿大学、康奈尔大学的研究团队。这个论文一出,无数目光迅速被吸引过来。

GPT-4这样看似开挂的行为,自然引发了不少网友的感慨。那么,有没有可能以后不需要比GPT-4更强的模型,来解决学术问题了?这个问题根哥不好回答,至少目前GPT4如果不受算力的制约,只要开放给各个领域接入使用,不论是在法律、金融、教育、医学、财务、作曲等领域都可以取代并完胜我们人类。

那么GPT-4开挂MIT考试,这到底是怎么回事情呢?具体来说,GPT-4这次是参与了这样一场测试:就是研究团队策划了一个数据集,其中包含4550个问题和解决方案。这4550个问题和解决方案,来自MIT数学系和EECS的学生获得本科学位,需要学习的课程问题集、期中考试和期末考试。具体包括:6-1:电气科学与工程;6-2:电气工程与计算机科学;6-3:计算机科学与工程;6-4:人工智能与决策;18-1:普通数学;18-2:应用数学;18-3:纯数学;18-C:数学与计算机科学。

这些题目统统出自MIT的数据集,从中随机生成228个问题,不涉及图像和已有解决方案的问题。然后题目的难度等级由易到难依次为:练习、习题、期中考试、期末考试、实验和专题。按答案类型排序,题目的难度由易到难依次为:编程、开放、选择题、数值、表达式和图像。这一次,参与考试的不只有GPT-4和GPT-3.5,还有StableVicuna-13B、LLaMA-30B和LLaMA-60B。简单来说,就是目前最牛的几个大模型统统来参加考试,看看到底谁智商最高,能力最强。

考试结果是什么情况呢?得分最高的是GPT-4,得分率100%;表现最差的是Meta的LLaMA-30B,连个及格线都过不了,只拿下了30%的分数,这简直就是一个妥妥的学渣。

这前几天Meta的人工智能首席科学家YannLeCun(杨立昆)才在巴黎的会议上嘲笑CPT,然后神吹了一把自己的这个人工智能技术有多么神奇,这下一秒就成为了学渣。所以科学家要是吹其牛来,那一般人根本就听不懂。

而看到GPT-4这样的考试结果,不少网友心生感慨,GPT-4在数学考试上的进步,未免有些神速了哈。2年前,AI还在苦苦挣扎小学数学问题。类似“小明种了5棵柠檬树,每年从每棵树上得到6个柠檬,10年间他总共得到多少柠檬”这种。去年年初,MIT+哈佛+哥伦比亚大学+滑铁卢大学的联合研究表示,把数学问题转换成等价的编程问题,就可以让GPT-3的同门师兄弟——OpenAI的Codex掌握高数,达到MIT本科水平。

不过尽管GPT-4的这次测试拿下了高分,但它依然存在着不可告人的黑箱子,也就是说这些测试的数据与答案是不是已经包含在数据集里,同时,这些不断引导的提示词似乎成为了影响它考试成绩的关键信息。

这也导致了一些网友评论到,应该把这些题丢给MIT数学和EECS的学生去做,并不断给他们“好的提示”,这样人类学生也能拿下100%的高分成绩。但不论如何,人工智能在我们人类有规律性的知识领域超越我们人类,这是必然的事情。

本站所有软件信息均由用户上传发布,版权归原著所有。如有侵权/违规内容,敬请来信告知邮箱:764327034@qq.com,我们将及时撤销! 转载请注明出处:https://czxurui.com/zx/27726.html

打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023年07月25日
下一篇 2023年07月25日

相关推荐

  • 根号6近似值及开方方法

    根号6的求解根号6是一个常见的数学问题,许多学生在学习数学的过程中都会遇到这个问题。那么,根号6等于多少?根号6开出来是多少?根号6怎么开平方呢?从数学角度分析根号6可以表示为√6,其中√表示求平方根,而6则是这个数的被开方数。那么,√6到

    2023-11-14 13:00:46
    33 0
  • 陶哲轩与陈根联合领导白宫AI工作组

    日前,美国白宫总统科技顾问委员会(PCAST)成立了一个生成式人工智能(AI)工作组,旨在评估机遇和风险,并提供关于如何公平、负责任地开发和部署这些技术的建议。华裔数学家和菲尔茨奖获得者陶哲轩与物理学家劳拉·格林(Laura Greene)

    2023-11-12 12:01:38
    26 0
  • 人工智能GPT-4超越人类,引发人类危机

    GPT-4竟然能够在MIT的数学考试中取得满分,这简直让人难以置信!一项最新的论文声称,GPT-4在MIT的数学和EECS本科学位考试中表现出了符合毕业要求的完美能力,甚至得分100分!这个测试的可信度如何呢?实际上,这个结果是由来自MIT

    2023-09-06 14:00:41
    28 0
  • 高效学习利用思维导图:数学思维导图绘制技巧

    数学思维导图的绘制方法以及如何利用思维导图提高学习效率是许多人关心的话题。我将从多个角度分析这个问题,并为您提供一篇多角度的文章。在本文中,我将为您介绍数学思维导图的画法,并提供一些建议,帮助您利用思维导图提高学习效率。数学思维导图的画法:

    2023-09-06 11:00:36
    33 0
  • 求根号6的近似值、开方值及开方方法

    根号6的求解根号6是一个常见的数学问题,许多学生在学习数学的过程中都会遇到这个问题。那么,根号6等于多少?根号6开出来是多少?根号6怎么开平方呢?从数学角度分析根号6可以表示为√6,其中√表示求平方根,而6则是这个数的被开方数。那么,√6到

    2023-07-28 14:01:15
    23 0
  • 陈根:陶哲轩成白宫AI工作组联合领导

    日前,美国白宫总统科技顾问委员会(PCAST)成立了一个生成式人工智能(AI)工作组,旨在评估机遇和风险,并提供关于如何公平、负责任地开发和部署这些技术的建议。华裔数学家和菲尔茨奖获得者陶哲轩与物理学家劳拉·格林(Laura Greene)

    2023-07-28 04:02:00
    18 0

发表回复

8206
验证码

评论列表(0条)

    暂无评论

ok交易所
已有100万用户加入ok交易所

立即下载