微软称GPT-4已经是早期通用人工智能?反对者:缺少自我意识|观察
划重点
【资料图】
腾讯科技讯 4月24日消息,微软在研究论文中声称,新一代的人工智能算法GPT-4可能会让人觉得它们已经达到了早期通用人工智能(AGI)的水平,只是目前尚缺少相关判定标准。然而许多反对者表示,微软是在炒作,GPT-4也缺少始终如一的自我意识。
去年9月份的一个晚上,微软机器学习研究员塞巴斯蒂安·布贝克从睡眠中醒来,想到了人工智能和独角兽。最近,布贝克提前获得了GPT-4的使用权,这是人工智能研究公司OpenAI开发出的强大文本生成算法,也是广受欢迎的聊天机器人ChatGPT核心机器学习模型的升级版。
布贝克是微软一个关键团队的成员,该团队致力于将新的人工智能系统整合到微软的必应搜索引擎中。然而,即使身在其间,布贝克和他的同事们仍惊叹于GPT-4的能力,它与他们以前见过的任何东西都截然不同。
与此前的大型语言模型一样,GPT-4也被输入了大量的文本和代码,并被训练使用语料库中的统计模式来预测应该在回复文本输入时生成的单词。但对布贝克来说,该系统的输出似乎不仅仅是做出统计学上合理的猜测。
那天晚上,布贝克起床并走到他的电脑前,让GPT用TikZ(一种相对晦涩的、用于生成科学图表的编程语言)绘制独角兽。布贝克使用的GPT-4版本只能处理文本,不能处理图像。但是模型给他提供了代码,在将代码输入到TikZ渲染软件中时,产生了一个由椭圆形、矩形和三角形拼凑而成的、尽管粗糙却十分独特的图像。
对布贝克来说,这样的成功肯定需要算法对这种生物有某种程度上的抽象把握。他说:“这里正在发生许多新的事情,也许这是我们第一次拥有可以称之为智能的东西。”
人工智能将变得多么智能?我们应该在多大程度上相信一种越来越普遍的感觉,即软件是智能的?这些已经成为一个紧迫的、几乎令人感到恐慌的问题。
去年11月,OpenAI发布了由GPT-3提供支持的ChatGPT,它以针对大量主题撰写诗歌和散文的能力、解决编码问题,以及从网络上合成知识的能力震惊了世界。但令人感到敬畏的同时,也伴随着人们对其被用于学术欺诈、错误信息传播和造成大规模失业的担忧。此外,人们也对微软等公司急于开发可能被证明非常危险的技术担心不已。
理解AI新能力的潜力或风险意味着,我们要清楚地掌握它们具备哪些能力,以及无法做到哪些事情。然而,虽然人们普遍认为ChatGPT和类似的系统赋予了计算机重要的新技能,但研究人员才刚刚开始研究这些行为,并确定提示背后发生了什么。
虽然OpenAI通过夸赞GPT-4在律师和医学考试中的出色表现来推广它,但研究人类智能方面的科学家表示,它的卓越能力在关键方面与我们不同。这些模型不仅倾向于编造事实,而且分歧巨大。每天都有数以百万计的人在使用这项技术,许多公司也把未来押在了这项技术上,这是个亟待解决的问题。
AIG火花
布贝克和微软的其他人工智能研究人员受到GPT-4经验的启发,参与了这场辩论。在将GPT-4系统接入必应并推出新的聊天功能几周后,该公司发表了一篇论文,声称在早期的实验中,GPT-4显示出“通用人工智能的火花”。
作者列举了许多例子,在这些例子中,该系统执行的任务似乎反映了更通用的智能,大大超过了以前的系统,如GPT-3。这些例子表明,与大多数以前的人工智能程序不同,GPT-4并不局限于特定的任务,而是可以处理各种各样的问题,这是通用人工智能的必备品质。
作者还认为,这些系统展示了推理、计划、从经验中学习以及将概念从一种形态转移到另一种形态的能力,比如从文本到图像。论文指出:“鉴于GPT-4能力的广度和深度,我们认为它可以被合理地视为通用人工智能(AGI)系统的早期版本,尽管其仍不完整。”
布贝克与包括微软首席科学官在内的另外14人共同撰写了这篇论文,但其在社交媒体上遭到了人工智能研究人员和专家的反对。通用人工智能是一个模糊的描述,有时用来暗指超级智能或神级机器,这个词的使用惹恼了许多研究人员,他们认为这是当前炒作的证据。
在有些研究人员看来,微软向OpenAI投资超过100亿美元的事实表明,该公司的人工智能专家有动机大肆宣传GPT-4的潜力,同时淡化其局限性。其他人则抱怨说,实验不可能复制,因为当提示重复出现时,GPT-4很少以同样的方式做出反应,而且OpenAI还没有分享其设计细节。当然,人们也会问,如果GPT-4真的这么聪明,为什么它还会犯可笑的错误?
美国伊利诺斯大学厄巴纳-香槟分校的塔利亚·林格教授说,微软的论文“展示了一些有趣的现象,然后提出了一些非常夸张的观点。吹捧系统具有高度智能,会鼓励用户信任它们,即使它们存在严重缺陷。虽然从用于衡量人类智力的系统中借鉴某些想法可能很诱人,但许多想法已被证明是不可靠的,甚至根植于种族主义。”
布贝克也承认其研究存在局限性,包括可重复性问题,而且GPT-4也有很大的盲点。他说:“使用通用人工智能一词就是为了引发争论。从定义上讲,智能是通用的。我们想了解这个模型的智能程度以及广度,毕竟它涵盖了很多很多领域。”
但是在布贝克论文中引用的所有例子中,有很多都表明GPT-4在某些事情上犯了明显的错误,而且通常是在微软团队用来吹嘘其成功的任务上。例如,例如,GPT-4能够提出一种稳定的方法来堆放一系列具有挑战性的物品,包括一本书、四个网球、一个钉子、一个酒杯、一团口香糖和未煮熟的意大利面,这似乎指向了其对世界物理属性的把握,这被视为人类的第二天性。然而,更改话题和要求可能会导致奇怪的失败,这表明GPT-4对物理的掌握并不完整或不一致。
布贝克指出,GPT-4缺乏工作记忆,在提前计划方面毫无建树。他说:“GPT-4不擅长这一点,也许大型语言模型通常永远不会擅长这方面的工作。”他指的是GPT-4等系统核心的大规模机器学习算法,“如果你想说智能就是计划,那么GPT-4就不是智能。”
毋庸置疑的是,GPT-4和其他强大人工智能语言模型的工作原理与大脑或人类思维过程并不相似。算法必须输入大量的训练数据(互联网上的大量文本),这远远超过人类学习语言技能所需的数据。灌输GPT-4的“经验”,以及用它构建的东西,这些智能物品是批量产出的,而不是通过与世界的互动和说教式对话获得的。
由于没有工作记忆,ChatGPT只能通过在每次对话重新输入会话历史来维持会话的线程。然而,尽管存在这些差异,GPT-4显然是一大飞跃,研究智力的科学家表示,它的能力需要进一步的研究。
机器之心
一个由麻省理工学院、加州大学洛杉矶分校和得克萨斯大学奥斯汀分校的认知科学家、语言学家、神经科学家和计算机科学家组成的团队在1月份发表了一篇研究论文,探讨了大型语言模型的能力与人类的能力有何不同。
该团队得出结论称,尽管大型语言模型展示了令人印象深刻的语言技能,包括连贯地就给定主题写出复杂文章的能力,但这与理解语言以及如何在世界上使用语言截然不同。这其中存在的脱节问题可能是语言模型开始模仿堆叠物体或解决谜语所需常识推理的原因。但是,当涉及到理解社会关系、物理世界如何运作以及人们如何思考时,这些系统仍然会犯奇怪的错误。
这些模型使用语言的方式,通过预测最可能出现在给定字符串后面的单词,与人类通过说话或写作来传达概念或意图的方式也有很大不同。这种统计方法可能会导致聊天机器人跟随并反映用户提示的语言,甚至到了荒谬的地步。
例如,当一个聊天机器人告诉某人离开他们的配偶时,它只会给出在对话线索下看起来最合理的答案。ChatGPT和类似的机器人将使用第一人称,因为它们接受过人类写作的训练。但它们没有始终如一的自我意识,可以在瞬间改变自己声称的信仰或经历。OpenAI还使用来自人类的反馈来引导模型生成人们认为更连贯和正确的答案,这可能会促使模型提供被认为更令人满意的答案,而不管它们是否准确。
麻省理工学院教授乔希·特南鲍姆是1月份那篇论文的撰稿人之一,他研究人类认知以及如何利用机器探索人类认知。他说,GPT-4很了不起,但在很多方面与人类智能有很大不同。例如,它缺乏对人类思维至关重要的那种动机,“它甚至不在乎是否关闭”。人类不是简单地遵循自己的程序,而是根据自己的需要和愿望为自己创造新的目标。
特南鲍姆还称,GPT-3、GPT-4和ChatGPT之间发生许多关键的工程变化,使它们的能力更加强大。首先,该模型是在大量计算机代码上进行训练的。他和其他人认为,人脑可能使用类似于计算机程序的东西来处理部分认知任务,所以也许GPT-4从代码中发现的模式中学到了非常有用的东西。他还指出,ChatGPT从人类那里得到的反馈是一个关键因素。
但特南鲍姆表示,由此产生的能力并不等同于人类智力特征中的一般智力。他说:“我对人类个体和集体的认知能力很感兴趣,这不仅仅是一种执行一大堆任务的能力。我们制造任务,我们也能制造解决这些任务的机器。”
特南鲍姆还说,目前还不清楚未来几代GPT能否获得这些能力,除非采用一些不同的技术,这可能意味着从机器学习之外的人工智能研究领域汲取灵感。重要的是,要仔细考虑我们是否要以这种方式设计系统,因为这样做可能会产生不可预见的后果。
1月份那篇论文的另一位作者、得克萨斯大学奥斯汀分校语言学助理教授凯尔·马霍瓦尔德说,基于GPT-4能力的单个例子做出任何判断都是错误的。他解释称,认知心理学的工具可以用来衡量这些模型的智力。但他补充说,GPT-4的不透明性使挑战变得更复杂。重要的是训练数据中有什么,我们不知道。如果GPT-4在那些明确训练过的常识性推理任务上取得成功,而在其他没有训练过的任务上失败,很难据此得出结论。
那么,GPT-4是否可以被视为迈向通用人工智能的一小步,完全取决于你的看法。重新定义这个词可能是最令人满意的答案。斯坦福大学心理学、计算机科学和语言学副教授诺亚·古德曼表示:“我现在的观点是,这就是通用人工智能,因为它是一种通用的智能,但前提是我们对通用人工智能的含义不那么固执。”
不幸的是,GPT-4和ChatGPT被设计为抵制这种简单的重构。它们很聪明,但几乎没有提供关于如何或为什么的见解。更重要的是,人类使用语言的方式依赖于在对话的另一边有一个智能实体的心理模型来解释我们所表达的词语和想法。我们不禁发现,如此轻松使用语言的生物身上闪烁着智慧的光芒。古德曼说:“如果预言模式是有意义的,那么人类天生就会把它们理解为有意的,并适应这种情况。”
人工智能不像人类,却看起来如此聪明,这一事实仍然令人惊叹。古德曼称:“我们获得了大量的原始智力,但它不一定带有自我观点、目标或连贯的自我意识。然而对我来说,这已经足够迷人了。”(金鹿)
标签:
推荐文章
- 华声制药网简介
- 人机对话技术升级 之江实验室获2021年度浙江省科技进步二等奖
- 研究人员最新发现 单个细胞可同时处理成百上千个信号
- 陆军第73集团军某旅 创新升级模拟训练器材
- 长期暴露在光照下性能退化 科学家发现钙钛矿太阳能电池最大缺陷
- 宁夏启动双百科技支撑行动 构建高水平产业创新体系
- 陆军炮兵防空兵学院 毕业学员综合战术演习现地备课工作圆满完成
- 国内首颗以茶叶冠名遥感卫星 安溪铁观音一号发射成功
- 区域特色产业转型升级 四川屏山以“3+”模式推进科技创新工作
- 激发创新动能促进产业发展 无锡滨湖走出产业转型“绿色”路
- 绥化全域低风险!黑龙江绥化北林区一地调整为低风险
- 走访抗美援朝纪念馆:长津湖的寒冷,与战斗一样残酷
- 节后第一天北京白天晴或多云利于出行 夜间起秋雨或再上线
- 走近网瘾少年们:他们沉迷网络的病根何在?
- “双减”后首个长假:亲子游、研学游需求集中释放
- 获2021年诺奖的蛋白,结构由中国学者率先解析
- 他从一窍不通的“门外汉”,到重装空投“兵专家”
- 升旗、巡岛、护航标、写日志,他们一生守护一座岛
- 中国故事丨“沉浸式”盘点今年的教育好声音!
- 农业农村部:确保秋粮丰收到手、明年夏季粮油播种
- “双减”出台两个月,组合拳如何直击减负难点?
- 《山海情》里“凌教授”的巨菌草丰收啦
- 且看新疆展新颜
- 天山脚下,触摸丝路发展新脉动
- 160万骑手疑似“被个体户”?平台不能当甩手掌柜
- 网游新政下,未成年人防沉迷的“主战场”在哪?
- “辱华车贴”商家及客服被行拘,处罚要不放过每一环
- 沙害是自然界的恶魔,而他是荒沙碱滩的征服者
- 面对婚姻,“互联网世代”的年轻人在忧虑什么?
- IP类城市缘何吸引力强?玩法创新带动游客年轻化
- 国庆主题花坛持续展摆至重阳节
- 都市小资还是潮流乐享?花草茶市场呈爆发性增长
- 从1.3万元降到700元,起诉书揭秘心脏支架“玄机”
- 北京国庆7天接待游客超861万人次 冬奥线路受青睐
- 陈毅元帅长子忆父亲叮嘱:你们自己学习要好,就可以做很多事儿
- 报告显示:这个国庆假期,粤川浙桂赣旅游热度最高
- 中国科技人才大数据:广东总量第一,“北上”这类人才多
- 嘉陵江出现有记录以来最强秋汛
- 全国模范法官周淑琴:为乡村群众点燃法治明灯
- 线上教学模式被盯上,网络付费刷课形成灰色产业链
- 云南保山:170公里边境线,4000余人日夜值守
- 警方查处故宫周边各类违法人员12人
- 农业农村部:确保秋粮丰收到手、明年夏季粮油播种
- 受南海热带低压影响 海南海口三港预计停运将持续到10日白天
- 多地网友投诉遭遇旅游消费骗局,呼吁有关部门严查乱象
- 神经科学“罗塞塔石碑”来了:迄今为止最完整的大脑细胞图谱
- 汾河新绛段发生决口
- 陕西支援14省份采暖季保供用煤3900万吨
- 这场红色故事“云比拼”,穿越时空为我们指引方向
- 受琼州海峡封航影响 10月7日、8日进出海南岛旅客列车停运
- 辽宁省工信厅发布10月8日电力缺口橙色预警
- 广州10月8日至20日对所有从省外来(返)穗人员实施核酸检测
- 假期怎么过得这么快?国庆5.15亿人次出游,你咋过的?
- 国庆假期全国道路交通总体安全平稳有序
- 哈尔滨市南岗区爱达88小区将调整为低风险地区
- 新疆霍尔果斯市2例无症状感染者新冠病毒均为德尔塔变异株
- 百闻不如一见——北京大学留学生参访新疆
- 看,生机勃勃的中国
- 国庆假期中国预计发送旅客4.03亿人次
- 新疆兵团可克达拉市:195名密接者已全部隔离医学观察
- 山西平遥消防4天29次救援:拖着腿走路也要完成任务
- 国庆假期北京接待游客861.1万人次
- 冷空气自西向东影响中国大部地区 气温将下降4℃至6℃
- 新疆哈密市巴里坤县发生4.3级地震 震源深度9千米
- 国庆假期中国国内旅游出游5.15亿人次
- 公安部交管局:国庆假期日均出动警力18万余人次,5位交警辅警牺牲
- 受南海热带低压影响广东将暂别高温天气
- “数说”杭州无障碍改造:触摸城市“爱的厚度”
- 新疆霍尔果斯无症状感染者新冠病毒属德尔塔变异株 未发现高度同源的基因组序列
- 新疆伊犁州:妥善做好滞留旅客安置返回工作
- 国庆假期广西累计接待游客逾3611万人次 实现旅游消费272.41亿元
- 2021年MAGIC3上海市青少年三对三超级篮球赛落幕
- 新疆兵团第四师可克达拉市1名无症状感染者为餐饮从业人员
- 哥伦比亚遇上广州:洋茶人“云上”喫茶 传播中国茶“味道”
- 厦门同安区四区域调整为低风险 全市无中高风险地区
- 直径2米“面气球”亮相 山西首届“寿阳味道”美食大赛启幕
- 世界第一埋深高速公路隧道大峡谷隧道出口端斜井掘进完成
- 浙南沿海村村发展有妙招 搭乘共富快车打造“海上花园”
- 新疆霍尔果斯两例无症状感染者新冠病毒均属德尔塔变异株
- 南沙港铁路国庆假期不停工 力争今年年底开通
- 添加陌生人为好友 内蒙古两女子被骗126万
- 中国国庆假期出行热:数字改变“关键小事”
- 水能载物亦能“生金” 浙江遂昌山村以水为媒奔共富
- 铁路人国庆雨中巡查排险记:一身雨衣、一把铁锹保安全畅通
- 铁路迎返程高峰 西安局集团公司加开79趟高铁列车
- 受热带低压影响 琼州海峡北岸等待过海车辆排长龙
- 哈尔滨市学校有序恢复线下教学
- 哈尔滨一地风险等级调整为低风险
- 从进“培训班”到看《长津湖》
- 安徽黄山国庆假期迎客12万余人 旅游市场稳步复苏
- 山西解除持续近90小时的暴雨四级应急响应
- 科学拦峰错峰削峰 嘉陵江洪水过境重庆中心城区“有惊无险”
- 粤高速大湾区路段假期车流集中 跨珠江口通道尤甚
- 千年街区“非遗”风催热国庆假期本地游
X 关闭
资讯
- 微软称GPT-4已经是早期通用人工智能?反对者:缺少自我意识|观察
- 天天播报:自治区级智能工厂、数字化车间达92家 广西柳州制造业向智能化转型
- 今日家里刚死人该注意什么问题_家里刚死人该注意什么-每日快播
- 裁判手下留情,留下易建联最后尊严!广东三核合同到期,王朝崩塌_世界视讯
- 零线火线地线都有电怎么回事插电正常运转_零线火线地线都有电 今日热议
- 梅安森一季度营收净利双增长 今年来股价大涨78%_天天热资讯
- 成都温江区举行世界读书日主题活动-天天百事通
- 现金流量比率计算公式含义(现金流量比率分析主要包括哪些) 聚焦
- 英雄泪_关于英雄泪的简介
- 欧美简史典藏系列
- 百事通!酵素粉瘦身排行榜第一名_酵素粉
- 斯蒂芬·海斯_关于斯蒂芬·海斯简介 每日热门
X 关闭