ChatGPT爆火,人工智能的下一个范式来了吗?
来源: 文汇报 作者: 发布时间: 2022-12-20

        编写代码、翻译小说、参加考试……2022年末,人工智能聊天机器人ChatGPT刷爆网络。一位互联网从业者“爆料”:现在几乎所有程序员都争先恐后去领略它的超高情商和巨大威力,ChatGPT输出的答案有时幽默、有时深刻,很难分清与他对话的究竟是人还是机器。

  ChatGPT由人工智能研究实验室OpenAI于11月30日推出。上线短短5天,用户数量已突破100万。由于太过火爆,OpenAI不得不暂时关闭了用户的测试入驻窗口。

  2016年3月,AlphaGo击败围棋世界冠军李世石,被视为人工智能发展历程中的一次里程碑事件。而今,ChatGPT再次掀起了一波人工智能发展应用的高潮。

  它究竟会给人类社会带来哪些深刻影响?人工智能的颠覆性应用即将来了吗?

  擅长“丝滑”写作,有时也会“翻车”

  科幻作家刘慈欣的艺术三部曲之《诗云》中曾经描绘过这样一个故事:外星人仰慕地球文学,但又苦于无法写出李白那样的诗句,于是他们用量子计算机将所有汉字的排列组合穷举出来,这之后,任何人写下的任何文字都能在外星人的“文学数据库”中找到。

  从某种程度上来看,GPT的技术路线与“诗云”类似。2017年,人工智能领域一篇重磅论文《transform(一种采用自注意力机制的深度学习模型)》横空出世。这篇论文用巧妙的计算模拟出任何两个词之间所有维度的潜在关系,这一模型影响了其后的人工智能研究。

  2018年,OpenAI推出第一代GPT,之后两年迭代了三个版本。2020年,GPT-3的问世在业界掀起不小的波澜。这是一个拥有1750亿参数、利用45万亿字节文本数据进行训练的人工智能算法模型。在它出现之前,世界上最大的语言模型是微软旗下的Turing-NLG,还不到两亿参数。

  “最新推出的ChatGPT大约相当于GPT的3.5版本。”国内领先的文本处理公司达观数据联合创始人文辉表示。尽管目前尚未有ChatGPT的相关论文披露,但人们可以从关于GPT的论文中了解到,GPT是通过文字接龙以及人工引导接龙反馈的模式训练这一语言模型的。

  比如,让GPT在“你好”后面接一个字,它在浏览了大量互联网信息后,会筛选出人类使用频率较高的字,如美、高、吗等,工程师给接“美”的标注“这是一个好答案”,手工标注几万条后,再输入到计算机模型中,创建出一个模拟老师的机器人模型,再让机器学习这一模型。

  总之,GPT每次输出的答案其实是一次概率分布,它能“丝滑”地写出美妙的文章或代码,却很可能在极简单的问题上“翻车”。比如,当你问它numbers(数字)这个单词有几个字母时,它有时会回答7,有时会回答9。

  聊天之外,ChatGPT将会撼动谁?

  ChatGPT上线的短短几天之内,它已经参加了美国高校的入学资格考试(SAT),成绩为中等学生水平;用《老友记》主角口吻创作了剧本对白;构思了简短的侦探小说……人们迫切地想要知道,它还会给我们带来多少惊喜?

  尽管这一机器人模型的名字中有chat(聊天),但受ChatGPT影响最大的,并非微信这样的聊天工具,而是搜索引擎。“许多人已经养成了同一个问题问一遍搜索引擎,再问一遍ChatGPT的习惯。”文辉说。虽然目前ChatGPT仍会出现“人工智障”的回答,或是反复横跳的立场,但它无疑是给民用AI的落地,以及下一代搜索引擎指明了方向。

  从发展趋势看,ChatGPT很可能会成为人们的私人助理。你可以列出这周的工作关键词,让它写一篇工作报告;或者让它帮你订一张从上海到北京的机票;又或者模仿你喜欢的作家的口吻发一条网络信息……这些工作它都能胜任。或许,我们离人人配备一个处理文字的“AI小秘书”的时代已经不远了。

  不过,ChatGPT也并非无所不能。由于它的答案不是从一篇文档中摘出来,而是由模型自生成,这使得它更容易“一本正经地胡说八道”。比如,当它按照你的要求生成一段代码,如果你对此并不熟悉,可能看不出其实通篇都是错;对于一些最新发生的事,比如阿根廷和法国谁能赢得世界杯冠军,传统搜索引擎可能几分钟后就能全网查询,但自生成结果则要慢得多。

  图文并茂,生成式AI时代或已到来

  刘慈欣在创作《三体》时未曾想到,如果那时有ChatGPT,罗辑在描述梦想中的女孩时,她的形象就会被自动生成出来。ChatGPT的能力已经涉及到AI模型之间的合作,毕竟引领了文字生图潮流的人工智能图像生成器DALL-E,也是出自OpenAI之手。

  “人工智能在几秒钟之内迅速生成图片、视频等创造性内容,业内普遍认为AI的下一个范式——生成式AI时代已经到来。”文辉说。

  虽然在全局层面还无法与ChatGPT的“智能”一较高下,但在特定垂直领域,中国人工智能企业的AI智能也能与ChatGPT“掰掰手腕”。如今,税务、金融、新能源汽车等行业的许多企业,都用上了达观数据的“自动流程机器人”(RPA),其核心就是一套语义智能识别系统,机器人可以自动填写单据、自动识别单据内容、自动判断填写内容是否合法合规。

  回答开放问题一直是人工智能的痛点。科大讯飞今年在交互系统的认知关键技术上取得了突破性进展。目前,讯飞定义了1517个意图、近2000个事件,围绕认知智能技术,实现了于语义图网络的开放场景语义理解,在深度语义理解技术上又迈进了一大步。


地方动态

中国信息协会会长王金平一行赴北京国脉互联信息顾问有限公司调研

杜链同志追思会在京举办

赋能未来,共创数智化新纪元:中国信息协会集团企业数字化工作委员会正式成立

中国信息协会第四届信息技术服务业应用技能大赛新闻发布会在京召开

  • 协会要闻
  • 通知公告