.

ChatGPT指导AI,用魔法驯服魔法

“数百万人沉迷于和ChatGPT聊天对话。就连马斯克都为之疯狂,称这是「思想之树」。”

撰文|史圣园

在电影《她》中,主人公西尔多和人工智能系统萨曼莎相恋了。她是体贴的、幽默的、忠诚的、聪慧的,无需多言,便能理解他的喜怒哀乐,恰到好处地提供情绪价值。

萨曼莎的细腻与体贴,其实源于机器学习(MachineLearning)技术:在与男主的日常沟通接触中,这些数据和反馈帮助萨曼莎变得更「懂他」。

这部年上映的电影所想象的世界,似乎即将在十年后的今天成为现实。上个月末,OpenAI发布ChatGPT后,数百万网友沉迷于和这个聪慧AI的聊天对话中。就连马斯克都为之疯狂,称这是「思想之树」。

12月15日,Science杂志公布了年度科学突破,创造性人工智能位列其中。

过去一年,无论是AI作画的强势出圈,还是ChatGPT令人惊叹的对话流畅性,都在直接告诉我们:创造、交流、思考,不再是人类独占的领域。

生成式AI让我们看到了新一代技术革命的可能性,但距离它们能够撑起万亿美元级别的市场,还有多远的路要走?中文世界又何时能诞生一款媲美ChatGPT的大模型应用?

ChatGPT,神功初成

GPT的全称,是「GenerativePre-Training」,翻译过来就是「生成式的预训练」。

ChatGPT,即「聊天GPT」,是OpenAI对GPT-3模型进行微调后,开发出来的聊天机器人。人们可以和它进行对话交流。

与此前不太机灵的聊天机器人前辈不同,ChatGPT不仅上知天文下知地理,像一位博闻强识的朋友;还能够记住聊天的上下文,真正像人类一样根据语境进行交流。

这并不是说ChatGPT拥有了人类的思维。本质上这是一个大量语言数据训练出来的概率模型,可以根据上文提示,预测下一个单词、下一句话应该是什么。

开放使用后,用户针对ChatGPT生成的回答进行反馈。这些反馈对于ChatGPT来说是非常重要的训练数据,和萨曼莎一样,ChatGPT也会越来越善解人意,顺应用户的期望来沟通交流。

虽然,现阶段ChatGPT的趣味性大过信息价值,但也有很多用户将它视为下一代生产力工具,并开发出了许多用法:学代码、写周报、编剧本、做高数……

ChatGPT有什么用?它自己的回答如下:文本生成、聊天机器人、问答系统、机器翻译。

一个名为gpt3demo的网站收录了使用GPT-3接口的所有应用,共计个,包括广告生成、指导生成式AI、博客写作、文案写作、浏览器扩展、BUG核查、A/BTest、聊天机器人、健康咨询、客服、代码生成、数据集生成、设计、文件提取、图片编辑等等。

「GPT-3是一个通用智能引擎,只要能形式化为语言的任务都可以用它来做。」复旦大学NLP在读博士孙天祥说。

比如写作。它不仅可以写作营销文案、周报总结,还可以模仿鲁迅、胡适创作诗歌和散文、以莫扎特的风格谱曲。虽然它写出来的文章中「废话文学」成分略高,但逻辑清晰、文辞恰当,应用在日常文档工作中基本没有违和感。

国外的效率工具们,诸如Notion、Craft、Canva等等,都在今年陆陆续续推出了自己的AI辅助写作助手。虽然他们目前使用的并非GPT技术,但理论上都是可以使用的。

ChatGPT还可以写代码。

即刻网友

机智的小榴莲用它将Python重构成Go,将一种代码快速转换为另一种代码;

Shenk用它写了一段可执行的扫雷小游戏代码;还有很多网友把ChatGPT当作全知全能的助教,一边请教一边学习代码。

即刻网友

张杰伊则认为,ChatGPT将编程工作变成了「写提示-ChatGPT生成代码-人工运行代码-将报错信息粘贴给ChatGPT-ChatGPT改Bug-程序运行成功」的流程,让低代码直接变成了零代码。

再比如搜索。你可以问它红烧排骨怎么做,也可以咨询「如何举办一场成功的展览」。它几乎阅读完成了互联网所有浩瀚的信息,总共阅读并记住了亿个词,模型有亿个参数。

虽然ChatGPT学习了海量的互联网数据,但它暂时还无法取代搜索引擎:一是时效性不足,二是准确性无法保障。

关于时效性,ChatGPT训练集的内容停留在年以前,对近一年来发生的事情知之甚少。胡天祥解释,「理论上是可以做到时效性的同步,把新加进来的材料继续训练就可以了,但是一般这会造成灾难性遗忘,也就是会忘记之前的部分学习材料,制约它时时更新的主要是成本」。

准确性不足,也是ChatGPT广为诟病的一点:它很擅长一本正经地胡说八道。

OpenAI的CEO,SamAltman表示,他们正试图阻止ChatGPT的随机编造,会依靠用户反馈来改进。

ChatGPT本尊也明确提示,自己和搜索引擎有着不同的目的和功能,不能互相取代。但它的确长成了搜索引擎想要进化成的模样:进一步降低信息筛选的门槛,用户可以通过单次搜索,得到一个近乎满意的答案。

最让人惊奇的应用,是用ChatGPT指导AI,用魔法驯服魔法。

随着AI作画的出圈,提示语生成(promptengineering)逐渐成为一门生意。好的提示语,能够帮助人与AI进行更高质量的对话,引导AI生成更符合要求的文字或图像。

初创公司PromptBase就提供了这样的服务交易平台,你可以花2-5美元购买「提示工程师」写的一串单词,复制到AI作画或者GPT-3的应用中,就能生成你期待的图像或文字。每单消费,PromptBase会收取20%的佣金。

而现在,你可以让睿智的ChatGPT帮你写提示语了。经网友测试,它果然比人类更懂AI,生成的提示语质量相当高。

商用,还有点难

ChatGPT出口成章的能力让人惊叹,但在真正的商业应用前,还需要解决两个问题:张口就来的问题和运维成本。

当被问道「红楼梦中贾宝玉适合娶谁」时,ChatGPT言之凿凿地说「贾母」;而当要求背诵观沧海时,它更是临时编造了一首诗,不打算对结果的准确性负责。

据Twitter网友的集体测试,ChatGPT的错误率在2%-5%左右。对于一个有趣的测试版聊天机器人来说,这样的表现无疑是优秀的;但如果要应用到严肃的商业场景,例如合同、公文的写作,尤其是对于模型精度要求很高的金融行业,还需要进一步训练输出结果的稳定性。

SamAltman也表示,现阶段让它不要胡说八道有点难:「让它与当前技术保持平衡是很棘手的。」

他们尝试依靠用户反馈来解决这一问题。SamAltman说,「用户的提问、对问题的反馈,都是非常重要的数据,这让OpenAI知道真实世界里用户的意图分布,基于这些才能让ChatGPT做得更好。」

不过,如果用户反馈中混杂了一定程度的错误信息,也许会使它的准确率受到影响。「比GPT-3小的预训练语言语言模型都会出现比较严重的偏向性,比如种族歧视、性别歧视等等,这是互联网上的数据分布造成的。」胡天祥解释道。

运行成本是另外一个难题:GPT-3的计算成本比搜索引擎大得多。

每天,搜索引擎都要服务数十亿个搜索请求。单次计算成本即使是微小的提升,放到这个数量级上,都是相当可观的真金白银。

SamAltman在社交媒体上称,目前ChatGPT单次回答(SingleTurn)的平均费用在几美分左右(约合几毛钱人民币)。虽然未来还会持续降低,但业界人士普遍认为,只有当成本缩减90%后,才有商业应用的经济适用性。

「不过现在看下来,他的部署速度还是挺快的了,国内部署的大模型都比它慢得多。」胡天祥认为,虽然成本的确是个制约,但其部署速度让人看到了近期商业化落地的可能性。

中国版OpenAI在哪里

其实,国内不是没有大厂在做类似的事。

根据公开资料,目前中国大模型参数量最大的是阿里的M6大模型,达到了万亿级别;百度文心、华为的盘古大模型,也有千亿的规模。

国内智源,IDEA,百度,阿里,华为,腾讯都有类似的大模型,比如GLM,CPM,ERNIE(百度),M6(阿里),盘古(华为)等等。虽然能力尚无法与GPT-3比肩,但其中一部分也已经被应用在业务。只不过,它们往往被应用在内部业务中,对外的并不多,因此知名度并不高。

百度文心,是国内少数对外开放的大模型应用之一,年开放给公众使用。它可以实现视频、歌词、艺术作品的自动生成,已被应用于百度内部的搜索、信息流、百度地图等产品中。

3个月前,百度发布了AI助理,提供给普通用户AI自动生成文字、图片等功能,还提出为创作者带来一套AI生产内容工具,更高效的生产视频内容。这意味着,百度的AI产品正式开始toC了。

就在前几天,由百度文心续画的陆小曼未尽画稿,和海派画家续画的同名画作,共计以万元的高价落槌。一方面,让人看到了AI+艺术的商业价值,另一方面,也能看出百度对于商业变现的迫切性。

在飞桨平台上,我们也可以体验类似于ChatGPT的功能,但显然它的语义理解能力还有待增强。当我们问它「文心大模型是什么」时,它没能对自己进行一个流畅的自我介绍,生成的文字也显得前言不搭后语。

为什么国内的模型,在效果上无法媲美OpenAI呢?

一是中文领域的难度更大。「中文训练数据一来确实少,二来质量低。」胡天祥说,即使是ChatGPT的英文处理也显著优于中文处理。中文互联网世界里,各大APP相对割裂,可供AI训练的公共内容远不及英文素材丰富。

第二,技术的进步,需要长久而持续的投入。「OpenAI的团队年放出GPT-3后就一直在维护和更新,不断收集用户反馈和真实的数据,慢慢形成了数据壁垒。」

千亿级别的大模型,显卡的算力成本需要在千张以上。像GPT这样拥有亿参数的大模型,运算一次要花万美金,跟发射一个卫星的成本差不多。商业前景不明朗,又需要不计成本的投入,对大厂来说这不划算。

另一方面,国内大厂的科研团队隶属于公司,节奏紧张,很难避免商业变现的压力;而OpenAI自成立之初,便将自己定位为「非营利组织」,更类似于研究院的性质,招徕顶尖的科研人才。当然,微软的投资给了OpenAI烧钱做研究的底气。

值得注意的是,OpenAI发布的关于ChatGPT的论文中,共有8位主要作者,其中3位的姓名是中文拼音。他们或许来自中国,或许是华裔。而网络领域顶会(SIGCOMM)的期刊中,每年都会收录几篇来自于阿里、华为等公司的研究论文。这说明国内AI领域,不缺乏优秀的基础研究者。

我们缺乏的,可能是耐心。中金基金的研究报告中曾写道,「实力雄厚的美国互联网巨头对AI底层技术战略性投入力度较大,但中国的AI产业主要受需求拉动,大多数AI公司布局应用层。」

好消息是,ChatGPT的成功出圈,让资本和业界都看到了它不可估量的商业潜力。

年被很多人称为「AIGC元年」,此前默默无闻的大模型赛道,今年融资也多了起来,单笔融资金额高达10亿元,联想创投、创新工场等知名投资机构均参与其中。

这意味着,会有更多初创公司加入这场需要耐心和毅力的长跑。与大厂不同,它们或许能以更聚焦的技术输出全情投入,为中文世界的生成式AI积累点滴珍贵的创新。




转载请注明:http://www.abachildren.com/sszl/3359.html