您当前位置：展览 >> 展览介绍

ChatGPT指导AI,用魔法驯服魔法

“数百万人沉迷于和ChatGPT聊天对话。就连马斯克都为之疯狂，称这是「思想之树」。”

撰文｜史圣园

在电影《她》中，主人公西尔多和人工智能系统萨曼莎相恋了。她是体贴的、幽默的、忠诚的、聪慧的，无需多言，便能理解他的喜怒哀乐，恰到好处地提供情绪价值。

萨曼莎的细腻与体贴，其实源于机器学习（MachineLearning）技术：在与男主的日常沟通接触中，这些数据和反馈帮助萨曼莎变得更「懂他」。

这部年上映的电影所想象的世界，似乎即将在十年后的今天成为现实。上个月末，OpenAI发布ChatGPT后，数百万网友沉迷于和这个聪慧AI的聊天对话中。就连马斯克都为之疯狂，称这是「思想之树」。

12月15日，Science杂志公布了年度科学突破，创造性人工智能位列其中。

过去一年，无论是AI作画的强势出圈，还是ChatGPT令人惊叹的对话流畅性，都在直接告诉我们：创造、交流、思考，不再是人类独占的领域。

生成式AI让我们看到了新一代技术革命的可能性，但距离它们能够撑起万亿美元级别的市场，还有多远的路要走？中文世界又何时能诞生一款媲美ChatGPT的大模型应用？

ChatGPT，神功初成

GPT的全称，是「GenerativePre-Training」，翻译过来就是「生成式的预训练」。

ChatGPT，即「聊天GPT」，是OpenAI对GPT-3模型进行微调后，开发出来的聊天机器人。人们可以和它进行对话交流。

与此前不太机灵的聊天机器人前辈不同，ChatGPT不仅上知天文下知地理，像一位博闻强识的朋友；还能够记住聊天的上下文，真正像人类一样根据语境进行交流。

这并不是说ChatGPT拥有了人类的思维。本质上这是一个大量语言数据训练出来的概率模型，可以根据上文提示，预测下一个单词、下一句话应该是什么。

开放使用后，用户针对ChatGPT生成的回答进行反馈。这些反馈对于ChatGPT来说是非常重要的训练数据，和萨曼莎一样，ChatGPT也会越来越善解人意，顺应用户的期望来沟通交流。

虽然，现阶段ChatGPT的趣味性大过信息价值，但也有很多用户将它视为下一代生产力工具，并开发出了许多用法：学代码、写周报、编剧本、做高数……

ChatGPT有什么用？它自己的回答如下：文本生成、聊天机器人、问答系统、机器翻译。

一个名为gpt3demo的网站收录了使用GPT-3接口的所有应用，共计个，包括广告生成、指导生成式AI、博客写作、文案写作、浏览器扩展、BUG核查、A/BTest、聊天机器人、健康咨询、客服、代码生成、数据集生成、设计、文件提取、图片编辑等等。

「GPT-3是一个通用智能引擎，只要能形式化为语言的任务都可以用它来做。」复旦大学NLP在读博士孙天祥说。

比如写作。它不仅可以写作营销文案、周报总结，还可以模仿鲁迅、胡适创作诗歌和散文、以莫扎特的风格谱曲。虽然它写出来的文章中「废话文学」成分略高，但逻辑清晰、文辞恰当，应用在日常文档工作中基本没有违和感。

国外的效率工具们，诸如Notion、Craft、Canva等等，都在今年陆陆续续推出了自己的AI辅助写作助手。虽然他们目前使用的并非GPT技术，但理论上都是可以使用的。

ChatGPT还可以写代码。

即刻网友

机智的小榴莲用它将Python重构成Go，将一种代码快速转换为另一种代码；

Shenk用它写了一段可执行的扫雷小游戏代码；还有很多网友把ChatGPT当作全知全能的助教，一边请教一边学习代码。

即刻网友

张杰伊则认为，ChatGPT将编程工作变成了「写提示-ChatGPT生成代码-人工运行代码-将报错信息粘贴给ChatGPT-ChatGPT改Bug-程序运行成功」的流程，让低代码直接变成了零代码。

再比如搜索。你可以问它红烧排骨怎么做，也可以咨询「如何举办一场成功的展览」。它几乎阅读完成了互联网所有浩瀚的信息，总共阅读并记住了亿个词，模型有亿个参数。

虽然ChatGPT学习了海量的互联网数据，但它暂时还无法取代搜索引擎：一是时效性不足，二是准确性无法保障。

关于时效性，ChatGPT训练集的内容停留在年以前，对近一年来发生的事情知之甚少。胡天祥解释，「理论上是可以做到时效性的同步，把新加进来的材料继续训练就可以了，但是一般这会造成灾难性遗忘，也就是会忘记之前的部分学习材料，制约它时时更新的主要是成本」。

准确性不足，也是ChatGPT广为诟病的一点：它很擅长一本正经地胡说八道。

OpenAI的CEO，SamAltman表示，他们正试图阻止ChatGPT的随机编造，会依靠用户反馈来改进。

ChatGPT本尊也明确提示，自己和搜索引擎有着不同的目的和功能，不能互相取代。但它的确长成了搜索引擎想要进化成的模样：进一步降低信息筛选的门槛，用户可以通过单次搜索，得到一个近乎满意的答案。

最让人惊奇的应用，是用ChatGPT指导AI，用魔法驯服魔法。

随着AI作画的出圈，提示语生成（promptengineering）逐渐成为一门生意。好的提示语，能够帮助人与AI进行更高质量的对话，引导AI生成更符合要求的文字或图像。

初创公司PromptBase就提供了这样的服务交易平台，你可以花2-5美元购买「提示工程师」写的一串单词，复制到AI作画或者GPT-3的应用中，就能生成你期待的图像或文字。每单消费，PromptBase会收取20%的佣金。

而现在，你可以让睿智的ChatGPT帮你写提示语了。经网友测试，它果然比人类更懂AI，生成的提示语质量相当高。

商用，还有点难

ChatGPT出口成章的能力让人惊叹，但在真正的商业应用前，还需要解决两个问题：张口就来的问题和运维成本。

当被问道「红楼梦中贾宝玉适合娶谁」时，ChatGPT言之凿凿地说「贾母」；而当要求背诵观沧海时，它更是临时编造了一首诗，不打算对结果的准确性负责。

据Twitter网友的集体测试，ChatGPT的错误率在2%-5%左右。对于一个有趣的测试版聊天机器人来说，这样的表现无疑是优秀的；但如果要应用到严肃的商业场景，例如合同、公文的写作，尤其是对于模型精度要求很高的金融行业，还需要进一步训练输出结果的稳定性。

SamAltman也表示，现阶段让它不要胡说八道有点难：「让它与当前技术保持平衡是很棘手的。」

他们尝试依靠用户反馈来解决这一问题。SamAltman说，「用户的提问、对问题的反馈，都是非常重要的数据，这让OpenAI知道真实世界里用户的意图分布，基于这些才能让ChatGPT做得更好。」

不过，如果用户反馈中混杂了一定程度的错误信息，也许会使它的准确率受到影响。「比GPT-3小的预训练语言语言模型都会出现比较严重的偏向性，比如种族歧视、性别歧视等等，这是互联网上的数据分布造成的。」胡天祥解释道。

运行成本是另外一个难题：GPT-3的计算成本比搜索引擎大得多。

每天，搜索引擎都要服务数十亿个搜索请求。单次计算成本即使是微小的提升，放到这个数量级上，都是相当可观的真金白银。

SamAltman在社交媒体上称，目前ChatGPT单次回答（SingleTurn）的平均费用在几美分左右（约合几毛钱人民币）。虽然未来还会持续降低，但业界人士普遍认为，只有当成本缩减90%后，才有商业应用的经济适用性。

「不过现在看下来，他的部署速度还是挺快的了，国内部署的大模型都比它慢得多。」胡天祥认为，虽然成本的确是个制约，但其部署速度让人看到了近期商业化落地的可能性。

中国版OpenAI在哪里

其实，国内不是没有大厂在做类似的事。

根据公开资料，目前中国大模型参数量最大的是阿里的M6大模型，达到了万亿级别；百度文心、华为的盘古大模型，也有千亿的规模。

国内智源，IDEA，百度，阿里，华为，腾讯都有类似的大模型，比如GLM，CPM，ERNIE（百度），M6（阿里），盘古（华为）等等。虽然能力尚无法与GPT-3比肩，但其中一部分也已经被应用在业务。只不过，它们往往被应用在内部业务中，对外的并不多，因此知名度并不高。

百度文心，是国内少数对外开放的大模型应用之一，年开放给公众使用。它可以实现视频、歌词、艺术作品的自动生成，已被应用于百度内部的搜索、信息流、百度地图等产品中。

3个月前，百度发布了AI助理，提供给普通用户AI自动生成文字、图片等功能，还提出为创作者带来一套AI生产内容工具，更高效的生产视频内容。这意味着，百度的AI产品正式开始toC了。

就在前几天，由百度文心续画的陆小曼未尽画稿，和海派画家续画的同名画作，共计以万元的高价落槌。一方面，让人看到了AI+艺术的商业价值，另一方面，也能看出百度对于商业变现的迫切性。

在飞桨平台上，我们也可以体验类似于ChatGPT的功能，但显然它的语义理解能力还有待增强。当我们问它「文心大模型是什么」时，它没能对自己进行一个流畅的自我介绍，生成的文字也显得前言不搭后语。

为什么国内的模型，在效果上无法媲美OpenAI呢？

一是中文领域的难度更大。「中文训练数据一来确实少，二来质量低。」胡天祥说，即使是ChatGPT的英文处理也显著优于中文处理。中文互联网世界里，各大APP相对割裂，可供AI训练的公共内容远不及英文素材丰富。

第二，技术的进步，需要长久而持续的投入。「OpenAI的团队年放出GPT-3后就一直在维护和更新，不断收集用户反馈和真实的数据，慢慢形成了数据壁垒。」

千亿级别的大模型，显卡的算力成本需要在千张以上。像GPT这样拥有亿参数的大模型，运算一次要花万美金，跟发射一个卫星的成本差不多。商业前景不明朗，又需要不计成本的投入，对大厂来说这不划算。

另一方面，国内大厂的科研团队隶属于公司，节奏紧张，很难避免商业变现的压力；而OpenAI自成立之初，便将自己定位为「非营利组织」，更类似于研究院的性质，招徕顶尖的科研人才。当然，微软的投资给了OpenAI烧钱做研究的底气。

值得注意的是，OpenAI发布的关于ChatGPT的论文中，共有8位主要作者，其中3位的姓名是中文拼音。他们或许来自中国，或许是华裔。而网络领域顶会（SIGCOMM）的期刊中，每年都会收录几篇来自于阿里、华为等公司的研究论文。这说明国内AI领域，不缺乏优秀的基础研究者。

我们缺乏的，可能是耐心。中金基金的研究报告中曾写道，「实力雄厚的美国互联网巨头对AI底层技术战略性投入力度较大，但中国的AI产业主要受需求拉动，大多数AI公司布局应用层。」

好消息是，ChatGPT的成功出圈，让资本和业界都看到了它不可估量的商业潜力。

年被很多人称为「AIGC元年」，此前默默无闻的大模型赛道，今年融资也多了起来，单笔融资金额高达10亿元，联想创投、创新工场等知名投资机构均参与其中。

这意味着，会有更多初创公司加入这场需要耐心和毅力的长跑。与大厂不同，它们或许能以更聚焦的技术输出全情投入，为中文世界的生成式AI积累点滴珍贵的创新。

转载请注明：http://www.abachildren.com/sszl/3359.html

上一篇文章：被称为俏丽小江南的安康,期待你来打卡

下一篇文章：花城看花来从化第二届广州国际流溪花

地址: 联系电话：

当前时间：