刀哥

2023-02-21 21:10

深度剖析chatGPT&外贸人效率革命

大家晚上好，我是刀哥。

今天谈谈ChatGPT，以及chatGPT对外贸人的影响。全文很长，希望你耐心看完。如果你没有耐心，可以私信或者留言刀哥，咱再聊聊。

如果总结来看，这可能是一个划时代的产品，一如当年的搜索引擎。这也是谷歌如此紧张的原因。

谷歌SEO，谷歌搜索是外贸人现在用的比较多的拓展方式，想想未来有一天谷歌SEO、搜索都被替代了，你用什么找客户。谷歌多紧张，一个例子就看到了。

微软的bing搜索引擎已经有了chat的入口了：

如果用简单总结这个产品，如下：这是一个基于前期巨大的“人工投喂”+“人工排序”之后，再自我进化整合出来的一个聊天式的智能AI解决方案，可以用于大量的行业。

对外贸人当然是有帮助的，很多外贸人都已经在用chatGPT写开发信了。但总结来说，目前对外贸人的帮助是以下几点：

1. 写公司产品介绍，文章（自带翻译）；

2. 写开发信，这个大家见识了华丽的辞藻；

当然，回复客户问题，写开发信，写邮件等等，这些是现在外贸人用chatGPT应该是最多的。当我们不明白怎么回复客户的时候，问问chatGPT是一个好的选择。这点会替代很多外贸运营的工作。

3. 做基础查询；

比如查询海关编码，这个会比搜索出来更准确。比如做港口查询，这个也会更加方便。比如做汇率查询，比如做美联储基准利率查询等等，这些都会很准确。

4. 做网站；

这点已经有人开始率先做了。通过chatGPT建站，找到当前的热门产品是什么，快速跟进做出一些自建站出来。但这种方式不适合大部分外贸人，因为大部分外贸人都是做自己熟悉的产品。热点产品并不是自己熟悉的产品。你让我从3D打印换到珠宝黄金，我供应链都搞不定啊。

5. 找客户。

目前看，还很难通过chatGPT去找客户。但是这个可以憧憬下，未来大部分公司一旦接入到chapGPT以后，这玩意的威力还是无穷的。

而且chatGPT提供API接口，你可以畅想下，未来所有的公司都会通过这种方式介入chatGPT。怎么类比呢，就好比今天建站是大家都想做的事情，或者是一个标配，未来你的网站、公司产品接入chatGPT也是标配。

但就当前情况来看，对外贸人的影响已经出现了。chatGPT 会给外贸人带来一场效率革命，可能分为三个阶段。

1. 红利效率阶段

早入场的人有极大的套利空间，运营效率直接提升，想想以前你需要3-5个外贸运营，现在可能只需要1个就够了。这会带来公司运营效率的提升。特别是针对一些大型品牌公司，比如安克、小米这样的公司，chatGPT对他们的帮助应该是方方面面的。而对于有规模的小型外贸公司，同样有很大帮助。

2. 场景普及阶段

技术场景成熟后，开始有很多know how，转化为应用或者解决方案，向行业普及。比如关于3D打印这个行业，一旦技术场景熟练以后，全世界有采购3D打印需求的公司都会去找chatGPT去问，怎么做这玩意，去哪里采购？chatGPT当然会推荐一些在chatGPT上面做行业解决方案普及的公司。你公司过往提供所有的关于3D打印的普及的知识，chatGPT都会记录下来。要知道，chatGPT的核心能力就是有大数据搜集能力，同时通过算法去处理这些数据，转化为大家知道的东西。

你仔细想想，到这一步，你会带来多少订单？

3.行业标普阶段

诸如我上面说的一样，这个时间段就跟你建站一样，是标配。你公司还没有接入chatGPT，就说明你这公司不行。你没有应用chatGPT你可能就会被淘汰。

以上时间阶段，我个人的判断是第一阶段大概要持续半年到一年；第二阶段需要更长的时间，因为第二阶段是需要UGC（即全球的行业用户给chatGPT生产内容，不同于普通用户），这一步估计要3-5年。第三阶段，就是5年以后。

我们可以等待三五年见证这个时刻。

当然，以上只是个人简单的看法，仅供您参考。

接下来我们剖析下chatGPT到底是什么。

ChatGPT全称Chat Generative Pre-trained。GPT的意思是生成式预训练转换器)，是一种基于互联网可用数据训练的文本生成深度学习模型。

GPT是众多LLM中的一种模型。LLM全称Large Language Model（中文翻译，大型语言模型）。

ChatGPT作为一个对话模型，到底是如何运作的呢？ChatGPT也被称作GPT-3.5，与去年公布的InstructGPT是一对姊妹模型。

ChatGPT是InstructGPT的兄弟模型(sibling model)，后者经过训练以遵循Prompt中的指令，提供详细的响应。InstructGPT是OpenAI在2022年3月在Training language models to follow instructions with human feedback文献中提出的工作，整体流程和以上的ChatGPT流程基本相同，除了在数据收集和基座模型（GPT3 vs GPT 3.5），以及第三步初始化PPO模型时略有不同。

两者在训练方式和模型结构上完全一致，所以可以简单通过InstructGPT来理解ChatGPT的训练细节及模型。

其训练步骤分为三步，分别是SFT、RM、PPO。

1. SFT全称为Supervised Fine-Tuning，本质是对数据进行优化。

为了让GPT 3.5初步具备理解指令的意图，首先会在数据集中随机抽取问题，由人类标注人员，给出高质量答案，然后用这些人工标注好的数据来微调 GPT-3.5模型（获得SFT模型, Supervised Fine-Tuning）。此时的SFT模型在遵循指令/对话方面已经优于 GPT-3，但不一定符合人类偏好。

你可以理解，第一步是人工训练。但这种方式，有个很大的缺点是不具备判断能力。比如，模型给出了A、B、C、D四个答案，用户还得判断，哪一个自己才是自己想要的。

2. 训练奖励模型（Reward Mode，RM）这个阶段的主要是通过人工标注训练数据（约33K个数据），来训练回报模型。

在数据集中随机抽取问题，使用第一阶段生成的模型，对于每个问题，生成多个不同的回答。人类标注者对这些结果综合考虑给出排名顺序。这一过程类似于教练或老师辅导。接下来，使用这个排序结果数据来训练奖励模型。对多个排序结果，两两组合，形成多个训练数据对。RM模型接受一个输入，给出评价回答质量的分数。这样，对于一对训练数据，调节参数使得高质量回答的打分比低质量的打分要高。

3. PPO （Proximal Policy Optimization，近端策略优化）

PPO的核心思路在于将Policy Gradient中On-policy的训练过程转化为Off-policy，即将在线学习转化为离线学习，这个转化过程被称之为Importance Sampling。这一阶段利用第二阶段训练好的奖励模型，靠奖励打分来更新预训练模型参数。在数据集中随机抽取问题，使用PPO模型生成回答，并用上一阶段训练好的RM模型给出质量分数。把回报分数依次传递，由此产生策略梯度，通过强化学习的方式以更新PPO模型参数。如果我们不断重复第二和第三阶段，通过迭代，会训练出更高质量的ChatGPT模型。

你可以理解：第一步是人工投喂（需要海量的数据），第二部是人工排序，第三步是整合进化。

在现阶段，只要输入问题，ChatGPT 就能给予回答，这其实给搜索带来巨大的影响。

当然，目前我们感受到的ChatGPT的“智力”是相当强大的，包括我们看到很多特别耳目一新的回答，不俗的编程能力。但是，ChatGPT也有一些局限性。还在不断地进步。

1）ChatGPT在其未经大量语料训练的领域缺乏“人类常识”和引申能力，甚至会一本正经的“胡说八道”。ChatGPT在很多领域可以“创造答案”，但当用户寻求正确答案时，ChatGPT也有可能给出有误导的回答。

2）ChatGPT无法处理复杂冗长或者特别专业的语言结构。对于来自金融、自然科学或医学等非常专业领域的问题，如果没有进行足够的语料“投喂”，ChatGPT可能无法生成适当的回答。

3）ChatGPT需要非常大量的算力（芯片）来支持其训练和部署。抛开需要大量语料数据训练模型不说，在目前，ChatGPT在应用时仍然需要大算力的服务器支持，而这些服务器的成本是普通用户无法承受的，即便数十亿个参数的模型也需要惊人数量的计算资源才能运行和训练。如果面向真实搜索引擎的数以亿计的用户请求，如采取目前通行的免费策略，任何企业都难以承受这一成本。因此对于普通大众来说，还需等待更轻量型的模型或更高性价比的算力平台。

大模型是当前的其中一个AI研究方向，还有其它研究方向，也就是说，AI需要拼算力这逻辑是永恒的逻辑。很多人说英伟达是最受益的，是很有道理的。

（ChatGPT主要涉及AI自然语言处理相关技术，底层算力芯片以高性能GPU为主。而该类芯片中英伟达占据主要市场，英伟达的芯片为大模型训练做了很多优化。英伟达CEO黄仁勋在参加加利福尼亚大学Berkeley Haas 商学院的Dean’s Speaker 系列谈话时，也大赞了“ChatGPT的出现对人工智能领域的意义，类似手机领域iPhone的出现。”）

4）ChatGPT还没法在线的把新知识纳入其中。

当然，虽然是局限，但这也不影响ChatGPT的大火，毕竟未来可期。而且，这次也带动了全球AI建设的暴发。2023年全球进入了AI时代元年，未来AI全球建设规模一定是现在的成百上千倍。

从下游受益应用来看，包括但不限于内容创作、无代码编程、小说生成、对话类搜索引擎、语音陪伴、语音工作助手、对话虚拟人、人工智能客服、机器翻译、芯片设计等都会受益。而从上游增加需求来看，包括算力芯片、数据标注、自然语言处理（NLP)等。

另一个讨论较多的方向，是ChatGPT对于搜索引擎的代替性：ChatGPT目前可以作为搜索引擎的有效补充，但至于是否能代替搜索引擎还有2个因素阻碍：成本+答案的丰富性。

但不可否认，这是一个划时代的产品。随着AI的持续发展，不久就能替代很多人的工作。

正如有博主所说的一样：“最近一些关于ChatGPT和 Bing Chat的文章，就和19 世纪认为照相机是种妖术会摄魂一个意思。”

各位晚安。各位的“点赞”、“在看”是对刀哥最大的支持。