最近,ChatGPT相关的话题属实是火过了头了,我最近也在跟朋友广泛交流,聊到不少有趣的话题,在此做了一个梳理,分享给大家。

1、ChatGPT背后的大模型和搜索引擎、传统语音助手有什么关系?

首先,我并不认为大语言模型可以替代搜索引擎——应该说,叠加在搜索引擎之上,我们得到的是一种大模型驱动的、以自然语言为界面的信息服务。这两者之间并不产生相互替代的关系,某种意义上更多是上下游产品价值的延伸。从New Bing的表现来看,大模型和搜索引擎作为相辅相成的整体,很快会成为一种常态。不过虽然不是取代关系,大模型的确正在松动固化已久的搜索引擎的市场格局——根据移动互联网研究公司Data.ai的统计,微软必应搜索的应用下载量,在全球范围内增长了8倍。而在同一时间内,谷歌搜索的应用下载量下跌了2%。

尤其是最近ChatGPT引入了插件系统,ChatGPT浏览版可以说完全克服了数据滞后的问题,官方Demo视频更是演示了找餐馆、提供菜谱、算卡路里、网购食材等操作,说实话,某种程度在也在挤占搜索的场景。


(资料图)

但,相对传统聊天机器人而言,大模型就无疑是替代关系了。不管是Siri、还是微软曾经的小娜、百度的小度、小米的小爱机器人、亚马逊的Alexa等,它们都属于早期状态的语音助手。跟这些助手交流的时候,你会发现只能依赖命令的方式达成沟通——它其实不存在所谓的智能,从技术原理上面讲的话,它仅仅把语音转换成了文字,文字再去匹配某些预置的命令格式,由此帮你自动化执行相关的命令。

这次,大语言模型最大的进步是,它明显不再局限于魔法词了,你感觉它真像是一个有智慧的的助手,在交流的时候,你可以用一些更模糊、更抽象的方式跟他交流,不需要再精确到命令子集的地步就能使他会意,这无疑是会替代掉所有传统语音助手的。

2、如何理解“NL(自然语言) is the New UI”?

除了大算力、免费策略作为支撑,引入自然语言交互界面,是ChatGPT此番出圈儿的关键,正因为此,大模型的魅力才被放大出来,能够以一个对大众友好的产品化方式走向市场,这跟2000年互联网的爆发(从软件下载安装到web端访问)和2007年的移动互联网(也就是黄仁勋最近提到的iPhone时刻)很像,凡是重大的技术范式变革都是因为新的交互范式的出现,从而引爆消费级市场的。

其实AI这件事在我们的日常生活中是随处可见的,其实我们每天刷短视频、逛电商,本身也是在跟隐藏在背后的推荐系统交互,它们也是垂直品类的人工智能系统,只不过它的input是用户身份和行为特征,output是个性化推荐服务;相比之下,以ChatGPT为代表的大模型自然语言的交互形式明显更有冲击力,输入是问题,即刻返回的是答案,完全不局限于单一的任务类型,覆盖代码生成、搜索、翻译、咨询、唠嗑等各种场景——这意味着,自然语言作为新的、通用的交互方式,将推动Model As a Service for Everything惠及越来越多的C端消费者。

3、为什么无代码和ChatGPT生成代码就像左脑和右脑?

每当我们面对一种新的开发方式时,“XXX能取代程序员吗?”总会成为人们热议的话题——这个话题的反面实际上是在探讨“如何让越来越多普通人能够脱离代码的束缚,同时又能够进行编程?从这个意义上看,无论GPT生成式代码,还是惯常意义上的无代码开发,都是为了让更多有想法、有洞察但代码无能的人实现编程自由。数据显示,现在全球有编程能力的人只有 1300 万, 1400 万左右就只占全球人口 0.33% 左右的一个比例。

因此大家觉得,GPT 4发布会上展示的一张草图的照片就能生成一段可运行代码的操作,简直炫酷到姥姥家了。但是从实际落地层面来说,大家会发现即使 AI 可以产出代码,但这个代码离真正可以被部署到生产环境,或者说被任何的有价值的业务逻辑给使用起来,中间还有非常大的一个gap。

再说,大语言模型的代码产出是没办法让人完全信任的,因为它总会有一些“自以为是的合理想象”,也就是说在完全的精准度上面还是需要进一步提升的。这个代码如果给到一个完全没有技术背景的同学,他其实是很难分辨好和坏的。作为自然语言大家都可以看得懂,但是作为代码的话,它这个壁垒本身的存在会造成它离真正安全交付和使用的话还有一段距离。

相比较而言,无代码选择了对代码进行可视化封装的方式,门槛也比传统意义上面编程会显著低 10 倍以上,那对没有技术背景的人来说,就能容易地进行测试和结果评审,去评估安全性、可用性以及稳定性等等,毕竟我们也在背后做了很多的投入——包括怎么样把应用从可视化的变成真正交付的过程当中,这个自动托管的服务器的部分,都是由我们平台来进行提供的。

从GPT生成代码和无代码开发的特性来看,我反倒觉得,无代码和AI在场景上的融合,反而是一个非常明显的大趋势,微软也已经把自家的无代码平台Power APP与ChatGPT 做了整合。我喜欢把这二者比喻成左脑和右脑的关系,大模型更像是一个感性的右脑,他会理解你的需求和意图,而可视化的无代码平台更像一个理性的、可信赖的左脑。大模型擅长“循循善诱”,一层层把你的需求翻译出来,无代码平台擅长逻辑编排、稳定交付,两相结合的话,我们的开发工作流很可能会被重构,自动化水平大幅度提高。

就Zion已经在做的事情来看,我们主要从两个角度切入与AI场景的结合。第一个阶段,我们通过和AI的整合来提升开发效率,这跟微软推出的基于office场景的copilot能力有异曲同工之妙,通过自然语言的交互,你可以快速把意图表达给我们的系统,大语言模型理解后,会自动化调用系统的能力快速搭建起来某个应用交付给你,就像copilot交付PPT、word大纲一样;当然,为了让这个工作流顺利构建起来,我们会在前期投入了更多精力做好工具能力的封装,比如GPT的能力、文心一言的能力等。

那第二个阶段的话,随着模型的训练, AI 甚至可以扮演产品经理和设计师的角色,如果你可以提供一个完整的PRD的话,我们的系统可以把它直接翻译成一个软件,然后可以进行快速验证, MVP 的上线进行测试等;或者说,它可以和你一起共创产出这个PRD文档,在这个跟AI沟通和互动的这个过程当中,其实就是逐渐帮助你把你的需求和软件的诉求梳理出来。

而在传统的流程当中,作为业务方,你会跟一个产品经理沟通,产品经理会跟设计、工程师、运维沟通,然后最后会回到测试这边,整个形成一个闭环。在有AI和无代码工具加持的情况下,有些环节前期就可以自动化掉,当 AI 没办法提供这个能力的时候,那产品经理、设计师、工程师可以再介入进来。

4、AI到底会不会取代你的工作?学会跟AI沟通得有多重要?

我们可以看到,AI在很多领域都已经有了如鱼得水的表现,国外有两家叫做 Jasper AI 和 copy AI 的公司,走得比较靠前,他们是最早参与GPT 3测试的服务商,主要利用GPT 文字生成的能力,面向营销场景生成、润色推广文案,比如可以帮助用户一句话描述你的产品,同时也能生成详细的产品描述,Jasper在18个月内就实现了8000万美金的营收。

图片生成领域的Midjourney也是AIGC领域的一个现象级应用,在一年之内就实现了1000万用户和1亿美金的营收。作图领域的鼻祖Adobe,也已经推出了自己的AI产品Firefly,凭借积累的大量营销素材,通过和大语言模型能力的整合,它可以把很多素材可以更高效的混合到这个新生产力工具的工作流里面,进一步加速生产力的提升。

具体到更多的细分领域,大家可以参考一下OpenAI Starup Fund的pofolio,可以参考官方视角来判断哪些行业将会受到AI的重构。

虽然AI已经在各个领域八仙过海各显神通了,但取代你的永远不会是AI,而是会用AI的人。微软其实是很会取名字的——我认为AI 在这里扮演的一角色确实很像一个副驾(copilot),有一个副驾来帮助你可以更好地产出,相较于独自开车肯定是更有效率的。

我认为最受 ChatGPT 这一代模型冲击的,会是一些比较初级的技能掌握者或者知识密集型工种。但对于真的非常资深的人来说,包括工程师、设计师等等,他们真正的壁垒已经不是某种技能属性了,而是对行业的认知和洞察,评判什么才是优质产出物的taste——这种分辨能力是没办法被替代的,因为你肯定比一个通用的 AI 更了解你的客户,更了解上下文的情境——其中包括时机、人的喜好、禁忌方方面面的拿捏,然后再与行业的知识融汇贯通,自会形成人作为生产力的壁垒。

具体到程序员这个职业来看,真正的壁垒不在于代码细节,而在于更宏观的架构设计,软件开发本质上是为了解决具体的用户需求和业务诉求,那如何理解这些诉求、以及怎样去拆解问题,并给出真正能消灭问题的解决方案,然后怎么把这个解决方案翻译成代码的这个部分的话,那在这个新的时代背景下可能已经十分偏向于体力劳动了。

那么,对于初入行的朋友,在新的语境下,Work Smart 比Work Hard变得更加重要,要提升自己在职场中的竞争力,学会和AI沟通将会是一个必要的条件。类比2000年左右的时候,我们在学校里都会学习微软office套件,再后来学会使用搜索引擎也成了下一个10年的基操,所以,工具本身并不会替代太多人,甚至也不会从根本上面影响到绝大多数的工种。但是你会不会使用 AI 的能力?怎么和 AI 互通啊?这样的能力,会是你未来的核心竞争力的一部分。

当然,今天我们可能又不可避免地要重新学习微软的office套件了(或者学习类似的产品),只是不一样的地方在于,以前学的是微软给你设计的规则,现在是通过自然语言交互就能把工具用起来,相当于可以本能地把思考方式植入到你和系统交互的过程当中。拿编程来讲,之前都是人在学习机器的语言,但是有了大语言模型之后,你可以让机器来理解人的自然语言了,现在office也需要理解你的意图来做事情了。

而如何清晰准确地描述需求和目标,将是下一个时代能否用好工具利用好AI能力最核心的能力,越清晰的目标越能发挥AI小秘的强大能力。

最近兴起来的Prompt Engineer强调的就是和AI沟通的能力,如果你试过AI出图的话,你会发现,当你使用了人类在正常沟通过程当中不会用的词,或者说不会用的那个词语的结构的时候,产出的效果会出奇地好。Prompt Engineer虽然是叫Engineer,但这个岗位最喜欢招的是文科生,会发现文科生非常天马行空,文字表达能力也会更强,会发现就用了更灵活的一些词,给到 AI 沟通的时候它效果会更好,这跟更强调命令编程思维方式的时代是完全不一样的。

从国内企业的角度来讲,我们面临的是一个前所未有的、鸡尾酒形态的数字化浪潮,SaaS、无代码、AI这些变革一浪未平一浪又起,好些企业可能连信息化都没有真正完成,怎么才能参与到这个进程中来呢?

我一直把数字化这件事分成三层来看待,也就是交互层、业务逻辑层和数据层。在所有数字化的过程中,第一步一定是业务数据化,达成初期采集数据、结构化数据这个目标,企业可以尽可能选择一些轻量化、低风险、负担小的切入方式,最简单的就是挑选一些适合自己业务场景的工具,或者使用无代码的方式快速搭建一些符合自己业务需求的应用;如果说是可以直接产生价值的话,建议从偏营销、偏运营的一些场景入手。

很多企业都会有一个误区,觉得数字化的第一步是招工程师,这个其实是错的。事实上,数字化转型第一步是要找到一个PM,因为他在这里扮演的一个角色是把业务的需求翻译成数字化的产品。这个人可能只是扮演产品经理的角色,但未必非得是一个产品出身的人,他可能是你信息化部门的负责人,也可能是你们业务部门里面喜欢技术的某个同学。有个这个人,后续工具的落地就会比较容易了。

无论如何,对于商业痛点的判定、对于目标受众的考量、业务逻辑的梳理,都是先于开发工作而存在的。

5、怎么理解“软件吞噬世界,AI吞噬软件”?

我对这件事情的一个简洁判断是,我觉得所有的软件都会要被 AI 重新做一遍,未来AI会变成像云服务一样的基础设施,在未来的软件世界里,在旧的软件世界里,人机交互是重点,而在新的软件世界里,人机协作才是题中之义。关于具体的场景前面的内容我们也提到了不少,这里我们也可以参考下GPT根据这个趋势给出的一些论断。

By GPT 3.5

关键词: