“我相信存在一个新的模式——CaaS(ConsultingasaService)”
口述|鲍捷
整理
媛元
出品|极新当下大模型进入千行百业,金融作为数据安全保密性要求最高的行业之一,对大模型的应用非常审慎。
“大模型的基本技术原理非常复杂,但我想用比较简单的比喻来说明。不同的动物会根据环境的不同进化出不同的特征,而人类的DNA虽然相同,但我们可以在不同的环境中游泳、跑步、打猎等,这是因为人类具有泛化能力。人类本质上是一种软件,大脑是软件执行器,大模型也具备类似功能。”当被问到大模型是什么,文因互联创始人鲍捷这样表示。
鲍捷,文因互联创始人,曾担任美国麻省理工学院访问研究员、三星美国研发中心研究员,曾是三星问答系统S-voice第二代系统核心设计师。年鲍捷和创业团队一起从美国回来,最早在清华经管学院孵化器创业。目前公司在北京、上海、深圳、合肥、成都都设有办公室。
大模型的应用好比炼钢。作为通用底座的炼钢工厂越大越好,要集中力量办大事,避免遍地小高炉。而作为应用场景的“用钢”,则应多元化、市场化。“用钢”部分可以分成两端,大模型的应用场景端被市场化,具体应用场景AIGC里自己负责。
过去金融机构中台的建设通常是分散的,每个应用场景都需要不同的业务逻辑和技术框架。而现在,使用同一个基座可以实现所有应用的互通,包括数据治理、分析型应用、写作类应用和智能交互式应用,这种工作范式是之前难以想象的。
基于这一范式,首次拥有了一种可能性,人们可以在同一个基座上完成所有下游任务。无论是撰写招股说明书这样的写作类应用,还是进行券商的质控、核查,或者投资研究、研报汇总,所有下游任务都可以在同一个基座上完成。
本文,「极新」对话文因互联创始人鲍捷。我们试图跳出舆论和质疑,聊聊更本质也更尖锐的问题。鲍捷博士给出了关于以下三个板块的回答:
“AI是咨询”“只有强烈的信仰才能促成成功”
“数据、人工智能、底层的算力算法和语料在将来都有可能出现公共基础设施。”
01我们是改革者“AI是咨询”极新:文因大模型是怎样的大模型?
鲍捷:文因大模型,是为金融人打造的智能副驾驶,有以下几个特点:
一是懂金融。全量金融语料训练,完善的预处理机制,拥有全量金融语料,能够深度理解表格内容,并事先完成文档语义化,提高数据的质量和准确性,满足了金融行业数据专业性和合规性;
二是懂场景。适配金融场景,基于场景优化,拥有+的能力插件,根据不同的业务需求和场景特点,灵活选择和配置相应的插件;
三是懂质控。拥有质控保障交付质量,自有质控核查功能,可进行交叉验证及数据溯源,防止数据被篡改或伪造,杜绝大模型的“胡说八道”,保障了业务的可用性及用户满意度;
四是支持私有化部署与信创。私有化部署,保障数据可控可信,可支持在各种数据集上进行训练和测试,从而保证模型的准确性和稳定性。
极新:金融行业对数据更敏感,相对其他行业对模型反馈的准确率要求更高,提高准确率需要更高质量的数据,怎么解决这个问题?
鲍捷:所有场景都在这里,只是我们现在可以更高效率来进行服务,但恰恰是由于效率提升,所以可以出现新的反应模式。比如我们以前只做金融,甚至有段时间只做证券,因为以前的模型成本是线性的,现在模型可以是log的,不需要那么多成本去构造。
极新:为什么它从线性变成了log?
鲍捷:因为以前需要大量的调参、大量的优化后续环节,所以投入总是线性问题。但是现在最关键的问题在语料,特别是在语料如何进行精加工,就是炼油的过程,需要更大的先期投入。一旦有了投入,后期的提示工程师的任务变得非常的简单,不需要软件工程师,它有大量的业务分析能力。业务分析的过程本身是有可能进一步自动化的,所以你越懂它就越快。
极新:文因互联的大模型商业化是如何规划的?
鲍捷:我们不是革命者,我们是改革者,先有商业模式,再提高服务质量。金融机构一定是私有化部署,要license,要为其提供咨询服务。未来在中国市场可能会出现一种新的更加高效的服务方式,我称为ConsultingasaService。中国市场运行下来的特点是serviceasasoftware(服务即软件)。
每家公司的信息接口都是不一样的。整个市场的统一信息接口不存在,可能需要20-0年的时间才有可能出现市场化环境,但今天是不具备的。适应市场必须承认这种需求的多样性,而需求多样性又不能够由统一的、完全标准化的软件产品来承载,因为软件的本质是人类社会信息接口电子化,当人类社会本身不存在统一的信息接口和流程的时候,软件是不可能的,目前还没有达到。
不管任何行业,只要软件不是完全的纯流程性的,就非常难以标准化。所以留下了一个空间,要么是纯粹不写代码的咨询,要么纯粹的写代码,但是完全不做业务分析,这是外包。所以在外包和咨询这两者之外,我相信存在一个新的模式,我称为CaaS(ConsultingasaService)。大模型就是天然的能够颠覆咨询行业,它颠覆地不是软件行业。Al行业本质上是咨询,Al不是软件,AI在中国要么是硬件要么是咨询,所以咨询的价格将来会被打到十分之一。短期内我们要尊重中国市场现状,扎扎实实地做平台级服务,帮助客户做数据分析,形成各种流程自动化的需求。也就是大类产品:读文档产品、查文档产品、写文档产品的工具型产品。
02AI是大规模的工程系统“只有强烈的信仰才能促成成功”极新:Al可能是挑战,但现在看来好像对企业是正向影响,因为它增加了企业的利润,也降低了成本,尤其是在AIGC的一些强势领域,比如市场、咨询,AIGC在这些领域可以快速发挥作用,它的需求在哪?
鲍捷:就像汽车虽然淘汰了马车,但是并没有淘汰交通运输行业一样,行业是不会被消灭的,行业只会在效率提升时雇佣更多的人。所以金融行业一定会雇佣更多的人,所有的知识行业一定会雇佣更多的人。
再比如会计,中国现在有两千万会计,几十年前这些会计还没有电子计算机,他们用算盘,但当时中国没有那么多会计,所以当会计的工作效率提升之后,原来用不起会计的企业仍然能用得起,所以整个行业在增长。
以前大家还去划分互联网和非互联网,现在还有什么不是互联网?未来的一切都是人工智能,没有不用人工智能的企业,未来一切不生产实物的公司都是软件公司,所以未来每个学校、金融机构、律师事务所、会计事务所、广告公司、电影公司全部都是软件公司,他们会吞噬一切。
极新:当下大模型会不会在未来遇到两个问题?问题一是互通的问题,问题二是人才的问题。现在人才还是非常稀缺的,因为金融行业是相对有点特殊的行业,它对反馈的准确性要求特别高,而且很多的数据又比较重视安全性。
鲍捷:问题一,标准化,相关机构都在做,一方面要做牌照,另一方面要做标准。但除了从上往下的行政标准之外,更重要的是行业标准,行政标准决定了你不能干什么,只有行业标准决定了你干什么能挣钱。第二个人才的问题不是很担心,因为人才在实战当中会锻炼出来的。
极新:到现在为止做大模型给您印象最深的场景,或者已经跨越过去的鸿沟是什么?
鲍捷:最想跨越的鸿沟还没有跨越,但我印象最深刻的是知识库,以前做知识库的成本是现在的0倍,这是我从来没有想到过的,这是把我脑壳震掉的一件事情。但我们团队有个小伙伴,是个普通大学的本科生,帮我们做了这个事情。如果是在5年前,不是从美国回来的博士是做不了的,这就是颠覆。
极新:您最想跨越的鸿沟是什么呢?
鲍捷:有两个。一是我想把中国所有金融语料重新训练,但是经过验证确实需要很多很多的钱,我最想做的事情是公司的名字所说的事情——文因互联,互联世界的记忆。这也是我从美国回来做的第一件事情,我想要把全世界所有的文字切碎,然后再把它们连在一起,让每个人拥有自己的记忆,拥有自己的第二记忆,让每个人拥有自己的助理,每个人拥有自己的datalocker,也就是属于自己的数据箱。
极新:现在来说最大的阻碍因素是什么?
鲍捷:其实做这些东西并不难,技术原理是不难的,难就难在它是一个工程系统,是一个大规模的工程系统。这个大规模工程系统要可能需要两三百名优秀的人才,而且这样优秀的人才可能5-10年都不挣钱,没有人愿意做这样的事情,只有强烈的信任才能让这件事成功。这也是OpenAl能够成功的原因。
0技术善于掀桌子“数据、人工智能、底层的算力算法和语料在将来都有可能出现公共基础设施。”极新:金融行业大模型的未来发展趋势是不是分阶段的?您怎么看待阶段性?现在处在哪个阶段?
鲍捷:首先还是限定一个词,就是“有中国特色的初级阶段的”。我们现在还在早期的探索阶段,会有一些场景方面的探索,但过程中一定会体现出中国集中力量办大事的特点。中国的金融是强监管的,另一方面也是强基础设施的,数据和人工智能等的各种服务、底层的算力算法和语料在将来都有可能出现公共基础设施。
中国可能很难复刻其他国家的SaaS化道路,因为大家不相信,所以信任是一种高度的稀缺资源,但这种稀缺资源是有可能通过行业化的运营方式来化解的。所以最终大家会在L0、L1、L2分层建设,每一层有不同的大模型。L0层的大模型可能是一些大型的机构,或者是互联网公司自己训练的模型,也可能是由开源的大模型在统一的行业语料基础之上训练出的集成L0型大模型。L1型模型就是行业大模型,也是我们跟很多行业机构在做的。
在L1型的大模型之上,会出现各种各样的L2级的大模型,是各种落地场景的相应模型,不会成为大模型。所以这种小模型的投资可能就是百万级的。但也有一些机构会在内部建立自己的内部中台,相当于内部的中台大模型,以前的中台变成了大模型,以此赋能机构。
行业运营有限制,不可能满足所有人,所以最终将会形成多元化、多层次的大模型结构。目前在L0级,有一大部分人在做,但是对于领域落地基本上没有贡献。也有一部分人在做L2型的小模型,但是由于私有化部署等各种限制,覆盖的面积还不够,而且机构之间知识和解决方案的复用都不够,是需要最终验证的。我们会跟L1和L2这两层客户一起来达成。
极新:大模型进入千行百业是否存在更高准确性、更低成本、更大普及率的不可能三角?
鲍捷:这些不可能三角都从来都不是技术造成的,从来都是社会本身的运营造成的。
比如外贸的不可能三角也是一样的,技术再怎么进步它永远都是这样的。所以技术善于掀桌子,有可能彻底颠覆并且以后所有的基础设施都不复存在,比如以后人类完全不需要贸易。假如出现这样一种技术,那么这个不可能三角就不存在了。
同样,如果以后我们实现了完全彻底的三体人化,金融都不需要了,自然B2B的不可能三角也就没有了。但是现在还没到这样一种程度,我们并没有改变任何社会运营的基础,过去十年当中所看到的技术对于社会运营的挑战全部都失败了,所以说不会改变。
期待更多优秀的企业大放异彩!人工智能的未来,由你我共同见证!