对话文因互联创始人鲍捷大模型难落地的不是 - 发展 - 遵化市论坛遵化市 - Powered by ZK!NT

我的中心

遵化市论坛 » 常识 » 诊断 » 对话文因互联创始人鲍捷大模型难落地的不是

返回列表

发新话题

回复该主题

查看: 9\|回复: 0	对话文因互联创始人鲍捷大模型难落地的不是 [复制链接]

发送短消息 UID 222 精华 0 查看公共资料搜索主题搜索帖子 TUhjnbcbe TUhjnbcbe 组别新手上路生日帖子38 积分11 性别注册时间2020-03-27	1^# 字体大小: t T 发表于 2024-02-09 15:56 \|只看楼主看白癜风选老牌医院 https://m.39.net/pf/a_5777853.html “我相信存在一个新的模式——CaaS（ConsultingasaService）” 口述｜鲍捷整理媛元出品｜极新当下大模型进入千行百业，金融作为数据安全保密性要求最高的行业之一，对大模型的应用非常审慎。 “大模型的基本技术原理非常复杂，但我想用比较简单的比喻来说明。不同的动物会根据环境的不同进化出不同的特征，而人类的DNA虽然相同，但我们可以在不同的环境中游泳、跑步、打猎等，这是因为人类具有泛化能力。人类本质上是一种软件，大脑是软件执行器，大模型也具备类似功能。”当被问到大模型是什么，文因互联创始人鲍捷这样表示。鲍捷，文因互联创始人，曾担任美国麻省理工学院访问研究员、三星美国研发中心研究员，曾是三星问答系统S-voice第二代系统核心设计师。年鲍捷和创业团队一起从美国回来，最早在清华经管学院孵化器创业。目前公司在北京、上海、深圳、合肥、成都都设有办公室。大模型的应用好比炼钢。作为通用底座的炼钢工厂越大越好，要集中力量办大事，避免遍地小高炉。而作为应用场景的“用钢”，则应多元化、市场化。“用钢”部分可以分成两端，大模型的应用场景端被市场化，具体应用场景AIGC里自己负责。过去金融机构中台的建设通常是分散的，每个应用场景都需要不同的业务逻辑和技术框架。而现在，使用同一个基座可以实现所有应用的互通，包括数据治理、分析型应用、写作类应用和智能交互式应用，这种工作范式是之前难以想象的。基于这一范式，首次拥有了一种可能性，人们可以在同一个基座上完成所有下游任务。无论是撰写招股说明书这样的写作类应用，还是进行券商的质控、核查，或者投资研究、研报汇总，所有下游任务都可以在同一个基座上完成。本文，「极新」对话文因互联创始人鲍捷。我们试图跳出舆论和质疑，聊聊更本质也更尖锐的问题。鲍捷博士给出了关于以下三个板块的回答： “AI是咨询” “只有强烈的信仰才能促成成功” “数据、人工智能、底层的算力算法和语料在将来都有可能出现公共基础设施。” 01我们是改革者“AI是咨询” 极新：文因大模型是怎样的大模型？鲍捷：文因大模型，是为金融人打造的智能副驾驶，有以下几个特点：一是懂金融。全量金融语料训练，完善的预处理机制，拥有全量金融语料，能够深度理解表格内容，并事先完成文档语义化，提高数据的质量和准确性，满足了金融行业数据专业性和合规性；二是懂场景。适配金融场景，基于场景优化，拥有+的能力插件，根据不同的业务需求和场景特点，灵活选择和配置相应的插件；三是懂质控。拥有质控保障交付质量，自有质控核查功能，可进行交叉验证及数据溯源，防止数据被篡改或伪造，杜绝大模型的“胡说八道”，保障了业务的可用性及用户满意度；四是支持私有化部署与信创。私有化部署，保障数据可控可信，可支持在各种数据集上进行训练和测试，从而保证模型的准确性和稳定性。极新：金融行业对数据更敏感，相对其他行业对模型反馈的准确率要求更高，提高准确率需要更高质量的数据，怎么解决这个问题？鲍捷：所有场景都在这里，只是我们现在可以更高效率来进行服务，但恰恰是由于效率提升，所以可以出现新的反应模式。比如我们以前只做金融，甚至有段时间只做证券，因为以前的模型成本是线性的，现在模型可以是log的，不需要那么多成本去构造。极新：为什么它从线性变成了log？鲍捷：因为以前需要大量的调参、大量的优化后续环节，所以投入总是线性问题。但是现在最关键的问题在语料，特别是在语料如何进行精加工，就是炼油的过程，需要更大的先期投入。一旦有了投入，后期的提示工程师的任务变得非常的简单，不需要软件工程师，它有大量的业务分析能力。业务分析的过程本身是有可能进一步自动化的，所以你越懂它就越快。极新：文因互联的大模型商业化是如何规划的？鲍捷：我们不是革命者，我们是改革者，先有商业模式，再提高服务质量。金融机构一定是私有化部署，要license，要为其提供咨询服务。未来在中国市场可能会出现一种新的更加高效的服务方式，我称为ConsultingasaService。中国市场运行下来的特点是serviceasasoftware（服务即软件）。每家公司的信息接口都是不一样的。整个市场的统一信息接口不存在，可能需要20-0年的时间才有可能出现市场化环境，但今天是不具备的。适应市场必须承认这种需求的多样性，而需求多样性又不能够由统一的、完全标准化的软件产品来承载，因为软件的本质是人类社会信息接口电子化，当人类社会本身不存在统一的信息接口和流程的时候，软件是不可能的，目前还没有达到。不管任何行业，只要软件不是完全的纯流程性的，就非常难以标准化。所以留下了一个空间，要么是纯粹不写代码的咨询，要么纯粹的写代码，但是完全不做业务分析，这是外包。所以在外包和咨询这两者之外，我相信存在一个新的模式，我称为CaaS（ConsultingasaService）。大模型就是天然的能够颠覆咨询行业，它颠覆地不是软件行业。Al行业本质上是咨询，Al不是软件，AI在中国要么是硬件要么是咨询，所以咨询的价格将来会被打到十分之一。短期内我们要尊重中国市场现状，扎扎实实地做平台级服务，帮助客户做数据分析，形成各种流程自动化的需求。也就是大类产品：读文档产品、查文档产品、写文档产品的工具型产品。 02AI是大规模的工程系统“只有强烈的信仰才能促成成功” 极新：Al可能是挑战，但现在看来好像对企业是正向影响，因为它增加了企业的利润，也降低了成本，尤其是在AIGC的一些强势领域，比如市场、咨询，AIGC在这些领域可以快速发挥作用，它的需求在哪？鲍捷：就像汽车虽然淘汰了马车，但是并没有淘汰交通运输行业一样，行业是不会被消灭的，行业只会在效率提升时雇佣更多的人。所以金融行业一定会雇佣更多的人，所有的知识行业一定会雇佣更多的人。再比如会计，中国现在有两千万会计，几十年前这些会计还没有电子计算机，他们用算盘，但当时中国没有那么多会计，所以当会计的工作效率提升之后，原来用不起会计的企业仍然能用得起，所以整个行业在增长。以前大家还去划分互联网和非互联网，现在还有什么不是互联网？未来的一切都是人工智能，没有不用人工智能的企业，未来一切不生产实物的公司都是软件公司，所以未来每个学校、金融机构、律师事务所、会计事务所、广告公司、电影公司全部都是软件公司，他们会吞噬一切。极新：当下大模型会不会在未来遇到两个问题？问题一是互通的问题，问题二是人才的问题。现在人才还是非常稀缺的，因为金融行业是相对有点特殊的行业，它对反馈的准确性要求特别高，而且很多的数据又比较重视安全性。鲍捷：问题一，标准化，相关机构都在做，一方面要做牌照，另一方面要做标准。但除了从上往下的行政标准之外，更重要的是行业标准，行政标准决定了你不能干什么，只有行业标准决定了你干什么能挣钱。第二个人才的问题不是很担心，因为人才在实战当中会锻炼出来的。极新：到现在为止做大模型给您印象最深的场景，或者已经跨越过去的鸿沟是什么？鲍捷：最想跨越的鸿沟还没有跨越，但我印象最深刻的是知识库，以前做知识库的成本是现在的0倍，这是我从来没有想到过的，这是把我脑壳震掉的一件事情。但我们团队有个小伙伴，是个普通大学的本科生，帮我们做了这个事情。如果是在5年前，不是从美国回来的博士是做不了的，这就是颠覆。极新：您最想跨越的鸿沟是什么呢？鲍捷：有两个。一是我想把中国所有金融语料重新训练，但是经过验证确实需要很多很多的钱，我最想做的事情是公司的名字所说的事情——文因互联，互联世界的记忆。这也是我从美国回来做的第一件事情，我想要把全世界所有的文字切碎，然后再把它们连在一起，让每个人拥有自己的记忆，拥有自己的第二记忆，让每个人拥有自己的助理，每个人拥有自己的datalocker，也就是属于自己的数据箱。极新：现在来说最大的阻碍因素是什么？鲍捷：其实做这些东西并不难，技术原理是不难的，难就难在它是一个工程系统，是一个大规模的工程系统。这个大规模工程系统要可能需要两三百名优秀的人才，而且这样优秀的人才可能5-10年都不挣钱，没有人愿意做这样的事情，只有强烈的信任才能让这件事成功。这也是OpenAl能够成功的原因。 0技术善于掀桌子“数据、人工智能、底层的算力算法和语料在将来都有可能出现公共基础设施。” 极新：金融行业大模型的未来发展趋势是不是分阶段的？您怎么看待阶段性？现在处在哪个阶段？鲍捷：首先还是限定一个词，就是“有中国特色的初级阶段的”。我们现在还在早期的探索阶段，会有一些场景方面的探索，但过程中一定会体现出中国集中力量办大事的特点。中国的金融是强监管的，另一方面也是强基础设施的，数据和人工智能等的各种服务、底层的算力算法和语料在将来都有可能出现公共基础设施。中国可能很难复刻其他国家的SaaS化道路，因为大家不相信，所以信任是一种高度的稀缺资源，但这种稀缺资源是有可能通过行业化的运营方式来化解的。所以最终大家会在L0、L1、L2分层建设，每一层有不同的大模型。L0层的大模型可能是一些大型的机构，或者是互联网公司自己训练的模型，也可能是由开源的大模型在统一的行业语料基础之上训练出的集成L0型大模型。L1型模型就是行业大模型，也是我们跟很多行业机构在做的。在L1型的大模型之上，会出现各种各样的L2级的大模型，是各种落地场景的相应模型，不会成为大模型。所以这种小模型的投资可能就是百万级的。但也有一些机构会在内部建立自己的内部中台，相当于内部的中台大模型，以前的中台变成了大模型，以此赋能机构。行业运营有限制，不可能满足所有人，所以最终将会形成多元化、多层次的大模型结构。目前在L0级，有一大部分人在做，但是对于领域落地基本上没有贡献。也有一部分人在做L2型的小模型，但是由于私有化部署等各种限制，覆盖的面积还不够，而且机构之间知识和解决方案的复用都不够，是需要最终验证的。我们会跟L1和L2这两层客户一起来达成。极新：大模型进入千行百业是否存在更高准确性、更低成本、更大普及率的不可能三角？鲍捷：这些不可能三角都从来都不是技术造成的，从来都是社会本身的运营造成的。比如外贸的不可能三角也是一样的，技术再怎么进步它永远都是这样的。所以技术善于掀桌子，有可能彻底颠覆并且以后所有的基础设施都不复存在，比如以后人类完全不需要贸易。假如出现这样一种技术，那么这个不可能三角就不存在了。同样，如果以后我们实现了完全彻底的三体人化，金融都不需要了，自然B2B的不可能三角也就没有了。但是现在还没到这样一种程度，我们并没有改变任何社会运营的基础，过去十年当中所看到的技术对于社会运营的挑战全部都失败了，所以说不会改变。期待更多优秀的企业大放异彩！人工智能的未来，由你我共同见证！
	分享转发

	TOP

上一主题| 下一主题

发新话题

回复该主题