上海财经大学上海国际金融中心研究院、上海国际金融与经济研究院等主办的第九届(2023)金融科技国际会议于11月11日在上海举办,针对近年来金融科技取得了长足的发展,尤其是在人工智能、大模型、区块链等领域,这些技术的应用为金融行业带来了许多新的机遇和挑战。为了搭建高水平的学术交流平台,进一步促进金融科技领域的理论与实践研究,特举办“2023数字技术创新促进金融高质量发展”会议,天云数据CEO在会上做《AIGC的知识生产引起的产业变革》分享,着重分析国对外大模型技术差异。

在近期OpenAI首届开发者大会上,OpenAI宣布了GPT-4、ChatGPT的年度最重磅更新,主要有三大方面GPT-4 Turbo:支持128k上下文,相当于300页文档,输入价格大降2/3,速率限制翻倍,知识更新到2023年4月;开放新模态API;GPT定制化服务

我们知道,原本每个C端受众都可以自己给ChatGPT喂文件,他的定位就是通用大模型。但从这次发布来看:

首先,ChatGPT从性质已经从通用大模型变成了专属大模型,与此同时服务降价了。私域模型复杂度远高于通用模型,以行业通情,私域模型定价也会高于通用模型。那为什么ChatGPT从通用模型步入到私域模型,反而价位降低了呢?因为它已经从从训练阶段走向服务阶段(Training to Serving)了。

以大模型的整个服务流程来看,大模型只占其中一个环节。而且大模型已经从Training to Serving了,成本走低可以主推服务了。

(天云数据大模型服务图)

今天的大模型依靠是三架马车并驾齐驱的,他们分别是预训练大模型、迁移学习和强化学习。预训练模型依靠强大的数据工程完成,模型即数据,数据即模型。迁移学习和强化学习是AI Infra技术工程架构,依靠向量化数据库实现私域数据的工程落地。强化学习需要继承依赖有监督学习的模型训练流水线,天云数据作为MLops厂商有强大优势。在大模型闭环服务上,天云数据提供的是成熟的产品化的服务。

其次,OpenAI推出GPT定制化服务,就是针对特定目的定制的ChatGPT版本。在大模型定制化服务上,天云数据就绪了全部的工程思路和逻辑。以媒体的闭环采访为例,AI可以实现从文字中抽取事件的叙述逻辑和议题、从图片中抽取议题和内容,并通过大模型生成采访提纲并通过数字分身完成内容输出。

对于开放新模态API,这其实就是工程就绪整理能力。目前Hugging face上37万+Transformer开源模型,各种多模态上的小模型都被打包在一个服务实体里头,可以用 API 方式调用,只要有平台和环境就可以就绪。

针对这次OpenAI新品“升级降价”,天云数据对比技术来看,可喜的是,国内科技厂商并没有离一线很远。

但是,我们也必须意识到差距在哪并客观的看待差距——OpenAI做的是在线就绪服务,而我们是做了一个工具。

OpenAI的服务可以直接线上SaaS 服务的形式,而产品属于工具,这就是落差。这落差核心体现在产业上,科技厂商得拿工具的能力去置换用户的想法,然后用户再买机器再投产服务,它至少是周级别的。要想聚合这三层能力,要么就是自己投资建设服务出来,要么就是国内厂商生态抱团,软件厂商和硬件厂商一起攒服务。目前市场对国内大模型普遍不看好,那是因为现在用户还看不懂,用户没有刚性需求、提不出来精准目标,就看不到更好的服务样板。大模型服务需要启动大的技术集群,这也是现在中国产线当中缺市场要素的转化。

与此同时,我们也要探寻前进的方向:

方向1:实时数据供给是大模型的刚需

GPT-4 Turbo的知识库截止时间为2023年4月,这依然是以月度为单位的数据。而特斯拉是合作Twitter,实现了实时数据。模型数据的实时性问题,是后面流数据框架支撑大模型服务的刚性问题,尤其在投产线上,1个小时的数据差异都会造成损失,更何况是月度数据。

方向2:复杂数据更具含金量,需要将数据库与大模型链接

我们现在看到数据大都是常识性知识、科技文献法规这些静态知识。那含金量比较高的——实时交易数据,都在生产线的数据库里。怎么去连接数据库和大模型一定是大模型服务必须要考虑的技术。

因为流动的、高密度价值的数据信息都在企业的数据库里,因此要解决三个突出矛盾:

第一个矛盾,是动态模糊的意图和精准结构化查询语句SQL之间的这个矛盾;

第二个矛盾,是序列化的线性逻辑和错综复杂的数据关系之间的矛盾,需要用数据编织、存算分离等手段来完成对大模型的供给;

第三个矛盾,大模型使数据服务下沉到个体,带来大量远超于传统数仓数据可视化技术所能支撑的并发服务,对混合负载HTAP数据库形成刚性需求。

方向3:多模态模型融合,完成产业造车

百模大战都在造语言的轮子,那么大模型其他信号的模型如何与大模型进行融合?比如空间大模型,长宽高等几何信息能否被空间建模压缩到神经网络?以及视觉模型,空间模型,如何将这些模型打通?天云数据正在打通文本、图像、空间认知,在神经网络上做对齐。不仅仅是通过 MOE 做模型调度,而还可以在神经网络上对齐。

事实上,我们都知道,无论“轮子”多好,但只有“轮子”是肯定不行的,唯有学会如何造车才能发挥好轮子的价值。