OpenAI新品“升级降价” 天云数据雷涛在第九届金融科技国际会议对比国内外大模型技术差异

由上海财经大学上海国际金融中心研究院、上海国际金融与经济研究院等主办的第九届（2023）金融科技国际会议于11月11日在上海举办，针对近年来金融科技取得了长足的发展，尤其是在人工智能、大模型、区块链等领域，这些技术的应用为金融行业带来了许多新的机遇和挑战。为了搭建高水平的学术交流平台，进一步促进金融科技领域的理论与实践研究，特举办“2023数字技术创新促进金融高质量发展”会议，天云数据CEO在会上做《AIGC的知识生产引起的产业变革》分享，着重分析国对外大模型技术差异。

在近期OpenAI首届开发者大会上，OpenAI宣布了GPT-4、ChatGPT的年度最重磅更新，主要有三大方面：GPT-4 Turbo：支持128k上下文，相当于300页文档，输入价格大降2/3，速率限制翻倍，知识更新到2023年4月；开放新模态API；GPT定制化服务。

我们知道，原本每个C端受众都可以自己给ChatGPT喂文件，他的定位就是通用大模型。但从这次发布来看：

首先，ChatGPT从性质已经从通用大模型变成了专属大模型，与此同时服务降价了。私域模型复杂度远高于通用模型，以行业通情，私域模型定价也会高于通用模型。那为什么ChatGPT从通用模型步入到私域模型，反而价位降低了呢？因为它已经从从训练阶段走向服务阶段（Training to Serving）了。

以大模型的整个服务流程来看，大模型只占其中一个环节。而且大模型已经从Training to Serving了，成本走低可以主推服务了。

（天云数据大模型服务图）

今天的大模型依靠是三架马车并驾齐驱的，他们分别是预训练大模型、迁移学习和强化学习。预训练模型依靠强大的数据工程完成，模型即数据，数据即模型。迁移学习和强化学习是AI Infra技术工程架构，依靠向量化数据库实现私域数据的工程落地。强化学习需要继承依赖有监督学习的模型训练流水线，天云数据作为MLops厂商有强大优势。在大模型闭环服务上，天云数据提供的是成熟的产品化的服务。

其次，OpenAI推出GPT定制化服务，就是针对特定目的定制的ChatGPT版本。在大模型定制化服务上，天云数据就绪了全部的工程思路和逻辑。以媒体的闭环采访为例，AI可以实现从文字中抽取事件的叙述逻辑和议题、从图片中抽取议题和内容，并通过大模型生成采访提纲并通过数字分身完成内容输出。

对于开放新模态API，这其实就是工程就绪整理能力。目前Hugging face上37万+Transformer开源模型，各种多模态上的小模型都被打包在一个服务实体里头，可以用 API 方式调用，只要有平台和环境就可以就绪。

针对这次OpenAI新品“升级降价”，天云数据对比技术来看，可喜的是，国内科技厂商并没有离一线很远。

但是，我们也必须意识到差距在哪并客观的看待差距——OpenAI做的是在线就绪服务，而我们是做了一个工具。

OpenAI的服务可以直接线上SaaS 服务的形式，而产品属于工具，这就是落差。这落差核心体现在产业上，科技厂商得拿工具的能力去置换用户的想法，然后用户再买机器再投产服务，它至少是周级别的。要想聚合这三层能力，要么就是自己投资建设服务出来，要么就是国内厂商生态抱团，软件厂商和硬件厂商一起攒服务。目前市场对国内大模型普遍不看好，那是因为现在用户还看不懂，用户没有刚性需求、提不出来精准目标，就看不到更好的服务样板。大模型服务需要启动大的技术集群，这也是现在中国产线当中缺市场要素的转化。

与此同时，我们也要探寻前进的方向：

方向1：实时数据供给是大模型的刚需

GPT-4 Turbo的知识库截止时间为2023年4月，这依然是以月度为单位的数据。而特斯拉是合作Twitter，实现了实时数据。模型数据的实时性问题，是后面流数据框架支撑大模型服务的刚性问题，尤其在投产线上，1个小时的数据差异都会造成损失，更何况是月度数据。

方向2：复杂数据更具含金量，需要将数据库与大模型链接

我们现在看到数据大都是常识性知识、科技文献法规这些静态知识。那含金量比较高的——实时交易数据，都在生产线的数据库里。怎么去连接数据库和大模型一定是大模型服务必须要考虑的技术。

因为流动的、高密度价值的数据信息都在企业的数据库里，因此要解决三个突出矛盾：

第一个矛盾，是动态模糊的意图和精准结构化查询语句SQL之间的这个矛盾；

第二个矛盾，是序列化的线性逻辑和错综复杂的数据关系之间的矛盾，需要用数据编织、存算分离等手段来完成对大模型的供给；

第三个矛盾，大模型使数据服务下沉到个体，带来大量远超于传统数仓数据可视化技术所能支撑的并发服务，对混合负载HTAP数据库形成刚性需求。

方向3：多模态模型融合，完成产业造车

百模大战都在造语言的轮子，那么大模型其他信号的模型如何与大模型进行融合？比如空间大模型，长宽高等几何信息能否被空间建模压缩到神经网络？以及视觉模型，空间模型，如何将这些模型打通？天云数据正在打通文本、图像、空间认知，在神经网络上做对齐。不仅仅是通过 MOE 做模型调度，而还可以在神经网络上对齐。

事实上，我们都知道，无论“轮子”多好，但只有“轮子”是肯定不行的，唯有学会如何造车才能发挥好轮子的价值。