天云数据 推动企业向数字原生迈进

企业数字化转型的归宿——数字原生企业。 国际数字公司(IDC)报告《IDC Futurescape: Worldwide IT Industry 2019 Predictions》,对2019年全球IT的十大预测。该研究公司称,鉴于竞争对手和产业都在向数字化转型,如果企业不能快速向数字化转型,到2022年,它们逾三分之二的目标市场会消失。 到2023年,75%的IT支出将用于第三平台技术——因为超过90%的企业构建了“数字原生”IT环境,以便在数字经济中茁壮成长。

 

 

什么是数字孪生?

 

数字孪生,近几年在互联网领域频繁出现,更是跟智慧城市深度绑定,以大数据为基础打通逻辑世界和物理世界。

 

说起孪生,我们立马会想龙凤胎、双胞胎之类的词,这确实是最直观的理解,也是很正确的理解,只不过数字孪生中的双胞胎并不是两个个体,而是两个系统:一个系统存在于现实的物理世界,一个系统存在于虚拟的数字世界。并且通过智能技术,使得这个存在于虚拟世界中的系统也能以一种直观的方式让我们感知与触碰。因为物理世界是由千亿级的各类数据构成,所以在虚拟世界中的仿真即便就是对各类数据的仿真,即数字孪生。

 

数字经济兴起之后,数据开始由”数字孪生”向”数字原生”发展,前者是将人类已有知识应用于数字虚拟世界,后者是生产适应于数字经济的新认知。

 

可以说数字原生是由‘以物理世界为重心’向‘以数字世界为中心’迁移的思考问题的方式。

 

 

第一阶段,科学实验生产新知识。远古时候,知识往往从实践之中生产,钻木取火和伽利略的比萨斜塔实验是最典型代表。当击打野兽的石块与山石相碰时往往产生火花时,燧人氏受到启发,以石击石生出火来,这是通过实践观察生产新知识。亚里士多德曾说,物体越重下落速度越快,因此当伽利略将45.4千克和0.454千克的铁球在比萨斜塔上扔下的时候,不但推翻了已有的知识,而且开创了近代科学实验的新纪元;

 

第二阶段,理论推理生产新知识。这个阶段,知识从公理公式中生产,牛顿微积分是典型代表。俗话说,“工欲善其事必先利其器”,微积分就是数据家手里的“利器”,以微积分为基础,通过理论推理生产新知识;

 

第三阶段,仿真计算生产新知识。这个阶段就是我们前面谈到的数字孪生,基于已知对物理世界仿真建模,知识从规模计算中生产;

 

第四阶段,数字原生生产新知识。这个阶段的核心是面向答案求解不确定过程,知识从海量数据关联中生产。

 

 

今年年初, 谷歌云人工智能工程师戴尔・马尔科维茨针对美国“烘焙”兴趣激增,与团队产生了一个新灵感:决定更深入地研究这一趋势,并尝试了解导致饼干松脆,蛋糕松软和面包蓬松背后的科学原因。

 

首先,这些谷歌云员工组织了700多种食谱,涵盖了饼干、蛋糕和面包,从而标准化了测量,分离关键成分,并对香蕉、面包等并非真正 “面包”的东西进行重新分类。

 

然后,他们将它们输入一个名为 “ AutoML Tables”的工具中,以创建一个机器学习模型,该模型能够根据成分的数量来预测食谱是饼干、蛋糕还是面包。

这个实验证明了数字化世界里的知识,是构建在输入和结果上的。

 

这个实验的立意,描述了人工智能生产新知识的方法,从烘培工艺到成分学习这一简单事实,进而解释了科学第一性原理,数字原生在重构人类认知。

 

什么是科学第一性原理?

 

科学第一性原理回溯到1936年,薛定谔方程。薛定谔因为既死又活的猫被人们记住,而他真正伟大的贡献是薛定谔方程,在没有任何”可解释”的物理学定理可以借用的前提下进行纯数学推导,几百年来人类所掌握的自然的”可解释”的认知都被抛弃,薛定谔方程最终被定义为”科学第一性原理”。

 

在今天的数字经济中,很多基于我们经验规则流程的商业实践,甚至一些物理的公理定理,都开始让位于数据和算法所训练生成的新的知识。比如我们在电力系统的末端网络,解决互变关系即变压器和电表的逻辑。拓朴结构会使用高中物理所学习到的电压电阻的串并联关系,但这样一个简单完美的电路理论模型往往失效,因为现实世界中有大量的偷电漏电火线接地等线损情况,使数据产生理论模型所描述不出来的错误,解释不了户变区域电表的隶属关系,这个时候用纯数学的隐马尔可夫链概率推演的方式,反而可以清晰地计算出电压电表的关系,数学替代了物理学常识,构建了新的逻辑关系。

 

 ——天云数据CEO雷涛

 

 

天云数据数字原生服务通过应用智能计算沙盒、元数据网关、感知服务网关和隐私计算数据阀等技术,支撑企业数字化转型,促进企业数据、算力、算法生态的协同发展。

 

作为一家大数据及人工智能基础软件提供商,天云数据在成立之初就在数字原生上下足了功夫:所研发的人工智能专家系统Gaea内置机器学习功能洞悉历史数据下蕴藏的规律;数据治理工具ADG就可完成内/外部数据整合实现元数据管理;特征工程平台Kaleido,基于分布式存储架构和分布式计算框架可以最大限度地从原始数据中提取特征以供算法和模型使用;模型推理服务平台Sail,作为平台底层是容器集群,为容器化的模型服务提供资源限制、负载均衡等功能。