6月20日至21日,《中国企业家》杂志社在2020(第二十届)中国企业未来之星年会暨中国企业家生态大会上公布了2020年度“中国科创企业百强”(简称“科创百强”)评选结果。作为国内领先的HTAP国产数据库与人工智能底层软件提供商,天云数据从众多企业中脱颖而出,荣登榜单。
本届大会聚焦“共享数智化红利”,挖掘推动人类社会生产生活新一轮变革的创新科技。新技术的聚变,加速了以数字化和智能化为主要特征的产业转型,一场影响深远的变革正在发生。
回顾数据科学的发展历史,重新审视一下数据科学的现状及未来,尝试发现数据科学成功在工业界应用的银色子弹。2015年,斯坦福大学统计学教授David Donoho在普林斯顿大学举办的John Tukey百年纪念大会上做了《数据科学50年》的报告。该文回顾了数据科学50年来的发展历史,并对数据科学的现状做了总结,报告指出:数据科学包括六个重大分支:数据探索和准备、数据表示与转换、数据计算、数据建模、数据可视化与表示以及数据科学的科学性。数据科学家往往会发现,他们工作的一个中心步骤是通过适当的转换,将原始的数据表示重构成新的,更具有启发性的形式。而完成这一中心步骤,需要数据科学家发展两种能力:
NewSQL:当今数据表示的方式非常多样,从文本文件、电子表格到SQL、NoSQL数据库、分布式数据库、流式数据库等,数据科学家需要熟悉使用所有这些数据表示形式相关的数据结构、转换和算法
特征工程:对于特定类型的数据,如声音、图像、传感器和网络数据,采用特定的数学表示形式将会对数据分析非常有益。如,为了获取声音数据特征,往往需要对其进行同态滤波或进行傅里叶变换;为了获取图像数据特征,往往进行小波变换或其他多尺度变换(例如,深度学习中的图像金字塔等)。数据科学家研究出了各种成熟的算法以及相关的评价准则。
天云数据的AI系列产品,完美的满足了报告指出的数据科学家必须发展的两种能力 :
HTAP混布数据库充当AI应用的底座,完美满足各种不同格式、不同规模的数据存储与查询的需求,使得数据科学家无需掌握多种数据库的使用,即可满足工作需求。

天云依靠新型分布式数据库与特征工程平台,这两个平台引擎的巨大动能,正在帮助这些企业实现知识再生产的规模性变革,创造出多元机会;同时,天云也在和这些积极利用AI的企业并驾齐驱,好风凭借力,双双实现弯道超车。