3月3日,五部委联合印发「加强从0到1基础研究工作方案」,提出重点支持人工智能、云计算与大数据等领域,推动关键核心技术突破。天云数据CEO雷涛认为,“中国企业必须走自主创新的道路,摒弃利用开源封装的伪软壳技术,掌握硬核技术核心,突破外部限制,实现技术创新,科技创新”。

软壳与硬核

封装开源与自主研发的分野

硬核(hardcore)原指一种力量感强、节奏激烈的说唱音乐风格,后来被广泛引申为“核心部分、中坚分子”,与软壳(softshell)相对。硬核技术,即关键、核心技术,是指原创且对整个生态产业起到关键价值支撑的技术。而在大数据应用领域,具体指代拥有自主研发能力和知识产权的核心组件;与之对应,软壳技术则指对大数据生态圈中的开源组件进行简单界面封装组合,提供服务应用。

“硬核”实力主要基于多年积累的由自身编写的原创代码,与“软壳”封装策略之间存在本质差别,差异点首先在于功能的差异化。如果对开源代码过于依赖,会面临同质化问题,功能雷同,这也是造成当下大数据行业竞争红海化的原因之一。

“如果一直在封装开源代码,那么注定会带来断代升级的问题,”天云数据CEO雷涛接受采访时表示,“随着国际局势不确定性和外部封锁的增强,对后续开源的维护和升级将会产生深刻的影响”。

技术厂商中,作为SI(集成商)和vendor(供应商)的角色非常不同,天花板也大相径庭。做封装的厂商,未来只能成为SI,做开源体系的封装和组合;而Vendor厂商一定拥有硬核技术,具有自身计算框架实力,有能力做独立组件的开发,最终融入生态。”

这两类不同厂商的技术价值分野,也直接体现在市值差异上。前者的典型代表Cloudera,主要对apache基金会开源的大数据相关组件进行代码维护和应用支持服务,作为Hadoop生态系统中规模最大、知名度最高的供应商,市值从2014年的 41 亿美元一路缩水至14 亿美元。而后者例如Databrick,提供基于 Spark 的基础组件服务,最新F轮融资估值已达62亿美元。

如果说软壳技术厂商选择了一条平坦路途,现阶段相对好走,但始终天花板有限;硬核技术厂商则是在翻越崎岖,攀爬向上,力图成为登顶险峰的生态参与者。

“硬核”何在?

自主可控是核心

将目光拉回国内,大量软壳技术企业的发展主要经历三个时期阶段:

第一阶段:新技术应用孵化期
在这个时期,企业主要研究开源组件的应用,利用开源组件特点,解决业务应用,提高技术能力;

第二阶段:技术封装成熟期
对开源组件进行封装打包,向传统世界降维出售,卖开源封装版,多数企业在这个时期通过封装的技术来进入;

第三阶段:泛行业应用衰退期
在这一阶段,企业有两大发展方向,一是依靠新技术框架上的服务获得行业地位;二是依然抱着技术产品幻想,坚持平台销售策略,与众多新进入者白热化竞争,突围难度进一步加大。

随着发展的进一步深入,这些软壳技术企业的短板会逐渐暴露:

知识产权问题:这些企业只是对开源的组件的封装,没有自主核心技术,会存在步入国际市场的合法性。开源组件的知识产权问题现在也没有很好确定,比如历史上Intel和Zettaset的Hadoop发行版诉讼案例。

升级发展问题:封装的版本为了保持稳定,技术滞后,技术跟随策略与主流技术的渐行渐远,一定阶段不得不断代升级,升级风险非常高。

技术开放问题:软壳的技术核心在壳上,会采用容器等前沿技术对开源基础框架做深度包装,用户被锁定在其开源技术选项路线上。

技术同质化问题:新技术形成趋势后,进入者众多,功能同质化严重,竞争非常激烈。

技术方向风险问题:数千众多孵化项目,小众开源,甚至淘汰的项目被包装成自主民族品牌,无法引领技术潮流。

服务运维问题:软壳企业的技术能力主要是封装的服务应用上,没有开源核心组件的运维能力,核心组件出现问题,只能靠开源社区的能力,服务运维能力差。

 

0.99和1.01的差距,在时间的检验下,也终会造成天壤之别。国内市场中自主创新的硬核公司,选择了一条难走但长远的路途。“硬核”实力如何形成?离不开长期持续的创新能力、项目技术积累和研发投入。成立之初,持续创新就是“硬核”技术企业印刻在血液里的基因,加之不断积累总结多年的项目实施经验,进一步促成创新产品孵化,专注在一个技术领域持续研发投入,形成了极高技术门槛和技术壁垒。

国家强调了中国大数据企业具备大数据核心技术研发能力的重要性,是否掌握硬核核心技术,决定了是否能够做到“自主可控”;同时,打造大数据产业链、价值链、生态体系至关重要,做到这一点,意味着中国大数据产业将在具备较强发展实力的基础上,成为上下游发展齐备的有机整体。发展好供需平衡的大数据应用市场,才能在全球大数据发展竞争中保持领先和独立自主。

“去 IOE”之路

前排冲锋号角响起

“之前,从运营商到银行核心系统,大的架构都垄断在西方的 IOE(IBM、Oracle、EMC)这三座大山里,而‘去 IOE’,最难的是去‘O’。”雷涛说。

作为核心技术国产化的前排冲锋者,天云数据正是这样一家硬核技术企业。定位“服务AI的AI”,为AI应用企业提供AI基础设施服务,在人工智能和分布式计算领域拥有核心技术,长期深耕于国产HTAP数据库。

 

天云数据在项目实施中发现,真实市场并不是点对点替代,需求持续升级迭代,新市场正在形成。旧市场的数据库替代的刚需不足,而在于新市场中,新技术引入和数据资源的变化,期待着融合计算解决方案。天云数据的 HTAP 数据库产品 Hubble ,混合了TP和AP两种模式的数据库,目前已在几家大型商业银行的数字中心核心交易系统中,成功实现对Oracle一体机的替代。

中国大数据企业必须形成硬核技术支撑未来创新发展,成为硬核企业,而不是只是通过简单封装开源组件的软壳技术,形成软壳公司。这是赖以生存发展的根基,只有掌握了“人无我有”的大数据技术研发能力,才能实现大数据企业发展的“自主可控”。