天云数据,国内能够同时提供分布式计算平台产品和AI平台基础设施的科技厂商之一,拥有博士后工作站和国家级高新企业称号,并于2016首批进入中关村前沿科技企业重点计划。2017年人工智能产业发展报告白皮书发布,天云数据同时上榜“机器学习深度学习平台”与“数据平台”;天云大数据在中关村5000亿计划中名列大数据领域TOP10;同时上榜中科院发布的人工智能企业排行榜百强。

 

MaximAI 3.0版本


特征工程自动化:特征衍生与特征合成

依据模型任务类型确定算法

模型超参数优化智能化

Notebook环境下的容器化部署

核心算法

 

分类:深度学习、广义线性模型、 随机森林、梯度提升模型、 XGBoost、支持向量机、 朴素贝叶斯

回归:深度学习、广义线性模型、 随机森林、梯度提升模型、 XGBoost

聚类:K-Means、GMM

降维:主成分分析、广义低阶模型

集成Scala、Python语言中的数据预处理,可视化、算法模型,应对各类机器学习、数据挖掘模型的构建

MaximAI 优势

 

实现了对各数据建模整个生命周期的可视化和模块化管理,并以友好的用户界面和高级的技术特性,整合用户管理、任务管理、数据管理和模型管理等业务级管理任务

基于Hadoop/Spark集群,通过分布式文件系统HDFS的数据接口,提供数据整合和数据质量管理等技术,支持海量数据的快速存储和加载

通过交互式和可视化的工具,实现数据处理、变量分析和数据可视化等,支持对数据快速分析和整体把握

集合众多主流的机器学习算法,实现自动化机器学习,结合Hadoop/Spark平台的分布式能力,支持基于海量数据集的全量数据描述性建模以及可视化模型评估

 实现自动特征工程,支持探索性数据建模,提供菜单式参数调优界面,实现了企业级AI模型生产和分析

独立化预测性模型,实现了对测试数据的一键式预测

集成Scala/Python/R多种编程环境,支持用户的自主开发

核心能力

 

基于 Hadoop / Spark 集群,支持海量数据集的建模全面覆盖模型 生命周期的管理

自动化机器学习:自动化选择算法模型并调参优化模型、自动化实 现多模型集成学习、自动化实现模型对比,评估最优模型

自动特征工程——“让数据就绪到可以进行机器学习”

包含热门及主流机器学习算法

兼具视觉吸引力和实用性的图形用户界面交互 FreeCoding模式

集成 Scala / Python / R 编程环境,并支持spark/pyspark交互式运 行环境