天云数据,国内能够同时提供分布式计算平台产品和AI平台基础设施的科技厂商之一,拥有博士后工作站和国家级高新企业称号,并于2016首批进入中关村前沿科技企业重点计划。2017年人工智能产业发展报告白皮书发布,天云数据同时上榜“机器学习深度学习平台”与“数据平台”;天云大数据在中关村5000亿计划中名列大数据领域TOP10;同时上榜中科院发布的人工智能企业排行榜百强。
特征工程自动化:特征衍生与特征合成
依据模型任务类型确定算法
模型超参数优化智能化
Notebook环境下的容器化部署
核心算法
分类:深度学习、广义线性模型、 随机森林、梯度提升模型、 XGBoost、支持向量机、 朴素贝叶斯
回归:深度学习、广义线性模型、 随机森林、梯度提升模型、 XGBoost
聚类:K-Means、GMM
降维:主成分分析、广义低阶模型
集成Scala、Python语言中的数据预处理,可视化、算法模型,应对各类机器学习、数据挖掘模型的构建
MaximAI 优势
● 实现了对各数据建模整个生命周期的可视化和模块化管理,并以友好的用户界面和高级的技术特性,整合用户管理、任务管理、数据管理和模型管理等业务级管理任务
● 基于Hadoop/Spark集群,通过分布式文件系统HDFS的数据接口,提供数据整合和数据质量管理等技术,支持海量数据的快速存储和加载
● 通过交互式和可视化的工具,实现数据处理、变量分析和数据可视化等,支持对数据快速分析和整体把握
● 集合众多主流的机器学习算法,实现自动化机器学习,结合Hadoop/Spark平台的分布式能力,支持基于海量数据集的全量数据描述性建模以及可视化模型评估
● 实现自动特征工程,支持探索性数据建模,提供菜单式参数调优界面,实现了企业级AI模型生产和分析
● 独立化预测性模型,实现了对测试数据的一键式预测
● 集成Scala/Python/R多种编程环境,支持用户的自主开发
核心能力
● 基于 Hadoop / Spark 集群,支持海量数据集的建模全面覆盖模型 生命周期的管理
● 自动化机器学习:自动化选择算法模型并调参优化模型、自动化实 现多模型集成学习、自动化实现模型对比,评估最优模型
● 自动特征工程——“让数据就绪到可以进行机器学习”
● 包含热门及主流机器学习算法
● 兼具视觉吸引力和实用性的图形用户界面交互 FreeCoding模式
● 集成 Scala / Python / R 编程环境,并支持spark/pyspark交互式运 行环境