ELPIS
天云数据 私域大模型
基于私域数据,通过迁移学习和RLHF人类反馈强化学习 对模型微调,模型本身具有身份认同且答案可精确溯源

产品简介

天云数据Elpis大模型管理平台,基于语义工程、数据库向量化和大模型Prompt管理,实现私域数据快速接入大模型,帮助企业快速获取大模型能力,模型本身具有身份认同且答案可精确溯源。

语义工程(基于私域数据向量化处理)
向量数据库(大模型上下文retrieve)
大模型Prompt管理(模型/向量/提示词/插件)

产品特点

语义工程

  • LLM应用数据回流采集;
  • 知识库内容按照不同策略进行语义切割,生成模型微数据集或QA键值对;
  • 支持团队协作、线上流程化数据语义标注及数据质检,一键导入向量知识库。
  • 知识工程

  • 快速接入外部结构化数据源及非结构化私域知识库系统;
  • 支持知识库文档的管理及多格式文档的转化;
  • 基于知识库内的各类型文档图片/PDF/DCM等)进行智能标注或人工标注处理,为不同的场景提供训练数据,支持客户AI场景落地。
  • 大模型微调

  • 支持LLM模型LoRA 微调;
  • 支持Embedding模型训练。
  • 大模型管理

  • 私域模型(LLM + Embedding)注册登记,支持第三方商用模型api-key接入;
  • 灵活编排Prompt,按场景选择不同模型,模型知识库及插件等按需发布微服务供业务使用。
  • 产品优势

    算力资源调优

    提供算力调度和优化方案,通过调整算法和硬件资源,最大程度利用计算资源,缩短微调周期

    开发高效省力

    内置无代码开发模块,大幅减少开发所需时间精力。支持“聊天交互”和“文本生成”两类大模型任务

    解决知识幻想

    平台拥有完整的数据标注和知识库构建流程,可以快速预处理文本、标注和质检,完成知识库构建的在应用中的引用

    外部能力集成

    平台提供插件调用功能,帮助大模型应用轻松接入外部服务,提高大模型处理复杂问题的能力

    统一管理平台

    我们为您提供高效、易用、可维护、安全的统一管理平台,实现多模型协同、管理和调度,提高运维效率

    天云数据私域大模型Elpis行业实践
    政务:公文文档自动生成实践-数据累加

    天云数据私域大模型Elpis可实现公文文档自动生成,进行实体抽取、统计、计算及内容扩写等,有效地辅助客户编辑公文。其中,所有数据通过代码处理抽取,可进行累加汇总;还可根据生成内容提供Top3诉求依据子标题,包括相关建议的大小标题。敏感内容可“隐去。

    金融:惠企政策智能匹配—帮助政府政策快速落地

    能源:勘探科研文档智能管理-实现400+万篇科技文献自动检索

    背景

    勘探研究人员及工程人员面对海量石油斯操文档文献,存在查找资料困难、阅读文献和整理风险费时费力的问题。

    我们做了什么

    基于能源勘探窄领域,由业务专家和数据科学家共同定义勘探开发领域知识本体,标注少量样本数据,利用基于Transformer框架技术的大规模语言模型,实现从文档中自动识别勘探开发实体及抽取实体关系,自动进行文档归类,构建文献智能检素及智能问答小助手等应用,提升科研人员高效挖掘文献们力及技术人灵现场解决故障能力。

    窄领域知识构建

  • 从文档中自动识别勘探开发实体,解决实体命名不规范问题
  • 自动抽取实体关系
  • 文档文献自动分类
  • 对文档数据进行自动解析入库
  • 建立业务实体关系知识图谱,知识问答和智能检索
  • 知识问答

    实现了勘探场景、生产场景的相关业务知识问答系统,作为工程人员现场开发智能小助手,快速分析定位有可能的故障原因。

    智能检索

    实现了勘探场景、生产场景的智能搜索系统,辅助科研人员在海量科研文档中精确定位业务相关文档。

    文娱:智能舆情监控-分钟级反馈舆情风险信息

    背景

    社会與情事件频发,某知名度假区立项以来,受到媒体广泛关注,面临舆情捷战

    舆情风险

    知识图谱广泛监听模型

    舆情情感分析

    通过利用大规模语言模型,对两微一抖等社交媒体的短文本进行情感分析建模,实时检测杜交奥情情感走向。

    文旅知识图谱

    基于异构数据利用实体抽取、关系抽取及属性抽取模型,从舆情数据中广泛获得风险主体的图诺信息,包括15种实体及45种关系,深度融入舆情系统。

    潜在风险实时预警

    知识图谱的能力是利用对业务知识的建模能力和对知识的自动抽取能力,蒋业务相关内容姐织起来,并不断丰富相关内容,实现对舆情的广泛监听,实时更新智能自动化挖掘潜在奥情风险。

    自动监测全网信息

    知识圈谱构建后,当在进行目标监听时,可以自由的选择目标的各个维度进行监听,生成要监测的主体词/范围词/事件词,达到机器能力辆助人工操作的目标。

    市场动态
    天云数据雷涛做客BTV《科学汇客厅》,畅谈大模型带来的机遇与挑战

    科学传播沙龙“科技赋能新闻传播”在天云数据召开

    11月1日,由北京市科协主办,北京科技记协承办,天云数据协办,思必驰科技股份有限公司提供技术支持的“科技赋能新闻传播数字经济下的科技传播思考与探讨”科学传播沙龙在京举办,活动由北京市科协宣传文化部二级调研员、北京科技记协副理事长兼秘书长李磊主持。

    活动邀请媒体融合生产技术与系统国家重点实验室5G融媒体应用事业部首席专家左剑,清华大学新闻学院教授沈阳,以及天云数据 CEO 雷涛针对“大模型和科技赋能新闻传播”作主题报告。


    北京日报责任之光:产业数字化转型的方法与路径

    在由毛泽东同志题写报头,也是唯一进入中南海的党报《北京晚报》创刊65周年,重磅推出的“责任之光”系列报道中这样评价天云数据:“用科技硬核重建市场信心,用数据要素赋能产业升级。”

    在采访中,记者提问:“用第三代数据走向市场的是如何规划商业模式的?”天云数据雷涛答:“科技原创里面没有商业模式,这是科技企业的责任。”