产品介绍

产品简介

数据湖构建服务旨在构建覆盖数据全生命周期的智能化一站式开发运营平台,提供数据集成、数据开发、数据治理、数据服务、数据可视化等能力,帮助政府和企业实施大数据和数据中台战略、实现数据驱动的业务智能,推动政府和企业数字化转型升级和业务模式创新。

产品优势

  • 多源数据汇聚

采集组织内部数据、相关部门数据、互联网数据、物联网数据等各种来源数据,实现海量数据汇聚,满足各种业务分析对相关数据的需求。

  • 一站式数据开发

提供可视化一站式数据开发环境,帮助用户轻松实现离线开发、实时开发、机器学习、流程编排、作业调度等各项任务,快速完成数据全链路的加工处理,加速数据变现。

  • 数据治理运营

提供数据标准、规范、建模等功能,实现数据标准化、规范化管理。基于统一的标准规范进行数据治理,形成数据资产。提供企业级数据资产管理,实现数据资产可视、可管、可用。提供数据隐私、脱敏加密等多方位安全能力,保护数据安全。

  • 开放数据服务促进业务创新

基于“数据+服务”建立数据服务体系,注重数据安全与隐私,形成数据资源开放能力,实现数据资产的跨部门共享和外部开放,增强自我服务能力,促进业务创新,共建大数据生态,推动大数据利用常态化、可持续化。

产品功能

数据集成

提供同构/异构数据源之间批量/增量/实时的数据迁移服务。支持对接关系数据库、文件系统、物联网、Hadoop、NoSQL等各种数据源;支持基于数据库日志的无侵入增量数据采集,全面获取数据库增、删、改操作记录;支持整库数据迁移,快速实现大量库表全量/增量数据同步;面向实时数据,提供高效采集、传输、分发能力,帮助用户快速构建实时数据应用。

数据开发

提供一站式大数据开发环境,支持数据集成、离线计算、实时计算、机器学习等各种任务类型,支持SQL/Shell等脚本在线可视化开发调试,自动执行模型训练与模型预测任务,支持不同任务间的可视化流程编排。。

数据标准

数据标准用于描述业务层面需共同遵守的数据含义和业务规则,它描述了业务层面对某个数据的共同理解,整个数据治理过程中应遵循数据标准规范,其中包含数据字典、模型标准、标准文档、专业术语等模块。

数据建模

数据建模是对数据治理过程中的数据进行业务化的过程,提供统一数据标准、统一指标管理、数据规划、自定义主题数据模型、可视化数据建模等功能,有利于改善数据规范性及质量,有效支撑运营决策。

数据质量

提供一体化的数据质量检测能力,通过持续监测数据质量发现数据问题,进行质量改进。建立统一质量指标、统一数据模型,实现数据质量情况的智能检测和数据质量问题的自动发现,实现数据的智能清洗、补全、问题修正,改进数据质量,保证数据准确性、一致性、完整性。

数据资产

以元数据为核心,通过管理元数据,厘清信息资产。通过建立统一元数据库和数据资产目录,提供智能化的数据资产管理服务,实现元数据信息的自动发现、智能匹配、实时采集;通过智能标签体系,实现数据资产的自动分类、编目以及数据血缘的智能追溯;通过数据地图展现,实现数据资产的全景可视、探索发现、血缘影响分析等。

数据安全

提供敏感数据发现、风险数据识别、数据加密、数据脱敏、数据授权、数据审计等多方位的数据安全管理能力,保护数据安全。利用AI技术,智能发现和分类关键数据,对敏感数据自动实施数据保护策略,智能感知数据安全态势,自动修复数据风险。通过AI自动学习用户访问行为,识别异常事件并进行实时告警。

数据服务

提供数据服务API的生成、注册、发现、访问申请和授权等能力,通过API网关实现数据服务的统一授权访问、流量控制、监控统计。提供服务市场,支持智能化服务的发布、申请、审核与授权,实现服务市场的统一管理。

数据可视化

提供智能化的自助式数据可视化分析服务,通过可定制配置技术,提供多维分析、图表联动、数据筛选、拖拽式报表设计等BI分析服务,支持多源数据接入、交互式探索分析能力,零代码技术要求,简单拖拽和配置即可制作丰富的可视化分析报告和大屏。