产品简介
浪潮云实时计算Flink(Inspur RealTime Compute)是浪潮云基于开源Apache Flink的功能,致力于实时处理的大数据场景。实时计算Flink为客户提供企业级权限管控、安全监控告警等场景服务。
产品优势
- 一键部署
提供一键式自动化云上部署能力。用户无需配置硬件与软件,直接选择即可快速启动集群使用。针对云上深度优化集群环境,自动化运维管理。
- 性能优越
支持高吞吐、低延迟,支持快速地处理海量数据
- 高可用
集群部署,结合Hadoop集群,Yarn模式启动,资源利用率高
产品功能
- 开源兼容
100%兼容开源Apache FLink的API,支持用户自定义插件等原生功能
- 按需创建集群
提供可视化集群创建能力,可自由选择服务器规模。
- 数据计算
支持流式数据分析、支持Exactly-once、支持快速地处理海量数据。
产品架构
实时计算Flink,采用Yarn模式调度,依托独立的hadoop平台,配置kerberos启用安全模式。
应用场景
数据仓库
传统的数据仓库是将数据汇聚到离线计算引擎上,而在互联网时代业务需求将数据汇聚及数据处理已经推到了高效实时性能。业务应用需要根据当前客户行为而随时调整。传统的数据仓库向实时数据仓库进行转型。基于浪潮云实时计算FLink构建的数据仓库可以快速响应业务需求。
物联网IOT场景
获取物联网设备或边缘设备的实时流式数据,结合规则引擎服务(RES),进行实时处理、分析、筛选。
产品术语
术语 | 解 释 |
---|---|
Hadoop | Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。 |
HDFS | HDFS作为分布式文件系统(Hadoop Distributed File System),提供高吞吐量的数据访问,为海量数据提供存储。HDFS是一个高度容错性的系统, 基于高可用架构(HA)保证集群的可用性。 |
Yarn | Yarn是Hadoop 资源管理器,可为上层应用提供统一的资源管理和调度,它的引入为集群在利用率、资源统一管理和数据共享带来好处。 |
Zookeeper | 可为大型分布式计算提供开源的分布式配置服务、同步服务和命名注册等功能。其目标是封装复杂易出错的关键服务,将简单易用的接口和性能高效、功能稳定的系统提供给用户。 |
Flink | Apache Flink 是一个框架和分布式处理引擎,用于在无边界和有边界数据流上进行有状态的计算。Flink 能在所有常见集群环境中运行,并能以内存速度和任意规模进行计算。 |