【金猿产品展】HashData云端数据仓库——存储、计算和连接有价…

本产品由酷克数据投递并参与“数据猿年度金猿策划活动——2020大数据产业创新服务产品榜单及奖项”评选。

作为公司旗舰产品,HashData云端数据仓库融合了MPP数据库的高性能和丰富分析功能、大数据平台的扩展性和灵活性,以及云计算的弹性和敏捷性,以创新性的元数据、计算和存储三者分离的架构,提供了传统解决方案无法比拟的高并发、弹性、易用性、高可用性、高性能和扩展性。

应用场景/人群

一:基于HashData建设的大数据平台具有以下特点:

1. 敏捷:基于云的弹性计算,加快项目开发进度,同时减低使用成本。

2. 大数据集成:基于Foreign Data Wrapper技术,无缝集成Hadoop。

3. 完全托管:完全托管的数据库服务,无数据库管理之忧。

4. 企业数据模型:支持3NF、星型、雪花等数据模型。支持历史拉链、慢速变化维度处理。

5. 数据安全:完整的数据库安全控制机制,没有大数据安全顾虑。

二:HashData在云端提供SaaS数据仓库服务

HashData在公有云、私有云上为用户提供高性能、完全托管的PB级MPP数据仓库。利用标准SQL客户端和BI工具轻松分析海量数据。HashData云端数据仓库服务同时还提供动态伸缩、监控和报警功能,帮助用户更好地管理数据仓库集群。

三:针对本土的IT和商业环境特点,HashData还支持私有云和混合云部署,通过与云厂商、对象存储厂商、集成商以及应用解决方案提供商合作来服务客户。

产品功能

SQL访问层

HashData的访问层负责接受用户的查询请求,解析查询语句,生成执行计划,下推执行计划,协调计算节点,以及汇总查询结果返回给用户。同时,SQL访问层也负责数据访问安全和事物管理。由于支持标准的JDBC和ODBC,用户可以通过标准的SQL客户端、BI和ETL工具以及常用编程语言访问HashData。

MPP执行架构

HashData采用大规模并行处理(MPP)架构、将数据切片分布到各个计算节点后并行处理来解决海量数据分析的难题。每个计算节点都有自己独立的CPU,内存和外部存储,负责数据的存储以及查询计划的执行。计算节点之间是没有任何共享依赖的(shared nothing),并通过基于UDP的高速数据传输协议进行数据交换。查询在每个计算节点上面流水式并行执行,大大提升了查询的效率。

云存储

HashData利用云存储作为数据持久存储层,并与计算资源物理上分离、逻辑上集成。由于自身的高可用性和近乎无限的可扩展性,云存储大大简化了数据仓库系统错误恢复、多维度扩缩容、备份恢复等流程,同时使得不同集群间共享同一份数据、统一的数据存储平台成为可能。

云服务

1.管理控制台。通过管理控制台,用户可以方便地创建和管理多个数据仓库。

2.监控审计。HashData对每个数据仓库进行持续监控和使用审计,方便用户实时了解数据仓库的运行和使用情况。

3.弹性伸缩服务。HashData实现了灵活高效的数据分布策略,使得用户可以根据业务和数据量的变化,快速地动态调整数据仓库集群中计算节点的数量,以及每个计算节点的计算和存储能力。

4.计费功能。HashData提供了根据使用量进行计费的功能,方便用户控制IT预算。

5.基础设施管理。HashData是部署在基础设施即服务(IaaS)平台上的一个数据处理服务。通过基础设施管理服务,用户可以管理HashData与IaaS平台其他基础设施的交互,如将整个HashData集群迁移到另外一个私有网络,从而使得HashData融入所在的云生态中。

产品优势

数据仓库服务

“加载数据,分析数据,其它交给我们”。通过使用HashData云端数据仓库,企业用户可以在几分中内启动一个包含几十个甚至上百个节点的数据仓库集群,数据加载后马上可以开始数据分析任务。同时由于是完全托管的云服务,HashData云端数据仓库承担了所有的集群资源配置、数据备份、监控审计、错误恢复、高可用和升级等纷繁复杂、极易出错的运维工作,让用户专注于业务分析上面。

多维度弹性

基于云平台,计算和存储物理上分离、逻辑上集成的架构使得HashData实现了多维度弹性:横向伸缩和纵向伸缩。企业用户可以根据业务和数据量的变化,动态调整数据仓库集群中计算节点的数量。我们实现了灵活高效的数据分布策略,从而使得在计算节点数量改变时数据能够快速进行重分布。同时,用户也可以在不增删节点的时候(意味着没有数据重分布),调整每个计算节点的计算(CPU和内存)和存储能力。这种多维度弹性使得用户可以使用最合适的资源处理当前业务。

超高性能

HashData的架构专门为数据仓库应用优化,从而能够提供超高性能。这些优化包括无共享大规模并行处理(MPP)、流水式执行引擎、列式存储和大表分区等技术。配合我们提供的多维度弹性,用户可以取得非常高的性价比。

兼容开源

作为云原生的数据仓库服务,HashData在PostgreSQL和Greenplum Database的基础上对系统架构和运行实现上面进行了大量深度的优化。但在查询接口(包括使用习惯)以及底层数据文件存储格式和访问协议方面,我们保持与开源系统一致。这一方面意味着用户可以充分利用已有的SQL技能和在BI和ETL工具方面的投入;另一方面意味着使用HashData完全没有应用和数据绑架的风险。

使用客户/人群

HashData在金融、电信、能源、交通和互联网等行业已拥有50余家客户,包括国有银行、政策性银行、金融监管机构、股份制商业银行、三大运营商、中国石油、大型港口集团、世界500强中国分支机构以及互联网SaaS企业等。此外HashData与诸多云厂商、对象存储厂商、集成商以及应用解决方案提供商合作,得到亚马逊云、腾讯云、华为云、金山云、青云及通服云等合作伙伴高度认可。

市场价值

为金融、电信、能源、交通等关系国民经济命脉的重要行业头部客户解决了最具挑战性的数据仓库难题:千万级的数据库对象,100+PB数据量,数千个并发应用,以及每天1亿+的复杂SQL查询! 核心基础软件国产化是未来中国科技主流之一。随着政企用户云化转型步伐的加速,云原生技术已经逐渐成为主流的发展趋势。HashData作为国产化云原生数据仓库软件领域的领头羊,替换了市场上大批外企提供的传统数据仓库产品,持续为中国传统企业的数字化转型创造巨大价值。

产品所属企业·酷克数据:

成立于2016年初的酷克数据是国内最早专注于云端数据仓库的初创公司,核心团队主要由来自Pivotal、Teradata、IBM、Yahoo!、Oracle和华为等公司资深的云计算、分布式数据库和大数据专家组成。凭借深厚的技术积累以及极具前瞻性的产品理念,自创立之初就获得了包括经纬创投、国科嘉和以及金沙江创投等知名投资机构的多轮融资,累积融资额超千万美元。

来源:数据猿

数据猿
我还没有学会写个人说明!
上一篇

大厂面试助手(十二):场景和设计

下一篇

Pulsar和Kafka基准测试:Pulsar性能精准解析(完整版)

你也可能喜欢

评论已经被关闭。

插入图片