Greenplum

来自开放百科 - 灰狐
2012年12月2日 (日) 04:33Allen (讨论 | 贡献)的版本

跳转到: 导航, 搜索
Wikipedia-35x35.png 您可以在Wikipedia上了解到此条目的英文信息 Greenplum Thanks, Wikipedia.

Greenplum数据引擎是为了支持新一代数据仓库和大规模分析处理而建立的软件解决方案。Greenplum支持SQL和MapReduce并行处理功能,并能以较低的成本向管理TB量级到PB量级数据的企业提供业界领先的性能.

Greenplum向企业提供了两种世界上最好的技术——针对程序员的MapReduce和针对数据库管理员的SQL——并且将直接在Greenplum的并行数据流引擎(位于Greenplum数据引擎的中心)内部直接执行MapReduce和SQL。

并行数据流引擎:MapReduce + SQL

Greenplum MapReduce可以使程序员对储存在Greenplum数据引擎内部和外部的PB量级规模的数据集进行分析。Greenplum MapReduce带来的好处是一个不断增长的标准编程模型来满足关系数据库的可靠性和熟悉性。新的技术扩展了Greenplum数据引擎的功能,从而可以支持MapReduce程序。

了解下:Bizgres

特征

  • 无共享海量并行处理架构

负责在一组机器上进行数据的分配和查询的并行执行。包括充分利用10个以上、100个以上或1000个以上处理器的能力,充分并行。

  • 软件解决方案充分利用业界标准硬件

软件易于安装到来自一级厂商基于x86的业界标准服务器上,它在Linux 和 Solaris上都能运行。

  • 容错和先进的复制机制

无单点故障。系统在内部利用日志转移和分级复制来实现冗余,并提供自动恢复。

  • 线性的可扩展性

无共享体系结构和并行查询优化,确保性能和容量可以平滑地提高到100个以上的数据节点和1000个以上的处理器。

  • MapReduce支持

MapReduce已经被谷歌和雅虎等互联网领先企业证明是一种大规模数据分析技术。Greenplum将这种能力提供给企业。

  • 标准SQL

全面支持SQL-92和SQL-99与SQL 2003 年的OLAP扩展。所有的查询和执行都可以在系统内并行处理。

  • 统一分析处理

所有查询和分析(SQL、MapReduce、R等等)都在相同的并行数据流引擎上执行,使分析师、开发人员和统计人员运用共同的架构进行数据分析。

  • 可编程并行数据分析

向数学家和统计人员提供新的并行能力的平台,支持研究、线性代数和机器学习。

  • 数据库内部压缩

利用业界领先的压缩技术,以显著提高性能和减少所需空间来存储数据。客户可以看到磁盘空间会减少3-10倍,同时有效的I/O性能会相应增强。

  • PB量级规模导入

在所有群集节点高性能地同时执行并行数据导入,速率超过4.5TB小时。

  • 随时随地的数据存取

在数据引擎中,查询可以对于系统内还有系统外的数据来源进行分析并且返回答案,不论其所在地,格式,或存储介质。

  • 动态扩张

使企业方便地大量或小量增加数据仓库容量,避免昂贵的设备或SMP服务器升级。

  • 高级gNet互连技术

采用流水线技术和重新分配各节点的数据以实现复杂联结的高性能执行。

  • 负载管理

允许管理员创建基于角色的资源管理列表,以队列分配资源和管理系统的负载。

  • 集中管理

提供集群平台的管理工具和应用程序,使管理员管理多个数据库如同管理单一数据库。

  • 性能监控

图形性能监控可以使用户监控运行情况和历史查询并跟踪系统的利用率和资源。

  • 支持索引系统

Greenplum支持B-Tree、Hash、GiST和GIN等各种丰富的索引能力,确保数据工程师拥有实施最优设计所必要的工具。

  • 行业标准接口

支持标准数据库接口(SQL、ODBC、JDBC、DBI),可以和市场上领先的商业智能和提取/转换/导入(ETL)工具共同整合。

文档

链接

分享您的观点
个人工具
名字空间

变换
操作
导航
工具箱