专注于优秀项目维护的开源组织
不止于权威的文档视频技术支持

Apache Kudu 1.4.0 中文文档 | ApacheCN

ApacheCN cwiki 地址为 : http://cwiki.apachecn.org/pages/viewpage.action?pageId=10813594

已完成 80%,欢迎加入我们一起来完成翻译!~

还差一点点就完工了,欢迎有想法的朋友,一起来维护迭代更新,另找找一位 kudu 的 admin,专门跟进这个事情,需要花的时间,稍微多一点点,有兴趣的联系我!!!

Apache Kudu 1.4.0 中文文档


Kudu 是一个针对 Apache Hadoop 平台而开发的列式存储管理器。Kudu 共享 Hadoop 生态系统应用的常见技术特性: 它在 commodity hardware(商品硬件)上运行,horizontally scalable(水平可扩展),并支持 highly available(高可用)性操作。

Kudu 有许多不错的设计,它的一些优点包括 :

  • OLAP 工作的快速处理。
  • 与 MapReduceSpark 和其他 Hadoop 生态系统组件集成。
  • 与 Apache Impala(incubating)紧密集成,使其与 Apache Parquet 一起使用 HDFS 成为一个很好的可变的替代方案。
  • 强大而灵活的一致性模型,允许您根据每个 per-request(请求选择)一致性要求,包括 strict-serializable(严格可序列化)一致性的选项。
  • 针对同时运行顺序和随机工作负载的情况性能很好。
  • 易于管理以及可以使用 Cloudera Manager 来进行管理。
  • High availability(高可用性)。Tablet Servers 和 Masters 使用了 Raft Consensus Algorithm,确保只要有一半以上的副本可用,该 tablet 便可用于读写。例如,如果 3 个副本中有 个或 个副本中的 个可用,则该 tablet 可用。即使在 leader tablet 出现故障的情况下,读取功能也可以通过 read-only(只读的)follower tablets 来进行服务。
  • 结构化数据模型。

通过结合这些所有的特性,Kudu 目标是支持在当代 Hadoop 存储技术上难以实现的应用的家族。Kudu 是一个很好的解决方案的几个例子是 :

  • 报告那些需要立即向终端用户提供  newly-arrived(新来的)数据的应用程序。
  • 必须同时支持的 Time-series(时间序列)应用程序 :
    • 查询大量历史数据。
    • 必须非常快地返回关于单个实体的细粒度查询。
  • 使用预测模型进行实时决策的应用程序,可根据所有历史数据定期刷新预测模型。
  • 有关这些和其他方案的更多信息,请参阅 Example Use Cases

。。。。。。

更多细节介绍请看 : http://cwiki.apachecn.org/pages/viewpage.action?pageId=10813605

欢迎转载,请注明来源:ApacheCN » Apache Kudu 1.4.0 中文文档 | ApacheCN
分享到: 更多 (0)
请简单粗暴地爱我 - 捐赠 0.66 元 (左:微信 OR 右:支付宝)

pay_weixinpay_weixin

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

我们一直在努力

关于我们加入我们