专注于优秀项目维护的开源组织
不止于权威的文档视频技术支持

Apache Spark 2.3.0 发布,支持 Kubernetes 以及更多特性 | ApacheCN

Apache Spark 2.3.0 与昨天(2018-02-28)发布,以下是部分介绍,更多内容请参阅:

  1. http://spark.apache.org/releases/spark-release-2-3-0.html
  2. https://databricks.com/blog/2018/02/28/introducing-apache-spark-2-3.html

发行说明

Apache Spark 2.3.0 是 2.x 系列中的第四个版本。

此版本增加了对结构化流中的连续处理以及全新的 Kubernetes Scheduler 后端的支持。

其他主要更新包括新的 DataSource 和结构化 Streaming v2 API,以及一些 PySpark 性能增强。

更多详情请参阅: http://spark.apache.org/releases/spark-release-2-3-0.html

以下是官方 Blog 着重介绍的特性

  • 毫秒级别的连续流式处理
  • Stream-to-Stream Joins
  • Apache Spark On Kubernetes(屌的飞起)
  • 针对 PySpark 的 Pandas UDFs

更多详情请参阅: https://databricks.com/blog/2018/02/28/introducing-apache-spark-2-3.html

ps: 看来是时候得更新我们的 Spark 2.2.0 中文文档

欢迎转载,请注明来源:ApacheCN » Apache Spark 2.3.0 发布,支持 Kubernetes 以及更多特性 | ApacheCN
分享到: 更多 (0)
请简单粗暴地爱我 - 捐赠 0.66 元 (左:微信 OR 右:支付宝)

pay_weixinpay_weixin

评论 1

  1. #1

    是该更新了,api都变了

    匿名2周前 (05-12)回复

我们一直在努力

关于我们加入我们