/images/avatar.png

runzhliu

Spark-on-Kubernetes实战目录

1 Spark 简介和入门 1.1 Spark Overview 1.2 Spark Core 1.3 Spark SQL 1.4 Spark Streaming 1.5 Spark MLlib 1.6 分布式 Spark 架构 1.6.1 Standalone 1.6.2 Apache Mesos 1.6.3 Hadoop Yarn 1.6.4 Kubernetes 1.7 小结 2 Kubernetes 简介和入门 2.1 Kubernetes 基础概念 用较少的篇幅介绍 Master/Node/Pod/Label/Deployment/Job/Volume/Namespace/ConfigMap 等基础概念。

Spark-Shuffle过程

Shuffle Writer Spark 丰富了任务类型,有些任务之间数据流转不需要通过 shuffle,但是有些任务之间还是需要通过 shuffle 来传递数据,比如 wide dependency 的 group by key。 Spark 中需要