/images/avatar.png

runzhliu

Spark优化

概述 本文转自: https://blog.csdn.net/Winner941112/article/details/82899277 Spark优化(一): 避免重复RDD 通常来说,我们在开发一个 Spark 作业时,首先是基于某个数据源(比如Hive表或HDFS文件)创

Spark中的RPC

概述 本文是转载的: https://zhuanlan.zhihu.com/p/28893155 Spark 是一个快速的、通用的分布式计算系统,而分布式的特性就意味着,必然存在节点间的通信,本文主要介绍不同的 Spark 组件之间是如何通

SQL基础

概述 下面聊几个 SQL 的基础知识。 DML DML(data manipulation language)数据操纵语言,就是我们最经常用到的 SELECT、UPDATE、INSERT

stdout和stderr的区别

概述 下文主要讲解一下 stdout 和 stderr 的区别。 stdout和stderr的区别 如下一个小例子: 1 2 3 4 5 6 7 8 9 10 11 12 int main(void) { char * err1 = "你遇到的错

tcsetpgrp-failed重新编译tini

概述 在启动 Spark Operator 的时候出现了一个意想不到的问题。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 # kubectl log -n kube-system spark-sparkoperator-86f6c889cd-ggbmc log is DEPRECATED and will be removed in a future version. Use logs instead. ++ id -u + myuid=185 ++

Tensorboard-on-K8S

概述 本文会详细介绍在 K8S 集群中,部署 Tensorboard 的过程,以及解释一些知识点。关于 Tensorboard 的学习和运用,非常建议浏览官方的教程! https://www.tensorflow.org/guide/summaries_and_tensorboard?hl=zh-CN 另外,对于 K8S 还不熟悉的同学,可