概述 Apache Beam 是什么?Apache Beam 是统一的批/流数据处理的编程模型。本文主要是参考官方文档,用 Docker 来快速跑起来一个用 Beam 来构建的 Flink 程序来处理数据的 D
概述 Apache Griffin 是一个应用于分布式数据系统中的开源数据质量解决方案。在 Hadoop, Spark, Storm 等分布式系统中,提供了一整套统一的流程来定义和检测数据集的质量并及时报告
概述 过去十年,Hadoop 生态的各类组件早已成为大数据领域的事实标准,很多公司围绕 Hadoop 生态,构建出自己的大数据处理到机器学习的管道。而 Kubernetes 作为容
概述 Mac 系统要折腾这些东西还是挺麻烦的,为了不麻烦,建议安装个虚拟机玩玩(前提是你的 Mac 配置不能太低,16G 内存还是可以随便玩的) 步骤 https://www.virtualbox.org/wiki/Downloads 基本上安
概述 本地 Mac 做 rsync 到远程服务器,发现远程服务器的中文文件名都是乱码,查了一下发现是中文环境没有安装。 脚本 1 2 3 dnf install glibc-langpack-zh.x86_64 echo LANG=zh_CN.UTF-8 > /etc/locale.conf source /etc/locale.conf 参考资料 设置操作
概述 从腾讯云购买的 CVM 实例的默认内核版本是 3.10.0-1160.71.1.el7.x86_64,因此要安装 bcc 软件的话,需要先升级内核。 内核版