小白学习大数据

关于这个系列的文章

我本人算是大数据的初学者,在学习大数据的过程中,经常遇到为什么用这个东西,为什么他能提高效率,为什么这个技术能更好的提高性能,这段代码会在哪些机子上执行这些问题。而搭建过程中也会遇到一些明明按照教程来的为什么就失败了。

我在学习过程中记录下这些细节,为了理清思路,让新手更容易学习和理解大数据,写了这个系列的文章。

Hadoop家族

浅谈—–大数据分析的两大核心:存储构架和计算构架

Spark家族

浅谈—–Spark计算为什么比Hadoop快

Postgresql家族

扩展阅读—–MPP和Hadoop的定位以及分别适合的场景

其他存储系统

快速查询