-
此处记录我在各个阶段的笔记心得,更新频率不固定,更新时间与文章实际书写时间不保证对应
-
存在约1%的内容是直接收藏的未标注禁止转在的文章,并且如无疏漏,均在开始处附带了原文连接
-
主要内容包括
- 数据仓库建设
-
以Hadoop - Spark 为基础的ETL 与 数据分析
-
以Spark(kafka) 为基础的 流处理(实时推荐,实时计算)
-
大数据技术/理论部分
- 数据建模(数据仓库-主要内容)
- Hadoop
- Spark(主要内容)
- hive
- hbasse
- kafka - 其他
-
基础部分
- Java
- Scala
-
Server部分