等待下一个秋 - 分享Hadoop、Spark、Flink、Hive、数据仓库等主流大数据技术。

这几天上海疫情严重了，居家办公了几天，后面如果去公司上班需要核酸证明，今天去做了个核酸，竟然是桶鼻子，卧槽。不过说实话，捅鼻子也没啥，这酸爽犹如灵魂出窍，全身通透，让人飘飘然而不知所措。做一次管3天，后面可能还要去做，其实我在想传说中的肛拭子是啥样，我倒真希望体验一下。。。数据仓库系列文章(持续更新) 数仓架构发展史数仓建模方法论数仓建模分层理论数仓建模—宽表的设计数仓建模—指标体系数据仓库之拉链表数仓—数据集成数仓—数据集市数仓—商业智能系统数仓—埋点设计与管理数仓—ID Mapping 数…

2022年3月21日 0条评论 4313点热度 0人点赞等待下一个秋阅读全文

早晨起床的时候，发现自己尿分叉，我没有多想，简单洗洗就匆忙出门。路过早餐店，我看到师傅熟练的拉扯一小块面团，拉至细长条，然后放入油锅中，不一会功夫，一根屎黄色的油条便出锅了，卖相不错。我在想，小到炸屎黄色的油条，大到学习，其实都是一个熟能生巧的过程。数据仓库系列文章(持续更新) 数仓架构发展史数仓建模方法论数仓建模分层理论数仓建模—宽表的设计数仓建模—指标体系数据仓库之拉链表数仓—数据集成数仓—数据集市数仓—商业智能系统数仓—埋点设计与管理数仓—ID Mapping 数仓—OneID 数仓—A…

2022年3月3日 0条评论 3821点热度 0人点赞等待下一个秋阅读全文

数据仓库系列文章(部分已出，持续更新) 数仓架构发展史数仓建模方法论数仓建模分层理论数仓建模—宽表的设计数仓建模—指标体系数据仓库之拉链表数仓—数据集成数仓—数据集市数仓—商业智能系统数仓—埋点设计与管理数仓—ID Mapping 数仓—OneID 数仓—AARRR海盗模型数仓—总线矩阵数仓—数据安全数仓—数据质量数仓—数仓建模和业务建模关注公众号：大数据技术派，回复: 资料，领取1024G资料。埋点设计与管理埋点的作用开始之前我们先看一下我们为什么要收集埋点数据，埋点都可以做什…

2022年2月26日 0条评论 5589点热度 1人点赞等待下一个秋阅读全文

关注公众号：大数据技术派，回复“资料”，领取1024G资料。数据仓库系列文章(持续更新) 数仓架构发展史数仓建模方法论数仓建模分层理论数仓建模—宽表的设计数仓建模—指标体系数据仓库之拉链表数仓—数据集成数仓—数据集市数仓—商业智能系统数仓—埋点设计与管理数仓—ID Mapping 数仓—OneID 数仓—AARRR海盗模型数仓—总线矩阵数仓—数据安全数仓—数据质量数仓—数仓建模和业务建模数据集市(DM) 这里我们先回忆一下数据仓库的定义，数据仓库(Data Warehouse) 是…

2022年2月22日 1条评论 4626点热度 1人点赞等待下一个秋阅读全文

关注公众号：大数据技术派，回复: 资料，领取1024G资料。 Hive系列文章 Hive表的基本操作 Hive中的集合数据类型 Hive动态分区详解 hive中orc格式表的数据导入 Java通过jdbc连接hive 通过HiveServer2访问Hive SpringBoot连接Hive实现自助取数 hive关联hbase表 Hive udf 使用方法 Hive基于UDF进行文本分词 Hive窗口函数row number的用法数据仓库之拉链表测试数据 1,2020-04-20,420 2,2020-04-04…

2022年2月18日 0条评论 3270点热度 0人点赞等待下一个秋阅读全文

数据仓库系列文章(部分已出，持续更新) 数仓架构发展史数仓建模方法论数仓建模分层理论数仓建模—宽表的设计数仓建模—指标体系数据仓库之拉链表数仓—数据集成数仓—数据集市数仓—商业智能系统数仓—埋点设计与管理数仓—ID Mapping 数仓—OneID 数仓—AARRR海盗模型数仓—总线矩阵数仓—数据安全数仓—数据质量数仓—数仓建模和业务建模关注公众号：大数据技术派，回复资料，领取1024G资料。数据治理元数据管理数据质量数据模型安全管理主数据管理数据生命周期数据治理（Da…

2022年2月18日 0条评论 3395点热度 0人点赞等待下一个秋阅读全文

其实知识星球我以前就建立了，当时觉得自己没有那么多的精力维护，不能很好的帮助有需要的同学们，所以一直没有开放。最近很多同学私聊我学习路线，个人精力也是有限，并不能及时解答所有同学的问题。通过调查，大部分同学表示愿意加入知识星球，我也觉得这样让大家的提问更加有层次和意义，而不是问一些比较肤浅和不太合适的问题，有问题也能自己先查询一下，这样更好的交流和解答疑问，提升时间利用率。知识星球是付费的，如果你不想知识付费，也没关系我这也有免费的微信群，加我微信：ddxygq，回复加群，我拉你进大数据交流群。知识星球完全是自…

2022年2月17日 0条评论 2307点热度 3人点赞等待下一个秋阅读全文

Flink系列文章第01讲：Flink 的应用场景和架构模型第02讲：Flink 入门程序 WordCount 和 SQL 实现第03讲：Flink 的编程模型与其他框架比较第04讲：Flink 常用的 DataSet 和 DataStream API 第05讲：Flink SQL & Table 编程和案例第06讲：Flink 集群安装部署和 HA 配置第07讲：Flink 常见核心概念分析第08讲：Flink 窗口、时间和水印第09讲：Flink 状态与容错第10讲：Flink Sid…

2022年2月13日 0条评论 4117点热度 0人点赞等待下一个秋阅读全文

2022年2月11日 0条评论 5248点热度 0人点赞等待下一个秋阅读全文

2022年2月10日 0条评论 4134点热度 0人点赞等待下一个秋阅读全文

1…3 456 7…41

数据仓库—数据集成

数仓建模—ID Mapping

数仓建模—埋点设计与管理

数仓建模—数据集市

Hive之同比环比的计算

数据仓库—数据治理

知识星球

第17讲：生产环境中的并行度和资源设置

第16讲：如何处理Flink生产环境中的数据倾斜问题

第15讲：如何排查生产环境中的反压问题