来吧,这个是传智播客的大数据视频资料,包括每一天的文档和视频。 这个是文档,大部分人应该都是想要文档,除了没有基础的新手,而不想要视频,因为看视频真的太花时间啦。 获取方法:关注公众号:大数据技术派,回复"大数据",即可获得这份很全的文档。 我自己整理了一份pdf: 链接:https://pan.baidu.com/s/1-aTKicy0Yr9c3-dv0bIExA 提取码:1314 复制这段内容后打开百度网盘手机App,操作更方便哦 视频,这个很大,百度网盘经常封禁这个,我建了个百度网盘群,可…

2021年4月11日 0条评论 1521点热度 1人点赞 ikeguang 阅读全文

目前大家理财主要有三种方式: 基金 股票 定期 有的人偏爱基金,因为相对平稳,风险也能承担;有的人偏爱股票,因为长期价值投资也是可以的;也有人偏爱定期理财,通常大家都会配置一点,确实稳。 我对基金情有独钟,不喜欢股票和定期理财;一方面是因为股票风险大,我也不会挑选好股票,也没那么多时间去关注和频繁买卖;另一方面是定期理财利息太低了,去年放了一年年化收益才4%,通货膨胀都超过10%啦。 我现在买了一些基金,目前还是亏本的,主要是年后抄底在半山腰,哈哈。 虽然近期反弹,可以我还是没有回本,因为抄底太早啦,但凡晚抄底一天…

2021年4月7日 1条评论 1518点热度 0人点赞 ikeguang 阅读全文

在上一篇文章中我们介绍了窗口相关的内容,那么问题来了,比如公司组织春游,规定周六早晨8:00 ~ 8:30清查人数,人齐则发车出发,可是总有那么个同学会睡懒觉迟到,这时候通常也会等待20分钟,但是不能一直等下去,如果到了20分钟则认为,想自己在家过周末,不参与春游活动了,不会继续等待了,直接出发。 这种机制跟这里要讲的watermark机制是一个意思。指的是,由于网络延迟等原因,一条数据会迟到计算,比如使用event time来划分窗口,我们知道窗口中的数据是计算一段时间的数据,如果一个数据来晚了,它的时间范围已经…

2021年4月1日 0条评论 2021点热度 0人点赞 ikeguang 阅读全文

关注公众号:Java大数据与数据仓库,回复 "资料",领取大数据资料,学习大数据技术。 窗口 在流处理应用中,数据是连续不断的,因此我们不可能等到所有数据都到了才开始处理。当然我们可以每来一个消息就处理一次,但是有时我们需要做一些聚合类的处理,例如:在过去的1分钟内有多少用户点击了我们的网页。在这种情况下,我们必须定义一个窗口,用来收集最近一分钟内的数据,并对这个窗口内的数据进行计算。 Flink 认为 Batch 是 Streaming 的一个特例,所以 Flink 底层引擎是一个流式引擎,在上面实现了流处理和批…

2021年4月1日 0条评论 2299点热度 1人点赞 ikeguang 阅读全文