活了二十多年,没能为祖国、为人民做点什么,每思及此,伤心欲绝 !

柯广的文章

大数据

Hive窗口函数row number的用法

Hive窗口函数row number的用法
row_number 前面我们介绍窗口函数的时候说到了窗口函数的使用场景,我们也给它起了一个名字进行区分,通用窗口函数和特殊窗口函数,今天我们就来看一下排序相关的窗口函数,因为是窗口函数,并且我们说它是用来排序的,我们大概也能猜到它就是用来对窗口内的数据进行排序的 其实关于排序...

2个月前 (01-07) 2433℃ 0评论 1喜欢

大数据

Hive 中的四种排序详解,再也不会混淆用法了。

Hive 中的四种排序详解,再也不会混淆用法了。
Hive 中的四种排序 排序操作是一个比较常见的操作,尤其是在数据分析的时候,我们往往需要对数据进行排序,hive 中和排序相关的有四个关键字,今天我们就看一下,它们都是什么作用。 数据准备 下面我们有一份温度数据,tab 分割 2008 32.0 2008 21....

2个月前 (01-06) 2421℃ 0评论 0喜欢

日记

挥手告别2020,挺胸迎接2021

挥手告别2020,挺胸迎接2021
题外话:本来想跟同学去外滩跨年,感受刀子般的凛风带来的肉体上的刺激,可是一个同学说他还在穿秋天的衣服,没有衣服穿不敢出门,怕被冻死。shit,真扫兴,这傻*。所以下班点我坐在座位上,上了会网,突然产生了一个很有价值的想法,我激动的站了起来,结果发现办公室已经没人了,早都下班回家...

2个月前 (12-31) 2823℃ 0评论 5喜欢

大数据

Hive基于UDF进行文本分词

Hive基于UDF进行文本分词
Hive系列文章 Hive表的基本操作 Hive中的集合数据类型 Hive动态分区详解 hive中orc格式表的数据导入 Java通过jdbc连接hive 通过HiveServer2访问Hive SpringBoot连接Hive实现自助取数 hive关联hbase表 Hive ...

2个月前 (12-30) 2738℃ 0评论 1喜欢

大数据

数据湖是谁?那数据仓库又算什么?

数据湖是谁?那数据仓库又算什么?
刀光剑影江湖情,摧枯拉朽浪滔滔。功名利禄拂衣去,山高水远路迢迢。 数据湖初识 近两年,为什么都开始谈论起 Data Lake 这个”新名词”了? 先说说我的想法,其实还是用户需求驱动数据服务,大家开始关注 Data Lake 的根本原因是用户需求发生了质变,过去的数据仓库模式以及...

2个月前 (12-25) 2919℃ 0评论 3喜欢

大数据

Hive动态分区详解

Hive动态分区详解
Hive系列文章 Hive表的基本操作 Hive中的集合数据类型 Hive动态分区详解 hive中orc格式表的数据导入 Java通过jdbc连接hive 通过HiveServer2访问Hive SpringBoot连接Hive实现自助取数 hive关联hbase表 Hive ...

2个月前 (12-23) 3078℃ 1评论 2喜欢

日记

为什么要多读书

为什么要多读书
书中自有黄金屋,书中自有颜如玉。书是人类进步的阶梯。古今中外的先贤们已经给出了明确的答案,多读书对一个人的改变和产生的影响无疑是显著的。 1. 思想境界 早有人说过“纸上得来终觉浅,绝知此事要躬行”,光懂了书本上的知识,你只是知道,而非做到。就好像老师说考试很简单,就是这两套卷子...

2个月前 (12-20) 3116℃ 0评论 1喜欢

大数据

Hive中的集合数据类型

Hive中的集合数据类型
Hive系列文章 Hive表的基本操作 Hive中的集合数据类型 Hive动态分区详解 hive中orc格式表的数据导入 Java通过jdbc连接hive 通过HiveServer2访问Hive SpringBoot连接Hive实现自助取数 hive关联hbase表 Hive ...

2个月前 (12-20) 3203℃ 0评论 0喜欢

大数据

通过HiveServer2访问Hive

通过HiveServer2访问Hive
Hive系列文章 Hive表的基本操作 Hive中的集合数据类型 Hive动态分区详解 hive中orc格式表的数据导入 Java通过jdbc连接hive 通过HiveServer2访问Hive SpringBoot连接Hive实现自助取数 hive关联hbase表 Hive ...

3个月前 (12-18) 3256℃ 0评论 0喜欢

大数据

Hive 分析函数lead、lag实例应用

Hive 分析函数lead、lag实例应用
Lag和Lead分析函数可以在同一次查询中取出同一字段的后N行的数据(Lag)和前N行的数据(Lead)作为独立的列。 这种操作可以代替表的自联接,并且LAG和LEAD有更高的效率,其中over()表示当前查询的结果集对象,括号里面的语句则表示对这个结果集进行处理。 1 LEAD...

3个月前 (12-17) 3247℃ 0评论 0喜欢

大数据

数据仓库之拉链表

数据仓库之拉链表
Hive系列文章 Hive表的基本操作 Hive中的集合数据类型 Hive动态分区详解 hive中orc格式表的数据导入 Java通过jdbc连接hive 通过HiveServer2访问Hive SpringBoot连接Hive实现自助取数 hive关联hbase表 Hive ...

3个月前 (12-15) 3375℃ 0评论 0喜欢

就聊挣钱

一个人单枪匹马,筹备线下培训班

一个人单枪匹马,筹备线下培训班
在开设传统培训班时,正常的流程是先预订酒店,提前担负几万、十几万的会务开支。之后再在开课之前,招募到足够多的学员,以此保证收支平衡。而我筹备的这次培训完全不一样,因为我不必提前承担不可预知的会务成本。我通过发展种子学员的方式,用最轻松、最简单的方法达到了我预期的效果。 组织一场线...

3个月前 (12-13) 3518℃ 1评论 0喜欢

大数据

数仓架构发展史

数仓架构发展史
发展史 时代的变迁,生死的轮回,历史长河滔滔,没有什么是永恒的,只有变化才是不变的,技术亦是如此,当你选择互联网的那一刻,你就相当于乘坐了一个滚滚向前的时代列车,开往未知的方向,不论什么样的技术架构只有放在当前的时代背景下,才是有意义的,人生亦是如此。 时间就是一把尺子,它能衡...

3个月前 (12-13) 2210℃ 0评论 0喜欢

SEO

别被骗了,网站友链有作用吗?

别被骗了,网站友链有作用吗?
超链接<a>里面的属性nofollow就是告诉搜索引擎:不要跟踪我。也就是说不让搜索蜘蛛继续追踪,同样,也不传递丝毫的权重。 通俗说,就是一个人推荐你,说你很优秀,跟着偷偷来一句:别当真!所以,友链里面别人给你加了noflollow属于偷奸耍滑的,别和他做友链了,果断...

3个月前 (12-12) 3468℃ 0评论 0喜欢

大数据

数仓建模分层理论

数仓建模分层理论
分层建设理论 简单点儿,直接ODS+DM就可以了,将所有数据同步过来,然后直接开发些应用层的报表,这是最简单的了;当DM层的内容多了以后,想要重用,就会再拆分一个公共层出来,变成3层架构,这个过程有点类似代码重构,就是在实践中不断的进行抽象、总结。 数仓的建模或者分层,其实都是为...

3个月前 (12-12) 1989℃ 0评论 0喜欢