“New York is 3 hours ahead of California, 纽约时间比加州时间早三个小时, but it does not make California slow. 但加州时间并没有变慢。 Someone graduated at the age of 22, 有人22岁就毕业了, but waited 5 years before securing a good job! 但等了五年才找到好的工作! Someone became a CEO at 25, 有人25岁就当上CEO, and…

2021年6月25日 2条评论 835点热度 1人点赞 ikeguang 阅读全文

一套小象学院机器学习视频教程。 资料详情 1、机器学习数学基础 2、机器学习的数学基础 3、机器学习的哲学 4、机器学习的数学基础 5、经典机器学习模型 6、经典机器学习模型 7、集成学习 8、线性模型 9、线性模型 10、核方法 11、核方法 12、统计学习 13、统计学习 14、统计学习 15、统计学习 16、无监督学习 17、流形学习 18、概念学习 19、神经网络 20、强化学习 获取方法 关注公众号 【大数据技术派】,后台回复:机器学习,即可获得。

2021年6月20日 0条评论 691点热度 0人点赞 ikeguang 阅读全文

一套黑马程序员前端视频教程,第71期。 资料详情 获取方法 关注公众号 【Java大数据与数据仓库】,后台回复:黑马前端,即可获得。

2021年6月20日 0条评论 746点热度 0人点赞 ikeguang 阅读全文

有些时候需要我们去统计某一个hbase表的行数,由于hbase本身不支持SQL语言,只能通过其他方式实现。 可以通过一下几种方式实现hbase表的行数统计工作: 这里有一张hbase表test:test: hbase(main):009:0> scan 'test:test' ROW COLUMN+CELL 1 column=info:name, timestamp=1590221288866, value=tom 2 column=info:name, timestamp=1590221288866, va…

2021年6月16日 0条评论 485点热度 0人点赞 ikeguang 阅读全文

从 2018 年 2 月开始,微信做了一项重大调整:新注册的公众号将没有留言功能。 说实在的,没有留言的公众号,仿佛失去了灵魂,让人觉得很鸡肋,如何与粉丝互动 ? 原想等留言功能恢复,但等了一年多了,眼看着“点赞”->“好看”->“在看”,但留言还是遥遥无期,真让人无语哎!所以呢,只能自己想办法做迁移了! 而且现阶段,微信仅支持为企业公众号开通留言。也就是说,如果你是个人公众号,要开通留言就必须进行以下几步: 注册一个个体户(或者公司) 用该个体户(或者公司)注册一个企业公众号 对该企业公众号进行微信认证 为该企业…

2021年6月12日 0条评论 996点热度 0人点赞 ikeguang 阅读全文

实时统计pv、uv是再常见不过的大数据统计需求了,前面出过一篇SparkStreaming实时统计pv,uv的案例,这里用Flink实时计算pv,uv。 我们需要统计不同数据类型每天的pv,uv情况,并且有如下要求. - 每秒钟要输出最新的统计结果; - 程序永远跑着不会停,所以要定期清理内存里的过时数据; - 收到的消息里的时间字段并不是按照顺序严格递增的,所以要有一定的容错机制; - 访问uv并不一定每秒钟都会变化,重复输出对IO是巨大的浪费,所以要在uv变更时在一秒内输出结果,未变更时不输出; Flink数据…

2021年6月10日 0条评论 534点热度 1人点赞 ikeguang 阅读全文

数据迁移使用场景 冷热集群数据分类存储,详见上述描述. 集群数据整体搬迁.当公司的业务迅速的发展,导致当前的服务器数量资源出现临时紧张的时候,为了更高效的利用资源,会将原A机房数据整体迁移到B机房的,原因可能是B机房机器多,而且B机房本身开销较A机房成本低些等. 数据的准实时同步.数据的准实时同步与上一点的不同在于第二点可以一次性操作解决,而准实时同步需要定期同步,而且要做到周期内数据基本完全一致.数据准实时同步的目的在于数据的双备份可用,比如某天A集群突然宣告不允许再使用了,此时可以将线上使用集群直接切向B的同步…

2021年6月9日 0条评论 475点热度 0人点赞 ikeguang 阅读全文

%>%来自dplyr包的管道函数,我们可以将其理解为车间里的流水线,经过前一步加工的产品才能进入后一步进一步加工,其作用是将前一步的结果直接传参给下一步的函数,从而省略了中间的赋值步骤,可以大量减少内存中的对象,节省内存。 符号%>%,这是管道操作,其意思是将%>%左边的对象传递给右边的函数,作为第一个选项的设置(或剩下唯一一个选项的设置。 简单例子 比如我们要算f(x)=sin((x+1)^2)在x=4的值,可以分为以下三步: 计算a = x+1的值; 计算b = a^2的值; 计算c = sin(b)的值 这样…

2021年6月9日 0条评论 820点热度 1人点赞 ikeguang 阅读全文

阅读本文需要的知识储备: 高等数学 运筹学 Python基础 1、引出梯度下降 对于,线性回归问题,上一篇我们用的是最小二乘法,很多人听到这个,或许会说:天杀的最小二乘法,因为很多人对它太敏感了。是的,从小到大,天天最小二乘法,能不能来点新花样。这里就用数学算法——梯度下降,来解决,寻优问题。 当然了,我们的目标函数还是: 在开始之前,我还是上大家熟知常见的图片。 梯度下山图片(来源:百度图片) 找了好久,我选了这张图片,因为我觉得这张图片很形象:天气骤变,一个人需要快速下山回家,但是他迷路了,不知道怎么回家,他知…

2021年6月9日 0条评论 728点热度 0人点赞 ikeguang 阅读全文

最近有个需求,实时统计pv,uv,结果按照date,hour,pv,uv来展示,按天统计,第二天重新统计,当然了实际还需要按照类型字段分类统计pv,uv,比如按照date,hour,pv,uv,type来展示。这里介绍最基本的pv,uv的展示。 id uv pv date hour 1 155599 306053 2018-07-27 18 关于什么是pv,uv,可以参见这篇博客:https://blog.csdn.net/petermsh/article/details/78652246 1、项目流程 日志数据从…

2021年6月3日 0条评论 506点热度 0人点赞 ikeguang 阅读全文