R语言利用rvest包爬虫,主要用到函数:read_html()、html_nodes()、html_text()和html_attrs()。
安装这个包:install.packages('rvest')
read_html():下载网页;
html_nodes():获得指定...
柯广
2年前 (2019-04-06) 6910℃ 0评论
1喜欢
R语言中的管道%>%
%>%来自dplyr包的管道函数,我们可以将其理解为车间里的流水线,经过前一步加工的产品才能进入后一步进一步加工,其作用是将前一步的结果直接传参给下一步的函数,从而省略了中间的赋值步骤,可以大量减少内存中的对象,节省内存。
符号%>%,这是...
柯广
2年前 (2019-04-04) 6286℃ 0评论
1喜欢
R语言读写最灵活的文件——txt文件
R语言可以读取很多文件,其中以txt文本文件最为灵活,为什么呢,txt文件可以以任意符号作为分隔符,比如“,”,“\t”,空格,甚至“……&¥¥%¥”等任意自定义的分隔符号。
读取文件
这里先把工作空间切换到D盘下面,默认的一般是C盘...
柯广
2年前 (2019-04-03) 6690℃ 0评论
1喜欢
作为一门高级的数据分析语言,R语言不仅具有其它高级语言的自带大量内嵌函数的方便特性,而且它的一些函数更侧重于数据统计分析,成为越来越多的数据分析人员首选语言。下面就来列一下R中的一些常用函数。与matlab一样,作为第二个以向量式运算作为主要运算方式的编程语言,R的一些函数主要是...
柯广
2年前 (2019-04-03) 6201℃ 0评论
1喜欢
R语言某种程度来说本身就是一个函数库,因为它有大量的函数可供调用,加上函数式编程,使得R语言的功能很强大。但是,有时候,根据实际需要,我们还是需要自己动手编写函数,从而减少代码的缀余与工作量。
与其它语言一样,函数的组成莫过于关键字function、形参、是否返回值。函数的具体用...
柯广
2年前 (2019-04-03) 6343℃ 0评论
1喜欢
都知道R语言是向量式编程,可是有时候确实需要用到循环语句,这里就介绍R语言里面的主要循环——for循环。
与其它语言的for循环一样,R的for循环可以嵌套for循环或者其它循环。
单循环
> a for(i in 1:length(a)){s print(s)
[1]...
柯广
2年前 (2019-04-03) 5893℃ 0评论
1喜欢
R语言中的因子确实不好理解,很多人都这么觉得。在R语言中,因子(factor)表示的是一个符号、一个编号或者一个等级,即,一个点。例如,人的个数可以是1,2,3,4......那么因子就包括,1,2,3,4.....还有统计量的水平的时候用到的高、中、低,也是因子,因为他是一个点...
柯广
2年前 (2019-04-03) 5994℃ 0评论
1喜欢
Data Frame一般被译为数据框,感觉就像是R中的表,由行和列组成,与Matrix不同的是,每个列可以是不同的数据类型,而Matrix是必须相同的。Data Frame每一列有列名,每一行也可以指定行名。如果不指定行名,那么就是从1开始自增的Sequence来标识每一行。所以...
柯广
2年前 (2019-04-03) 5940℃ 0评论
1喜欢
R语言中的数组与其它语言数组类似,它是一种高维的数据结构。维数过高运算会很不方便,所以用的很少,这里介绍是本着不落下任何知识点的目的。万一以后遇到了,虽然不方便,还是可以进行运算的。当然了,矩阵是二维数组,是数组的一种特殊形式。R中的列表是一种特殊的数组,每个元素又可以是一个列表...
柯广
2年前 (2019-04-03) 6135℃ 0评论
1喜欢
很多人是在线性代数课学的矩阵,当时什么问题都没有,除了一个问题:学习矩阵到底有什么用呢?矩阵是一个集合,它里面可以存放很多对象,比如一个行就是一个对象(或者说记录),每一个对象又有很多(属性)列。如果把一组对象~属性表示成矩阵,我们就能很容易取出每个对象对应的某个属性了,并且根据...
柯广
2年前 (2019-04-02) 5931℃ 0评论
1喜欢
通过前面几篇,相信就算是新手也对R语言的历史,R运行环境有了大概的了解。下面就R语言特殊的赋值符号与基本数据元素——向量做简要概述。
1、赋值符号
相信大家学过的编程语言中,赋值符号都是“ = ”。当然了,在R语言中用“ = ”是可以的,但却被视为一种不好的编程习惯,大家都知道...
柯广
2年前 (2019-04-02) 5690℃ 0评论
1喜欢
如果你是一个新手,通过上一篇的内容我相信你已经把R语言环境安装好了。那么,你肯定迫切想写下自己的第一行R代码。那么,是在RGui、还是Rstudio环境呢?这里建议你用Rstudio,作为一个优秀的编辑器,Rstudio一直很受R语言爱好者的喜爱。
这里简单介绍一下,Rstud...
柯广
2年前 (2019-04-02) 6529℃ 0评论
1喜欢
想要运行R语言代码,首先需要安装好R语言的运行环境——RGui,很多人包括我自己喜欢另一个运行环境——Rstudio。下面分别就安装RGui、Rstudio做分别说明。
安装RGui
去R语言官方网站下载最新的安装包版本,网址:https://www.r-project.org/...
柯广
2年前 (2019-04-02) 6355℃ 0评论
1喜欢
R软件是一款集成了数据操作、统计和可视化功能的优秀的开源软件。R软件具备高效的数据处理和存储功能,擅长数据矩阵操作,提供了大量适用于数据分析的工具,支持各种数据可视化输出。R软件的一大优势是分析人员可利用简单的R程序语言描述处理过程,以构建强大的分析功能。此外,R软件具备良好可扩...
柯广
4年前 (2017-05-03) 5806℃ 0评论
1喜欢