敬请期待。。。
记得我是数学系的,大二时候因为参加数学建模,学习Python爬虫,去图书馆借了一本Python基础书,不厚,因为有matlab和C语言基础,这本书一个星期看完了,学完后感觉Python入门很快,然后要开始学爬虫和矩阵计算,学习一下对应的包就行了,感觉很方便,爱上了这门语言,虽然毕业后做了Java,但是平时工作中也会用一些Python。不过初学者有很多基础知识点记不住,因为用得少,这里总结记录一下。更多Python知识,可以前往我的个人博客网站 等待下一个秋-Python 介绍 Python 是一门独特的语言,快速浏…
阅读本文需要的知识储备: 高等数学 概率论与数理统计 Python基础 线性回归,其实生活中有很多这样的例子,比如:票价与行车距离、服务质量之间的关系,买房时房价与面积、地域等的关系。给我们一组这样的数据,我们想找出一个数学关系来描述这个问题,从而得到自己想要的结论。那么,怎么样才能使得你确定出的关系是一个好的线性关系呢。最著名的当数最小二乘法了。 最小二乘法原理 众所周知,最小二乘法原理就是利用,拟合直线上面的因变量值与实际值的残差平方和最小作为优化目标。从而确定出我们需要找出的的系数。给定一组数据X = (X1…
折腾了1天,搭好博客的基本样子,然后会调一些问题,增加一些功能,前前后后,大概折腾了,1天加4个晚上。这里记录一下安装过程中遇到的一些困难,希望对同学们有帮助! 需要准备的东西 域名一个,腾讯云主机一个,笔记本一台(安装了xshell或者mac笔记本) 安装wordpress过程 自定百度,文章很多,我也是懒得重复写了,注意里面下载的是最新版wordpress,我们需要去官网下载4.x版本的,前面安装nginx,mysql,php都是一样的。只是安装完成后会有php版本太低的问题,我安装的php版本:5.6.40,…
K-Means算法是最基础的聚类算法、也是最常用的机器学习算法之一。 本教程中,我们利用K-Means对图像中的像素点进行聚类,然后用每个像素所在的簇的中心点来代替每个像素的真实值,从而达到图像压缩的目的。 非负矩阵分解(Non-negative Matrix Factorization, NMF)是一种对非负矩阵进行低维近似逼近的常见方法,同样也能达到图像压缩的目的。 预计学习用时:30分钟。 本教程基于Python 3.5。 原创者:SofaSofa TeamM | 修改校对:SofaSofa TeamC | …
Hive系列文章 Hive表的基本操作 Hive中的集合数据类型 Hive动态分区详解 hive中orc格式表的数据导入 Java通过jdbc连接hive 通过HiveServer2访问Hive SpringBoot连接Hive实现自助取数 hive关联hbase表 Hive udf 使用方法 Hive基于UDF进行文本分词 Hive窗口函数row number的用法 数据仓库之拉链表 hive作为一个sql查询引擎,自带了一些基本的函数,比如count(计数),sum(求和),有时候这些基本函数满足不了我们的需求…
Python发送邮件代码,Python2/3都可以直接使用。 发送普通邮件 发送文本和html普通邮件如下: from email.header import Header from email.mime.text import MIMEText from email.utils import parseaddr, formataddr import smtplib def _format_addr(s): name, addr = parseaddr(s) return formataddr((Header(na…
Python2里面默认有一个包叫做turtle,别名:乌龟,对于Python初学者很有吸引力,适合学习。这个包,主要是画图用的,这里用它画个图,并提供源码。 源码 import turtle def draw_square(turtle): for i in range(4): turtle.forward(100) turtle.right(90) def draw_flower(turtle): for i in range(36): draw_square(turtle) turtle.right(10) d…
我相信很多人,跟我一样,经常需要生成各种二维码,好在微信中发送,传播,我通常都会用一个几行python代码的脚本快速生成二维码。 想用的时候,随时输入一个命令,就能生成二维码。 废话不多说,直接上脚本(python 2.7 版本) import qrcode import sys def run(url, path): qr_image = qrcode.make(url) qr_image.save(path) if __name__ == '__main__': args = sys.argv if len(a…
R语言利用rvest包爬虫,主要用到函数:read_html()、html_nodes()、html_text()和html_attrs()。 安装这个包:install.packages('rvest') read_html():下载网页; html_nodes():获得指定名称的网页元素、节点; html_text():获得指定名称的网页元素、节点里面的文本; html_attrs():获得指定的网址; 以新浪内地新闻为例 下面是新浪内地新闻网址:http://news.sina.com.cn/china/ 我…