等待下一个秋 - 分享Hadoop、Spark、Flink、Hive、数据仓库等主流大数据技术。

1. SQLAlchemy Python2/3都支持它，SQLAlchemy 自己无法操作数据库，必须结合 pymsql 等第三方插件，所以也需要安装pymysql。 pip2 install pymysql pip2 install SQLAlchemy 用法： from sqlalchemy import create_engine, Column, Integer, String, DateTime from sqlalchemy.orm import declarative_base, Session # …

2022年7月5日 0条评论 3381点热度 0人点赞等待下一个秋阅读全文

一、简介 Supervisor 是一款 Python 开发的进程管理系统，允许用户监视和控制 Linux 上的进程，能将一个普通命令行进程变为后台守护进程，异常退出时能自动重启详细介绍查阅：Supervisor Introduction 二、安装 Supervisor 支持 Linux 和 Mac，不支持 Windows 本文系统为： centos，supervisor==4.2.4 pip3 install supervisor 安装完成后，在Python bin目录下面会有这样几个文件。 ls /usr/lo…

2022年7月5日 0条评论 3694点热度 0人点赞等待下一个秋阅读全文

1. windows安装去Python官网下载windows安装包，按照安装向导一直点击下一步即可，安装向导最好勾选Add Python3.x to PATH，这样就不用手动添加环境变量了。 2. linux安装 linux安装比较复杂，需要安装一些系统依赖，再编译安装。 1).下载源码tar包 cd /usr/local wget https://mirrors.huaweicloud.com/python/3.8.5/Python-3.8.5.tgz 注：国内华为镜像下载会稳定快些，https://mirro…

2022年7月5日 0条评论 3429点热度 0人点赞等待下一个秋阅读全文

认识我的人，包括我的朋友，或者从互联网上了解到我的人，都知道我从大学开始，就喜欢折腾副业，也确实挣了一些钱。光看见贼吃肉，没看见贼挨打！其实，有段时间我还是很大胆的，这让我也亏了几万块钱！这里说出来，让大家开心开心，同时引以为戒?！ 2018年的时候，我觉得靠着程序员上班的微末工资，实现自由职业者还是很难也很慢的。当时，在线教育还是很火的，并且在前面大学靠着自己录制的课程尝了很大甜头的我，很想继续沿着这个赛道做大，甚至做强。本身不是运营出身，我对很多运营、商业思维啥都不懂，当时我思考了好久，杀死一亿脑细胞，想到…

2022年7月1日 2条评论 9000点热度 2人点赞等待下一个秋阅读全文

1、原索引 PUT my_index { "mappings": { "_doc": { "properties": { "create_date": { "type": "date", "format": "yyyy-MM-dd ||yyyy/MM/dd" …

2022年6月17日 0条评论 962点热度 0人点赞等待下一个秋阅读全文

并不是索引越多越好，索引是一种以空间换取时间的方式，所以建立索引是要消耗一定的空间，况且在索引的维护上也会消耗资源。这里有张用户浏览商品表，建表语句： CREATE TABLE `product_view` ( `id` int(11) NOT NULL AUTO_INCREMENT, `user_id` int(11) NOT NULL, `product_id` int(11) NOT NULL, `server_id` int(11) NOT NULL, `duration` int(11) NOT NUL…

2022年6月7日 0条评论 2825点热度 0人点赞等待下一个秋阅读全文

数据仓库系列文章(持续更新) 数仓架构发展史数仓建模方法论数仓建模分层理论数仓建模—宽表的设计数仓建模—指标体系数据仓库之拉链表数仓—数据集成数仓—数据集市数仓—商业智能系统数仓—埋点设计与管理数仓—ID Mapping 数仓—OneID 数仓—AARRR海盗模型数仓—总线矩阵数仓—数据安全数仓—数据质量数仓—数仓建模和业务建模关注公众号：大数据技术派，回复: 资料，领取1024G资料。凡事无规矩不立，所以你会经常看到各种各样的规范，面对规范需要遵守，但是不能盲目，例如我们开发人员最…

2022年5月5日 0条评论 3988点热度 2人点赞等待下一个秋阅读全文

数据仓库系列文章(持续更新) 数仓架构发展史数仓建模方法论数仓建模分层理论数仓建模—宽表的设计数仓建模—指标体系数据仓库之拉链表数仓—数据集成数仓—数据集市数仓—商业智能系统数仓—埋点设计与管理数仓—ID Mapping 数仓—OneID 数仓—AARRR海盗模型数仓—总线矩阵数仓—数据安全数仓—数据质量数仓—数仓建模和业务建模工欲善其事，必先利其器，所以开始数仓建模之前我们还是要选择一个合适的建模工具，江湖上混怎么能没有一个响亮的名号和趁手的武器呢，PDMan就是我们要介绍的工具。后…

2022年4月16日 0条评论 3824点热度 1人点赞等待下一个秋阅读全文

今天是我在上海租房的小区被封的第三天，由于我的大意，没有屯吃的，外卖今天完全点不到了，中午的时候我找到了一包快过期的肉松饼，才补充了1000焦耳的能量。但是中午去做核酸的时候，我感觉走路有点不稳，我看到大白的棉签深入我的嘴里，我竟然以为是吃的，差点咬住了，还好我有仅存的一点意识。下午我收到女朋友给我点的外卖——面包（我不知道她是怎么点到的外卖，我很感动），很精致的面包，搁平时我基本不喜欢吃面包，但是已经到了这个份上，我大口吃起来，竟然觉得这是世界上最好吃的食物了。明天早晨5：50的闹钟，去叮咚和美团买菜，看能不能抢…

2022年3月30日 0条评论 4208点热度 0人点赞等待下一个秋阅读全文

Spark系列面试题 Spark面试题（一） Spark面试题（二） Spark面试题（三） Spark面试题（四） Spark面试题（五）——数据倾斜调优 Spark面试题（六）——Spark资源调优 Spark面试题（七）——Spark程序开发调优 Spark面试题（八）——Spark的Shuffle配置调优 GraphX 是新的图形和图像并行计算的Spark API。从整理上看，GraphX 通过引入弹性分布式属性图(Resilient Distributed Property Graph)继承了Spark…

2022年3月25日 0条评论 3159点热度 0人点赞等待下一个秋阅读全文

1 2 345…41

Python通过orm操作mysql数据库

Python进程管理——Supervisor

Python3 Linux 安装教程

关于副业，我的一次亏钱经历

Elasticsearch修改字段类型

mysql索引不生效

数据仓库—开发规范

数仓建模—建模工具PdMan

数仓建模—OneID

Spark—GraphX编程指南