等待下一个秋

  • Spark
  • Flink
  • Hive
  • 数据仓库
  • ClickHouse
  • 收徒弟
  • Java
    • Spring
    • Mybatis
    • SpringBoot
    • 面试题
  • Python
    • Python基础
    • 爬虫
    • Numpy
    • matplotlib
    • Flask
  • 技术杂谈
    • Linux知识
    • Docker
    • Git教程
    • Redis教程
    • mysql
    • 前端
    • R语言
    • 机器学习
  • 关于我
  • 其它
    • 副业挣钱
    • 资料下载
    • 资料文档
专注于Hadoop/Spark/Flink/Hive/数据仓库等
关注公众号:大数据技术派,获取更多学习资料。
机器学习

ChatGPT可以做什么

ChatGPT,美国“开放人工智能研究中心”研发的聊天机器人程序,于2022年11月30日发布。 是人工智能技术驱动的自然语言处理工具,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务。 充当 Linux 终端 我想让你充当 Linux 终端。我将输入命令,您将回复终端应显示的内容。我希望您只在一个唯一的代码块内回复终端输出,而不是其他任何内容。不要写解释。除非我指示您这样做,否则不要键入命令。当我需要用英语告诉你…

2023年2月7日 0条评论 1312点热度 1人点赞 等待下一个秋 阅读全文
ClickHouse

ClickHouse 自定义分区键

MergeTree 系列的表(包括 可复制表 )可以使用分区。基于 MergeTree 表的 物化视图 也支持分区。 分区是在一个表中通过指定的规则划分而成的逻辑数据集。可以按任意标准进行分区,如按月,按日或按事件类型。为了减少需要操作的数据,每个分区都是分开存储的。访问数据时,ClickHouse 尽量使用这些分区的最小子集,提高查询效率。 分区是在 建表 时通过 PARTITION BY expr 子句指定的。分区键可以是表中列的任意表达式。例如,指定按月分区,表达式为 toYYYYMM(date_column…

2022年12月22日 0条评论 2295点热度 0人点赞 等待下一个秋 阅读全文
ClickHouse

ClickHouse数据副本引擎

只有 MergeTree 系列里的表可支持副本: ReplicatedMergeTree ReplicatedSummingMergeTree ReplicatedReplacingMergeTree ReplicatedAggregatingMergeTree ReplicatedCollapsingMergeTree ReplicatedVersionedCollapsingMergeTree ReplicatedGraphiteMergeTree 副本是表级别的,不是整个服务器级的。所以,服务器里可以同时有复…

2022年12月22日 0条评论 2253点热度 0人点赞 等待下一个秋 阅读全文
ClickHouse

ClickHouse ReplacingMergeTree引擎

该引擎和 MergeTree 的不同之处在于它会删除排序键值相同的重复项。 数据的去重只会在数据合并期间进行。合并会在后台一个不确定的时间进行,因此你无法预先作出计划。有一些数据可能仍未被处理。尽管你可以调用 OPTIMIZE 语句发起计划外的合并,但请不要依靠它,因为 OPTIMIZE 语句会引发对数据的大量读写。 因此,ReplacingMergeTree 适用于在后台清除重复的数据以节省空间,但是它不保证没有重复的数据出现。 建表 CREATE TABLE [IF NOT EXISTS] [db.]table…

2022年12月22日 0条评论 2297点热度 0人点赞 等待下一个秋 阅读全文
ClickHouse

ClickHouse MergeTree引擎

Clickhouse 中最强大的表引擎当属 MergeTree (合并树)引擎及该系列(*MergeTree)中的其他引擎。 MergeTree 系列的引擎被设计用于插入极大量的数据到一张表当中。数据可以以数据片段的形式一个接着一个的快速写入,数据片段在后台按照一定的规则进行合并。相比在插入时不断修改(重写)已存储的数据,这种策略会高效很多。 主要特点: 存储的数据按主键排序。 这使得您能够创建一个小型的稀疏索引来加快数据检索。 如果指定了 分区键 的话,可以使用分区。 在相同数据集和相同结果集的情况下 Click…

2022年12月22日 0条评论 2324点热度 0人点赞 等待下一个秋 阅读全文
ClickHouse

clickhouse简介

什么是ClickHouse? ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。 在传统的行式数据库系统中,数据按如下顺序存储: Row WatchID JavaEnable Title GoodEvent EventTime #0 89354350662 1 Investor Relations 1 2016/5/18 5:19 #1 90329509958 0 Contact us 1 2016/5/18 8:10 #2 89953706054 1 Mission 1 2016…

2022年12月14日 0条评论 2420点热度 0人点赞 等待下一个秋 阅读全文
Flink

Flink SQL管理平台flink-streaming-platform-web安装搭建

公众号文章都在个人博客网站:https://www.ikeguang.com/ 同步,欢迎访问。 最近看到有人在用flink sql的页面管理平台,大致看了下,尝试安装使用,比原生的flink sql界面确实好用多了,我们看下原生的,通过bin/sql-client.sh命令进入那个黑框,一只松鼠,对,就是那个界面。。。。 这个工具不是Flink官方出的,是一个国内的小伙伴写的,Github地址: https://github.com/zhp8341/flink-streaming-platform-web 根据g…

2022年12月2日 0条评论 2464点热度 0人点赞 等待下一个秋 阅读全文
Flink

Flink同步Kafka数据到ClickHouse分布式表

公众号文章都在个人博客网站:https://www.ikeguang.com/ 同步,欢迎访问。 业务需要一种OLAP引擎,可以做到实时写入存储和查询计算功能,提供高效、稳健的实时数据服务,最终决定ClickHouse 什么是ClickHouse? ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。 列式数据库更适合于OLAP场景(对于大多数查询而言,处理速度至少提高了100倍),下面详细解释了原因(通过图片更有利于直观理解),图片来源于ClickHouse中文官方文档。 行式 列…

2022年11月30日 0条评论 2464点热度 0人点赞 等待下一个秋 阅读全文
大数据

oracle ogg下载教程

进入下载页:http://edelivery.oracle.com/osdc/faces/Home.jspx,需要注册账号并且登录,除了邮箱需要填对,因为注册要发链接验证的,其它的一堆信息随便填,我这里已经注册登录好了。 比如,我这里要下载 Oracle GoldenGate for Big Data 12.3.1.1.1 on Linux x86-64 这个版本 首先,在搜索框里面搜索: 点击对应搜索结果: 然后,点击右上角的View Items,就会跳出一个小窗,点击Continue。 然后,选择系统后,点击C…

2022年11月29日 0条评论 2414点热度 0人点赞 等待下一个秋 阅读全文
机器学习

paddleocr安装教程快速开始

本文首发我的个人博客:paddleocr安装教程快速开始 1. 安装Python环境 wget https://mirrors.huaweicloud.com/python/3.8.5/Python-3.8.5.tgz 下载后,解压,编译,安装,即可。 2. 安装paddle-gpu 简单文档:https://gitee.com/paddlepaddle/PaddleOCR/blob/release/2.5/doc/doc_ch/quickstart.md 官方文档:https://www.paddlepaddle…

2022年9月20日 0条评论 3066点热度 0人点赞 等待下一个秋 阅读全文
12345…40

等待下一个秋

待我代码写成,便娶你为妻!专注于Hadoop/Spark/Flink/Hive/数据仓库等,关注公众号:大数据技术派,获取更多学习资料。

搜一搜
标签聚合
大数据 书籍 Flink 挣钱 mysql Python 数据仓库 R语言 Java Hive Redis 算法
文章归档
  • 2023年2月
  • 2022年12月
  • 2022年11月
  • 2022年9月
  • 2022年7月
  • 2022年6月
  • 2022年5月
  • 2022年4月
  • 2022年3月
  • 2022年2月
  • 2022年1月
  • 2021年12月
  • 2021年11月
  • 2021年10月
  • 2021年9月
  • 2021年8月
  • 2021年6月
  • 2021年5月
  • 2021年4月
  • 2021年3月
  • 2021年2月
  • 2021年1月
  • 2020年12月
  • 2020年11月
  • 2020年10月
  • 2020年9月
  • 2020年8月
  • 2020年7月
  • 2020年5月
  • 2020年4月
  • 2020年1月
  • 2019年9月
  • 2019年8月
  • 2019年7月
  • 2019年6月
  • 2019年5月
  • 2019年4月
  • 2019年3月
  • 2019年1月
  • 2018年12月
  • 2017年5月

©2022 ikeguang.com. 保留所有权利。

鄂ICP备2020019097号-1

鄂公网安备 42032202000160号