1. 注意事项 |

发布时间:2025-01-06

2. 压力测试 | Elasticsearch 流水数据写入性能压测及结果分析

发布时间:2025-01-06

本文使用 esrally 工具对 Elasticsearch 进行流水数据写入压测,测试了 1000 万、2000 万和 5000 万条数据写入的性能,并对结果进行了详细分析,包括索引时间、合并时间、刷新时间、查询性能等指标,以及不同查询方式下的性能对比。文章还提供了 track.json 和 index.json 配置文件示例。

3. 批处理 |

发布时间:2025-01-06

4. 流式处理 |

发布时间:2025-01-06

5. SQL |

发布时间:2025-01-06

6. 批处理 |

发布时间:2025-01-06

7. Flink-SQL |

发布时间:2025-01-06

8. 窗口函数 | Apache Flink 窗口函数详解:类型、函数及触发器

发布时间:2025-01-06

深入理解 Apache Flink 窗口函数,包括滚动窗口、滑动窗口、会话窗口等三种窗口类型,以及 ReduceFunction、AggregateFunction、ProcessWindowFunction 等窗口处理函数,并讲解 Trigger 和 Evictor 的作用。

9. 2020-12-22-flink-环境配置 | Flink大数据实践:环境准备与WordCount案例详解

发布时间:2025-01-06

本文详细介绍了Flink大数据环境的准备,包括Flink的下载、安装、环境变量配置、启动、关闭以及Job程序的提交方式。文章以WordCount程序为例,演示了如何在Flink中运行一个简单的批处理程序,并介绍了Flink Web界面的使用方法,方便用户监控和管理Job。

10. sql-client-小试牛刀 | Flink SQL Client 配置指南及示例

发布时间:2025-01-06

本文档介绍了如何使用 sql-client 配置文件连接数据源,定义表、视图和 UDF,并执行 SQL 查询。配置文件包含 tables、functions、catalogs、execution 和 deployment 等配置项。示例展示了使用 CSV 数据作为数据源,并执行 group by 语句的 SQL 查询。

11. EventTime-and-ProccessTime |

发布时间:2025-01-06

12. 2020-12-23-flink-日志文件批处理-聚合统计接口错误码 | 使用 Flink 进行大规模 JSON 日志文件批处理:高效统计接口错误码

发布时间:2025-01-06

本文介绍如何使用 Apache Flink 进行大规模日志文件批处理,以统计每小时接口错误码。文章涵盖了 Flink 环境配置、Scala 代码实现、JSON 数据解析、数据聚合以及 Jar 包打包和提交等步骤,并提供了完整的代码示例和详细的步骤说明。适用于处理 4G 压缩包解压后 40-50G 的大规模 JSON 日志数据,并针对接口错误码进行统计分析。

13. 流式处理kakfa | 使用Golang和Flink进行Kafka流式数据处理及聚合

发布时间:2025-01-06

本文演示了如何使用 Golang 生成测试数据并写入 Kafka,以及如何使用 Flink 从 Kafka 读取数据并进行数据聚合。代码示例涵盖了 Kafka 生产者、消费者和 Flink 的数据处理流程,并解释了如何使用 JSON 格式的数据。

14. DNS协议 | DNS协议详解:Wireshark抓包分析及数据结构解读

发布时间:2025-01-06

本文详解DNS协议,通过Wireshark抓包分析DNS查询和应答过程,深入探讨DNS数据包的二进制结构和可视化数据结构,包含A记录和CNAME记录的解析示例。

15. UDP协议 | 深入理解UDP协议:数据包结构、校验和计算及应用场景

发布时间:2025-01-06

UDP(用户数据报协议)是一种简单的面向数据报的通信协议,位于OSI模型的传输层。它提供不可靠的数据传输,常用于对时间要求高的应用,例如DNS、DHCP、SNMP、RIP和NTP。本文详细介绍了UDP的数据包结构、校验和计算以及应用场景。

16. 滑动窗口 | 滑动窗口算法详解:原理、应用及TCP协议中的实现

发布时间:2025-01-06

滑动窗口算法是一种用于网络传输的流量控制技术,它允许发送方在等待确认之前发送多个数据分组,提高网络吞吐量并避免拥塞。本文介绍了滑动窗口算法的作用、原理以及在TCP协议中的应用,并分析了窗口大小调整和特殊情况下的处理。

17. ssh实现端口转发 | 利用SSH实现端口转发和内网穿透,本地访问远程服务器

发布时间:2025-01-06

本文介绍了两种通过SSH实现远程访问本地服务的方案:端口转发和内网穿透。端口转发用于本地访问远程服务器的特定端口,内网穿透则允许外部网络访问内部服务。文章提供了Bash脚本和详细的SSH参数解释,以及sshd_config的修改方法,方便读者快速上手。

18. 分布式 |

发布时间:2025-01-06

19. TCP_IP协议栈 | 深入理解TCP/IP协议栈:标志位、Wireshark抓包及分层模型详解

发布时间:2025-01-06

本文介绍了TCP/IP协议栈,包括TCP标志位(SYN, ACK, PSH, FIN, RST, URG),Sequence number和Acknowledge number,并提供了Wireshark过滤条件示例及TCP/IP四层模型和OSI七层模型的图解说明。

20. 2019-12-10-learn-basic-http | 深入理解HTTP协议及缓存策略

发布时间:2025-01-06

本文详细介绍了HTTP协议的报文结构,包括请求行、请求头部、响应体等组成部分,以及HTTP缓存策略,例如Private Cache、Public Cache、Cache-control、缓存过期机制和缓存验证等内容,并提供了HTTP状态码的分类说明。

21. ICMP | ICMP协议详解:ping命令及数据包分析

发布时间:2025-01-06

ICMP (互联网控制报文协议)是TCP/IP协议簇的子协议,用于检测网络连接状态。本文通过ping命令发送和接收ICMP数据包,分析数据包结构,包括数据包类型、源地址、目的地址、ID、序列号等信息,并解释了Echo请求和Echo应答的过程。

22. 文件结构逆向分析 | SQLite3数据库文件结构逆向分析详解

发布时间:2025-01-06

本文分析了 SQLite3 数据库文件的内部结构,通过初始化数据、dump 文件以及 hexdump 命令,详细解读了 SQLite3 数据库文件的组成,并结合示例代码和参考资料,深入浅出地讲解了 SQLite3 数据库文件的逆向分析方法。

23. 2019-12-06-multiple-group-by-query-count-desc | MySQL和PostgreSQL中高效筛选group by后数量最多的列

发布时间:2025-01-06

本文介绍了如何使用MySQL和PostgreSQL的group by语句高效地筛选出分组后数量最多的列,并详细解释了两种数据库的实现方法及思路,包括两次group by操作的原理,以及count函数的用法和性能优化建议。

24. 2020-01-09-query-database-size | PHP脚本:高效查看MySQL数据库表大小及行数

发布时间:2025-01-06

使用PHP脚本查看MySQL数据库中每个表的大小和行数,代码包含详细注释,并使用`show table status`和`show create table`语句获取所需信息。

25. LAST_INSERT_ID作为UPDATE语句的返回值-没有RETURNING一样可以玩 | MySQL LAST_INSERT_ID() 函数深度解析:不仅仅是自增 ID,还能模拟序列!

发布时间:2025-01-06

深入探讨 MySQL LAST_INSERT_ID() 函数的两种用法:无参数返回最后插入的自增 ID,带参数可返回指定值并模拟序列。文章还分析了其在并发场景下的行为,并通过 Go 代码示例验证其可靠性,揭示其在计数器管理中的应用。