最佳实践|如何写出简单高效的 Flink SQL?
摘要:本文整理自阿里巴巴高级技术专家、Apache Flink PMC 贺小令,在Flink Forward Asia 2022 生产实践专场的分享。本篇内容主要分为三个部分: Flink SQL Insight Best Practices Future Works 一、Flink SQL Ins
字节跳动 Flink 状态查询实践与优化
摘要:本文整理自字节跳动基础架构工程师,Apache Flink Contributor 马越在 Flink Forward Asia 2021 平台建设专场的演讲。主要内容包括: 背景 State Processor API 介绍 StateMeta Snapshot 机制 State as Da
美团 Flink 大作业部署与状态稳定性优化实践
摘要:本篇内容整理自美团数据平台工程师冯斐、王非凡在 Flink Forward Asia 2021 的演讲。主要内容包括: 相关背景 大作业部署优化 Checkpoint 跨机房副本 状态稳定性相关优化 未来规划 https://segmentfault.com/a/119000004145354
Flink生产环境TOP难题与优化
如何规划生产中的集群大小? 第一步是仔细考虑应用程序的运维指标,以达到所需资源的基线。需要考虑的关键指标是: 每秒记录数和每条记录的大小 已有的不同键(key)的数量和每个键对应的状态大小 状态更新的次数和状态后端的访问模式 最后,一个更实际的问题是与客户之间围绕停机时间、延迟和最大吞吐量的服务级别
生产上的坑才是真的坑 | 盘一盘Flink那些经典线上问题
数据倾斜导致子任务积压 业务背景 一个流程中,有两个重要子任务:一是数据迁移,将kafka实时数据落Es,二是将kafka数据做窗口聚合落hbase,两个子任务接的是同一个Topic GroupId。上游 Topic 的 tps 高峰达到5-6w。 问题描述 给 24个 TaskManager(CP