标签: 调度 | 程序员笔记

跳表 1 事务 1 clickhouse 1 数据传输 1 MemoryManagment 1 Slot 1 HA 1 Akka 1 RPC 1 ExecutionGraph 1 JobGraph 1 源码分析 3 StreamGraph 1 savepoint savepoint 1 ConcurrentHashMap 1 ORC 1 snapshot 1 ABS算法 1 lock 2 thread 1 kafka-producer 1 kafkaproducer partition 1 cgroup 1 HBase 1 LSM 2 B+树 1 SecondaryNmenode 1 NameNode 1 令牌桶 1 Guava 1 Flink CDC 1 Flink SQL 4 最佳实践 6 资源管理 2 维度表 1 调度 4 流批一体 2 join 2 Chain 1 Operator 1 ClassLoader 1 RocksDB 2 time 2 window 2 checkpoint 8 网络优化 1 watermark 3 背压 2 CEP 1 Shuffle 3 精确一致性 3 窗口 1 kafka-consumer 2 view 1 transformation 1 state 10 kudu 2 impala 2 内存管理 4 GC 1 Exception 1 多线程 1 YARN 1 MapReduce 2 HDFS 2 hadoop 0 Halo 0

bigdataflink 未读

深入解读 Flink 1.17

摘要：本文整理自阿里云技术专家，Apache Flink PMC Member & Committer、Flink CDC Maintainer 徐榜江(雪尽) 在深入解读 Flink 1.17 的分享。内容主要分为四个部分： Flink 1.17 Overview Flink 1.17 Overa

checkpoint Flink SQL 调度 2023-10-28

bigdataflink 未读

自适应批作业调度器：为 Flink 批作业自动推导并行度

一、引言对大部分用户来说，为 Flink 算子配置合适的并行度并不是一件容易的事。对于批作业，小的并行度会导致作业运行时间长，故障恢复慢，而不必要的大并行度会导致资源浪费，任务部署和数据 shuffle 开销也会变大。为了控制批作业的执行时长，算子的并行度应该和其需要处理的数据量成正比。用户需要

调度 2022-07-24

bigdataflink 未读

Flink 1.13：面向流批一体的运行时与 DataStream API 优化

本文由社区志愿者苗文婷整理，内容来源自阿里巴巴技术专家高赟(云骞) 在 5 月 22 日北京站 Flink Meetup 分享的《面向流批一体的 Flink 运行时与 DataStream API 优化》。文章主要分为 4 个部分：回顾 Flink 流批一体的设计介绍针对运行时的优化点介绍针对

流批一体调度 Shuffle 精确一致性 2021-08-07

bigdatahadoopyarnlinux 未读

浅谈Linux cgroup机制与YARN的CPU资源隔离

前言我们在生产环境中经常可以发现有计算密集型任务争用NodeManager的CPU，以及个别Container消耗太多CPU资源导致其他系统服务抖动的情况。好在Hadoop 2.2版本之后，YARN通过利用Linux系统的cgroup机制支持了CPU资源隔离。本文先简单看看cgroup，然后分析一

调度 cgroup 资源管理 2020-07-19