Shuffle

flink 未读

Flink Shuffle机制的重构与优化

1. 概述本文讲述的shuffle概念范围如下图虚线框所示，从上游算子产出数据到下游算子消费数据的全部流程，基本可以划分成三个子模块：上游写数据：算子产出的record序列化成buffer数据结构插入到sub partition队列；网络传输：上下游可能调度部署到不同的container中，上

Shuffle 2021-01-03

bigdataflink 未读

Flink Sort-Shuffle 实现简介

本文介绍 Sort-Shuffle 如何帮助 Flink 在应对大规模批数据处理任务时更加游刃有余。主要内容包括：数据 Shuffle 简介引入 Sort-Shuffle 的意义 Flink Sort-Shuffle 实现测试结果调优参数未来展望 Flink 作为批流一体的大数据计算引擎，

Shuffle 2021-11-20

bigdataflink 未读

本文由社区志愿者苗文婷整理，内容来源自阿里巴巴技术专家高赟(云骞) 在 5 月 22 日北京站 Flink Meetup 分享的《面向流批一体的 Flink 运行时与 DataStream API 优化》。文章主要分为 4 个部分：回顾 Flink 流批一体的设计介绍针对运行时的优化点介绍针对

流批一体调度 Shuffle 精确一致性 2021-08-07