Data 偏斜

Flink 应用程序以分布式方式在集群上执行。为了向外扩展到多个节点，Flink 使用了键控流的概念，这本质上意味着数据流的事件根据特定的密钥（例如客户 ID）进行分区，然后 Flink 可以处理不同节点上的不同分区。然后根据这些分区对许多 Flink 运算符进行评估，例如，键控 Windows、Proc es s Functions 和 Async I/O。

选择分区键通常取决于业务逻辑。同时，许多最佳实践，例如 DynamoDB 和 Spark，同样适用于 Flink，包括：

确保分区键的高基数
避免分区之间事件音量出现偏差

您可以通过比较 Flink 控制面板中接收/发送的子任务（即同一操作员的实例）的记录来识别分区中的偏差。此外，还可以将 Kinesis Data Analytics 监控配置为显示子任务级别numRecordsIn/Out和numRecordsInPerSecond/OutPerSecond子任务级别的指标。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

背压

状态偏斜