本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
I/O 绑定操作符
最好避免在数据路径上依赖外部系统。与查询外部系统来丰富单个事件相比,将参考数据集保持在状态通常要高得多。但是,有时有些依赖关系无法轻松转移到状态,例如,如果您想使用托管在 Amazon Sagemaker 上的机器学习模型来丰富事件。
通过网络与外部系统连接的运营商可能会成为瓶颈,并造成背压。强烈建议使用 AsyncIO
此外,对于具有 I/O 绑定运算符的应用程序,增加 Kinesis Data Analytics 应用程序的 ParallelismPerKPU 设置也是有意义的。此配置描述应用程序在其使用的每个 Kinesis 处理单元(KPU)可以执行的parallel 子任务数。通过将值从默认值 1 增加到(比如 4),应用程序利用相同的资源(且成本相同),但可以扩展到并行度的 4 倍。这适用于绑定 I/O 的应用程序,但会给非 I/O 绑定的应用程序带来额外的开销。