我可以将 Dataflow 作业配置为单线程吗？答案

【问题标题】：Can I configure a Dataflow job to be single threaded?我可以将 Dataflow 作业配置为单线程吗？
【发布时间】：2020-07-05 03:37:26
【问题描述】：

我试图配置和部署真正单线程的 Cloud Dataflow 作业，以避免在数据存储区中创建/更新实体时出现并发问题。我假设使用 n1-standard-1 机器可以确保作业在单线程上运行，在单台机器上运行，但我发现事实并非如此。

但我想避免围绕此实施窗口化方法，并想知道是否有更简单的方法来简单地配置作业以确保单线程行为。

任何建议或见解将不胜感激

【问题讨论】：

【解决方案1】：

我最近了解到单线程行为是通过使用 n1-standard-1 的单个工作程序以及另外使用以下 exec_arg --numberOfWorkerHarnessThreads=1 来保证的，因为这也将 JVM 线程数限制为 1 .

【讨论】：