【问题标题】:Run multiple tasks in semiparallel以半并行方式运行多个任务
【发布时间】:2021-02-18 23:02:35
【问题描述】:

我有一个任务列表,其中每个任务都有两个子任务。我只想在上一个任务完成第一个子任务后开始下一个任务。 (第一个子任务对单个 http api 调用了大约 1000 次,如果我称它为“太多”,它似乎会下降,第二个任务是一个相当长时间运行的 cpu 绑定任务)。

我的想法类似于以下示例代码(在实际情况下,任务列表增长到至少 300 个):

class Program
{
    

    static async Task Main(string[] args)
    {
        var test = new TestMultiTask();
        await test.TestListOfTasks();
        Console.WriteLine("Finished");
        Console.ReadLine();
    }
} 

public class TestMultiTask
{
    public List<Task> Tasks { get; private set; }
    public async Task TestListOfTasks()
    {
        Tasks = new List<Task>();
        Tasks.Add(Task2SubTask(new Progress<MyProgress>(ReportProgress), 0));
        await Task.WhenAll(Tasks);
        Console.WriteLine("Finished TestListOfTasks");
    }

    private void ReportProgress(MyProgress obj)
    {
        if (obj.ProgressNo < 10)
        {
            Tasks.Add(Task2SubTask(new Progress<MyProgress>(ReportProgress), obj.ProgressNo + 1));
        }
    }

    private async Task Task2SubTask(IProgress<MyProgress> progress, int i)
    {
        Console.WriteLine($"Task {i}, started.");
        await Task.Delay(700); // simulating getting data from web api (abt- 1000 calls)
        Console.WriteLine($"Task {i}, completed subtask 1."); 
        progress.Report(new MyProgress() { Task1Done = true, ProgressNo = i }); // now the next task can start getting data form web api.
        await Task.Run(() => Task.Delay(1000)); // Process the data collected (in this task) from the web api
        Console.WriteLine($"Task {i} done."); // return processed data.
    }

}

然而,这至少有一个缺陷 - 只要列表中的第一个任务完成,Program.Main 就会继续,即使列表已扩展。 有谁知道这样做的更聪明的方法? (也许是完全不同的方法?)

编辑: 感谢 cmets.. 现在我尝试注释代码以使其更清晰。

【问题讨论】:

  • 我对这里的任务和子任务有点困惑。所以你需要调用一个 API 1000 次,然后在每次调用后完成一个 CPU 绑定的工作负载?
  • 我从您的问题中了解到的(如果错了告诉我):SubTask1 从某些 API 收集数据,SubTask2 处理该数据。这两个,你有你认为创建“父”任务的好主意的“块”。对吗?
  • 您考虑过TPL Dataflow 库吗?它允许定义由多个块组成的管道,每个块与特定类型的任务相关联并独立配置,然后向管道提供沿途处理的消息(例如 URL)。因此,您可以获得任务并行性和数据并行性。 Here 是一个使用示例。
  • 这听起来更像是一个管道的东西。您需要一个为一个“块”顺序调用 API 的步骤,然后相应的结果应该进入第二步,在那里进行处理。也许 DataFlow 适合你?
  • 谢谢大家。 TPL Dataflow 听起来是一个好方法,@Evk 似乎是一个简单的解决方案,可以解决问题:)

标签: c# multithreading async-await task


【解决方案1】:

首先,感谢许多 cmets。我尝试了@Evk 的提议,最终得到了以下代码......

public class TestMultiTask2
{
    public List<Task> Tasks { get; private set; }
    public async Task TestListOfTasks()
    {
        var workers = new List<Worker>();
        var crunchingTasks = new List<Task>();
        var n = 10;
        for (int i = 0; i < n; i++)
        {
            var w = new Worker(i);
            workers.Add(w);
            await w.GetDataAsync(new Progress<MyProgress>(ReportProgress));
            crunchingTasks.Add(w.CrunchData(new Progress<MyProgress>(ReportProgress)));
        }
        await Task.WhenAll(crunchingTasks);
        Console.WriteLine($"Worker 0 data: {string.Join(", ", workers[0].Datas)}");
        Console.WriteLine($"Worker {n-1} data: {string.Join(", ", workers[n-1].Datas)}");
        Console.WriteLine("Finished TestListOfTasks");
    }

    private void ReportProgress(MyProgress obj)
    {
        if (obj.Task2Started)
        {
            Console.WriteLine($"Task no. {obj.TaskNo} has started chrunching data: {obj.Task2Started}");
        }
        else if(obj.Task2Done)
        {
            Console.WriteLine($"Task no. {obj.TaskNo} has finished chrunching data: {obj.Task2Done}");
        }
        else if (obj.Task1Done)
        {
            Console.WriteLine($"Task no. {obj.TaskNo} has finished getting data: {obj.Task1Done}"); 
        }
    }


}

public class MyProgress
{
    public int TaskNo { get; set; }
    public bool Task1Done { get; set; }
    public bool Task2Done { get; internal set; }
    public bool Task2Started { get; internal set; }
}

public class Worker
{
    public int ID { get; set; }

    public Worker(int id)
    {
        ID = id;
    }
    public List<int> Datas { get; set; } = new List<int>() { 0, 0, 0 };
    public async Task GetDataAsync(IProgress<MyProgress> progress)
    {
        await Task.Delay(500);
        Datas = new List<int>() { 1, 2, 3 };
        progress.Report(new MyProgress() { TaskNo = ID, Task1Done = true });
    }

    public async Task CrunchData(IProgress<MyProgress> progress)
    {
        progress.Report(new MyProgress() { TaskNo = ID, Task2Started = true });
        await Task.Run(async () => { await Task.Delay(5000); Datas.Reverse(); });
        progress.Report(new MyProgress() { TaskNo = ID, Task2Done = true });
    }
}
class Program
{


    static async Task Main(string[] args)
    {
        var test = new TestMultiTask2();
        await test.TestListOfTasks();
        Console.WriteLine("Finished");
        Console.ReadLine();
    }
}

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-02-10
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多