【发布时间】:2019-10-28 14:54:15
【问题描述】:
我在使用 TPL DataFlow 管理队列(数据库)并将工作重定向到网格计算服务的 Windows 服务中遇到问题。并且在某一时刻 BufferBlock 停止释放任务,我不知道为什么。我认为这是因为在某些任务的执行过程中发生了一些异常,但是它们被抑制了,很难理解 BufferBlock 何时停止接受新任务。
我试图在下面的工作示例中简化它。 它没有任何异常处理,我想知道如何正确处理 TPL 中的异常。 我在这里找到了类似的东西TPL Dataflow, guarantee completion only when ALL source data blocks completed。 在此示例中,我有 100 个请求,并以 10 个请求批量处理数据。 模拟 ID % 9 == 0 时发生的一些异常 如果我没有捕捉到这个异常,它会工作一点,然后停止接受新的请求。 如果我处理并返回 Result.Failure 我相信它可以正常工作,但我不确定这是否是在生产环境中使用它的正确方法。
我是 TPL 的新手,如果我没有更清楚地解释我的问题,请忘记我。 GitHub Project
using System;
using System.Collections.Generic;
using System.Diagnostics;
using System.Net;
using System.Text;
using System.Threading;
using System.Threading.Tasks;
using System.Threading.Tasks.Dataflow;
using System.Timers;
using CSharpFunctionalExtensions;
namespace TestTPL
{
public class ServicePipeline
{
public const int batches = 100;
private int currentBatch = 0;
public ServicePipeline(int maxRequestsInParallel)
{
MaxRequestsInParallel = maxRequestsInParallel;
}
public int MaxRequestsInParallel { get; }
public BufferBlock<MyData> QueueBlock { get; private set; }
public List<TransformBlock<MyData, Result>> ExecutionBlocks
{ get; private set; }
public ActionBlock<Result> ResultBlock { get; private set; }
private void Init()
{
QueueBlock = new BufferBlock<MyData>(new DataflowBlockOptions()
{ BoundedCapacity = MaxRequestsInParallel });
ExecutionBlocks = new List<TransformBlock<MyData, Result>>();
ResultBlock = new ActionBlock<Result>(_ => _.OnFailure(
() => Console.WriteLine($"Error: {_.Error}")));
for (int blockIndex = 0; blockIndex < MaxRequestsInParallel;
blockIndex++)
{
var executionBlock = new TransformBlock<MyData, Result>((d) =>
{
return ExecuteAsync(d);
}, new ExecutionDataflowBlockOptions() { BoundedCapacity = 1 });
executionBlock.LinkTo(ResultBlock, new DataflowLinkOptions()
{ PropagateCompletion = true });
QueueBlock.LinkTo(executionBlock, new DataflowLinkOptions()
{ PropagateCompletion = true });
ExecutionBlocks.Add(executionBlock);
}
}
public static Result ExecuteAsync(MyData myData)
{
//try
//{
WebClient web = new WebClient();
TaskCompletionSource<Result> res = new TaskCompletionSource<Result>();
Task task = Task<Result>.Run(() => web.DownloadStringAsync(
new Uri("http://localhost:49182/Slow.ashx")));
task.Wait();
Console.WriteLine($"Data = {myData}");
if (myData != null && myData.Id % 9 == 0)
throw new Exception("Test");
return Result.Ok();
//}
//catch (Exception ex)
//{
// return Result.Failure($"Exception: {ex.Message}");
//}
}
public async void Start()
{
Init();
while (currentBatch < batches)
{
Thread.Sleep(1000);
await SubmitNextRequests();
}
Console.WriteLine($"Completed: {batches}");
}
private async Task<int> SubmitNextRequests()
{
var emptySlots = MaxRequestsInParallel - QueueBlock.Count;
Console.WriteLine($"Empty slots: {emptySlots}" +
$", left = {batches - currentBatch}");
if (emptySlots > 0)
{
var dataRequests = await GetNextRequests(emptySlots);
foreach (var data in dataRequests)
{
await QueueBlock.SendAsync(data);
}
}
return emptySlots;
}
private async Task<List<MyData>> GetNextRequests(int request)
{
MyData[] myDatas = new MyData[request];
Task<List<MyData>> task = Task<List<MyData>>.Run(() =>
{
for (int i = 0; i < request; i++)
{
myDatas[i++] = new MyData(currentBatch);
currentBatch++;
}
return new List<MyData>(myDatas);
});
return await task;
}
}
public class MyData
{
public int Id { get; set; }
public MyData(int id) => Id = id;
public override string ToString() { return Id.ToString(); }
}
}
编辑:2019 年 10 月 30 日 当异常被处理和显式调用时,它按预期工作 Result.Failure($"Exception: {ex.Message}");
public static Result ExecuteAsync(MyData myData)
{
try
{
WebClient web = new WebClient();
TaskCompletionSource<Result> res = new TaskCompletionSource<Result>();
Task task = Task<Result>.Run(() => Thread.Sleep(2000));
task.Wait();
Console.WriteLine($"Data = {myData}");
if (myData != null && myData.Id % 9 == 0)
throw new Exception("Test");
return Result.Ok();
}
catch (Exception ex)
{
return Result.Failure($"Exception: {ex.Message}");
}
}
【问题讨论】:
-
你给我们的代码不能在本地测试中编译(我们缺少一些像
Result这样的类,我们无权访问localhost:49182/Slow.ashx。因为我还不清楚这个问题并且代码没有显示所需的输出,也没有显示问题,恐怕您需要详细说明您的问题。 -
嗨彼得,我刚刚在GitHub - TestTPL 上分享了这个示例项目。它已经注释掉了 TransformBlock 调用的 ExecuteAsync 中捕获的异常。在这种情况下,当一次调用 SubmitNextRequests 时,它不会有空槽来处理下一个请求
-
你为什么要创建多个
TransformBlocks?你不知道MaxDegreeOfParallelism选项吗? -
感谢@TheodorZoulias 我看到了 MaxDegreeOfParallelism,还没有深入研究它。但我同意,多个 TranformBlock 对我来说也很奇怪。只是尝试使用管道解决现有生产问题会停止接收新请求,并在我的示例中复制了主要逻辑
-
老实说,我认为通过重构代码以使用单个
TranformBlock和MaxDegreeOfParallelism = MaxRequestsInParallel来解决问题比尝试修复这个不必要的复杂实现更容易。这个可怕的结需要解开!
标签: c# .net task-parallel-library tpl-dataflow