【发布时间】:2021-11-12 10:12:39
【问题描述】:
我使用 tfjs 运行关键点检测模型,然后对其进行后期处理(仍然使用 tfjs)。 然后我在最终张量上使用 dataSync() 以便使用 JS 处理它。 dataSync() 花费的时间大约是推理 + 后处理时间的 4 倍。 我猜这是因为 dataSync() 从 GPU 中提取数据。 有没有办法让这个过程更快? 这是我正在使用的代码:
let output = model.execute(input_image_tensor);
let kpts = postProcess(output);
renderKpts(kpts.dataSync());
谢谢。
【问题讨论】:
-
奇怪的行为,我从来没有遇到过这个问题。您能否在此处分析代码并分享结果?
-
我使用 tf.time() 分析了代码,这就是我得到的:KernelMs:0.01,wallTimeMS:62.3,uploadWaitMs:0,downloadWaitMs:52.8。我希望它有所帮助。谢谢!