【发布时间】:2019-07-02 13:52:52
【问题描述】:
我目前正在应对以可扩展方式为我的 tensorflow 模型提供服务的挑战。据我所知,推荐的解决方案是使用标准TensorFlow ModelServer。这可以很好地处理常见的要求 - 但我想要更多。我想通过解析像“limit”这样的参数来定义前 n 个 logits + 返回的概率来减少传输的数据量。
在我的研究中,我确定了以下解决方案:
1) 在模型构建期间创建更高级的 SignatureDef。
2) 使用上述功能自定义基本tensorflow/serving 项目。
3) 使用标准的 Tensorflow Modelserver 为模型提供服务,并构建一个后处理服务来重构 resp。以预定义的方式过滤结果。
比我更有经验的人可以详细说明我的问题吗? - coden-ps 或链接会很棒。
提前致谢。
【问题讨论】:
标签: tensorflow tensorflow-serving serving tfx