【发布时间】:2020-03-28 06:54:04
【问题描述】:
我的数据流使用 .sql 文件。该文件包含一个查询,它位于名为 queries 的目录中。
我需要将此文件与我的数据流一起上传。
我发现使用了 manifest.in 文件,但据我所知,这并没有做任何事情,我在我的根目录中创建了这个名为 MANIFEST.in 的文件,它包含一行:
recursive-include queries *
其他一些消息来源告诉我,我需要为此使用 setup.py 文件。所以现在看起来像这样:
from __future__ import absolute_import
from __future__ import print_function
import subprocess
from distutils.command.build import build as _build
import setuptools # pylint: disable-all
setuptools.setup(
name='MarkPackage',
version='0.0.1',
install_requires=[],
packages=setuptools.find_packages(),
package_data={
'queries': ['queries/*'],
},
include_package_data=True
)
这也行不通。
错误是:RuntimeError: FileNotFoundError: [Errno 2] No such file or directory: 'queries/testquery.sql' [while running 'generatedPtransform-20']
在我的数据流的任何部分或所有部分中包含要使用的任何文件的最佳做法是什么?
【问题讨论】:
标签: python google-cloud-dataflow apache-beam