【发布时间】:2018-02-08 12:37:26
【问题描述】:
问题很简单:
我想从一个规则中调用一个脚本,并且我希望这两个规则都适用:
- 执行标准输出和标准错误重定向
- 从脚本访问snakemake变量(变量可以是列表和文字)
如果我使用 shell: 那么,我可以执行 I/O 重定向,但我不能在脚本中使用 snakemake 变量。
注意:当然可以将变量作为参数从 shell 传递给脚本。但是,通过这样做,脚本无法区分文字和列表变量。
如果我改为使用script:,我可以访问我的snakemake变量,但我不能执行I/O重定向和许多其他shell工具。
一个例子来说明这个问题:
1) 使用shell:
rule create_hdf5:
input:
genes_file = OUTPUT_PATH+'/{sample}/outs/genes.tsv'
params:
# frequencies is a list!!!
frequencies = config['X_var']['freqs']
output:
HDF5_OUTPUT+'/{sample}.h5'
log:
out = LOG_FILES+'/create_hdf5/sample_{sample}.out',
err = LOG_FILES+'/create_hdf5/sample_{sample}.err'
shell:
'python scripts/create_hdf5.py {input.genes_file} {params.frequencies} {output} {threads} 2> {log.err} 1> {log.out} '
1) 的问题:自然,python 脚本认为频率列表中的每个元素都是一个新参数。然而,该脚本无法访问snakemake 变量。
2) 使用script:
rule create_hdf5:
input:
genes_file = OUTPUT_PATH+'/{sample}/outs/genes.tsv'
params:
# frequencies is a list!!!
frequencies = config['X_var']['freqs']
output:
HDF5_OUTPUT+'/{sample}.h5'
log:
out = LOG_FILES+'/create_hdf5/sample_{sample}.out',
err = LOG_FILES+'/create_hdf5/sample_{sample}.err'
script:
'scripts/create_hdf5.py'
2) 的问题:我可以访问脚本中的snakemake 变量。但是现在我不能使用 bash 的功能,比如 I/O 重定向。
我想知道是否有办法同时实现这两者(也许我在 snakemake 文档中遗漏了一些东西)? 提前致谢!
【问题讨论】:
-
我可以将列表序列化为 JSON,然后将其作为参数传递给脚本并在脚本中反序列化。还有比这更优雅的实现方式吗?