【发布时间】:2016-07-15 22:07:01
【问题描述】:
我是编程新手,但我有 python 3 的基础知识并安装了 treetagger,并且通过我的命令 shell 我可以 POS 标记文件。
但是,我试图自动打开并运行 Treetagger 的文件夹中有 427 个文件,但我不知道如何实现这一点。我目前的代码是这样的:
import os
import sys
import subprocess
import re
rootdir = r"/Spanish_(ACTIV-es)_corpus/plain"
我想自动检查包含超过 427 个文件的文件夹并为适当的文件添加 POS 标记
我认为这需要以下内容的一些组合以及包括 SUBPROCESS 命令的代码才能让 TreeTagger 完成其工作,我绝对不明白如何使用,但试图从堆栈溢出的另一个问题的反馈中实现.
如何让 movie_pos 成为 treetagger 在遍历文件夹中的文件时将 POS 标记的文件?
然后:输出??我是否需要已经为输出创建了 427 个单独的文件,或者有没有办法自动使输出成为输入的修改后的标题,这样输出就不会混淆。 (在文件的标题中,是当前存储元数据的位置)。
【问题讨论】:
标签: python-3.x treetagger