【发布时间】:2016-01-03 17:12:16
【问题描述】:
将文本文件转换为文档字符串(与文字字符串相同)以使正则表达式工作是否是个好主意?我尝试将其转换为带有str() 的字符串,并在re 中使用多行模式。
我创建了一个基本脚本来通过 Python 解析出EnCase 导出文件。它可以工作,但由于某种原因,我无法获取正则表达式代码来执行 findall 函数来搜索文件,除非我将文件的内容作为 doc 字符串存储在变量中。
file = '''
'''
似乎这段代码可以用于不同的文件,但是复制和粘贴每个文件内容变得很麻烦。还有其他建议吗?
EnCase 文件导出本质上是制表符分隔的,以下是有关文件格式的信息。
【问题讨论】:
-
请澄清您的问题。人们知道 EnCase 文件是什么或它们的外观的可能性非常小,请带来有意义的输入样本、代码尝试以及最重要的是这些样本的预期输出。
-
我尝试在这个论坛和 github 上粘贴文件格式,但它只是去掉了标签和回车。这是我所拥有的github.com/jshen9393/data_wrangling/blob/master/…
-
花几分钟时间熟悉一下这个网站是如何运作的,以及 Markdown 是如何运作的。这是一个关于编程的问答网站,它完全能够保留换行符和制表符,您只是懒得阅读说明。
-
谢谢!我将审查 QA。也许我也把这个问题弄得太详细了。如何加载像文档字符串这样的文本文件?
-
这是一个非常非常基本的问题,如果这是您的实际问题。浏览一下 Python 文档,在 Internet 上四处看看。你会发现数以千计的例子。
标签: python regex validation text-parsing encase