【发布时间】:2011-10-31 15:54:30
【问题描述】:
我是 Python 的完全初学者。我遇到需要格式化的文本文件。我基本上需要获取以某个字符开头的字段数据并将字段数据输出到一个新文件,该文件将包含由我选择的字符分隔的所有字段。
这是一个简短的例子。
; Record 1
@FULLTEXT PAGE
@T R000358
@C ENDDOC# R000358
@C BEGATTACH R000358
@C ENDATTACH R000358
@C MAILSTORE No
@C AUTHOR
@C BCC
@C CC
@C COMMENTS
@C ATTACH
@C DATECREATED 11/23/2010
@C DATELASTMOD 07/18/2010
@C DATELASTPRNT
@C DATERCVD
@C DATESENT
@C FILENAME wrangling.wpd
@C LASTAUTHOR
@C ORGANIZATION
@C REVISION
@C SUBJECT
@C TIMEACCESSED 00:00:00
@C TIMECREATED 15:21:34
@C TIMELASTMOD 09:04:12
@C TIMELASTPRNT
@C TIMERCVD
@C TIMESENT
@C TITLE
@C TO
@C FROM
对于每个“记录”,“@C”和“@T”是字段分隔符,后跟一个空格,然后是字段名称,后跟一个空格,然后是字段数据。我需要将所有字段数据分隔在一行而不是一列中,如上所示。
我希望将每条记录输出到一个新文件中。
“R000358”、“R000358”、“R000358”、“R000358”、“否”等(一行)
这个例子是逗号分隔的,但它可能会改变,但我想我会从那里开始。
任何帮助将不胜感激。提前致谢。
【问题讨论】:
-
记录分隔符是什么?