【发布时间】:2015-02-26 07:39:16
【问题描述】:
我想将 word 文档转换为文本。所以我用了一个脚本。
import win32com.client
app = win32com.client.Dispatch('Word.Application')
doc = app.Documents.Open(r'C:\Users\SBYSMR10\Desktop\New folder (2)\GENERAL DATA.doc')
content=doc.Content.Text
app.Quit()
print content
我有以下结果:
现在我想将此文本转换为包含其所有项目的列表。我用过
content = " ".join(content.replace(u"\xa0", " ").strip().split())
编辑
当我这样做时,我得到:
它不是一个列表。问题是什么?那个大点字符是什么?
【问题讨论】:
-
什么不起作用?你得到了什么?
-
“没用”是什么意思?