【发布时间】:2019-10-25 03:46:02
【问题描述】:
我有以下已添加到 Python DataFrame 的文本内容:
0 1
0 Invoice Number
1 Strahse Road 24 ...
2 Bahnhofstrasse 40 ...
3 Page 1 / ... 2
我只对整个文本内容有一个列感兴趣。
下面是方法,我用来将文本内容添加到数据框:
import pandas as pd
import io
def textToDataFrame(textContent):
return pd.read_fwf(io.StringIO(textContent), header=None, na_filter=False)
这就是我得到上述输出的方式:
dataframe = textToDataFrame(text)
print(dataframe)
我有点不确定我该怎么做,所以我只能得到一 (0) 列?列数可以动态变化,具体取决于textContent
【问题讨论】:
-
textContent到底是什么对象? -
@Xukrao
textContent只是一个string