【发布时间】:2020-05-23 14:38:41
【问题描述】:
我正在尝试从 txt 文件加载表格,但我想从某个单词开始加载 在这种情况下,这是文件,我想从句子下面的数字开始 >>>>Begin....
我知道skiprows 命令,但并非所有表都从同一行开始
谢谢
【问题讨论】:
标签: python pandas jupyter-lab
我正在尝试从 txt 文件加载表格,但我想从某个单词开始加载 在这种情况下,这是文件,我想从句子下面的数字开始 >>>>Begin....
我知道skiprows 命令,但并非所有表都从同一行开始
谢谢
【问题讨论】:
标签: python pandas jupyter-lab
也许不是超级有效的方法,但我尝试使用以下脚本过滤必要的数据并附加到 df:
import re
import os
import pandas as pd
def foo(file_name):
# create empty df
df = pd.DataFrame(columns=list('ab'))
pat = r'>+[a-zA-Z ]*<+'
pat2 = r'[-0-9.]*'
start_save_to_df = False
# set path
with open(os.path.join(os.getcwd(),'src',file_name)) as f:
for row in f.readlines():
if start_save_to_df:
val1, val2 = [float(val) for val in re.findall(pat2, row) if val]
# append data
df = df.append({'a': val1, 'b': val2}, ignore_index=True)
if re.search(pat, row):
start_save_to_df = True
return df
希望对你有帮助。
【讨论】: