【发布时间】:2018-03-13 07:59:40
【问题描述】:
我正在从网站上抓取表格,并将其放入 Excel 文件。 我的目标是以正确的方式将一列分成两列。
我要拆分的列:“FLIGHT”
我想要这个表格:
第一个例子:KL744 --> KL 和 0744
第二个例子:BE1013 --> BE 和 1013
所以,我需要分隔第 2 个字符(在第一列),然后是 1-2-3-4 个字符的下一个字符。如果 4 没问题,我保留它,如果 3,我想在它前面放一个 0,如果 2:我想在它前面放 00(所以我的目标是在第二列中获得 4 个字符/数字。)
我该怎么做?
这里是我的相关代码,里面已经包含了格式化代码。
df2 = pd.DataFrame(datatable,columns = cols)
df2["UPLOAD_TIME"] = datetime.now()
mask = np.column_stack([df2[col].astype(str).str.contains(r"Scheduled", na=True) for col in df2])
df3 = df2.loc[~mask.any(axis=1)]
if os.path.isfile("output.csv"):
df1 = pd.read_csv("output.csv", sep=";")
df4 = pd.concat([df1,df3])
df4.to_csv("output.csv", index=False, sep=";")
else:
df3.to_csv
df3.to_csv("output.csv", index=False, sep=";")
这里是我表中的 excel prt sc:
【问题讨论】:
标签: python pandas dataframe split debian