【发布时间】:2022-12-07 13:44:28
【问题描述】:
我有一个以分号分隔的 pandas DataFrame,其中包含所有 dtypes 的对象。在某些单元格中,字符串值可以包含 "、逗号 (,) 或两者兼有(例如 TES"T_ING,_VALUE)。然后,我根据某些条件使用 df.query 查询 DF 以获取 DataFrame 的子集,但是具有示例中描述的模式的行被完全省略,但其余行返回得很好。另一个要求是我还需要将文本中的所有 " 与结束引号匹配,但应用 lambda 将 " 替换为 "" 也没有正确完成。我尝试了几种方法,它们列在下面
问题一:
pd.read_csv("file.csv", delimiter=';')
pd.read_csv("file.csv", delmiter=';', thousands=',')
pd.read_csv("file.csv", delimiter=";", escapechar='"')
pd.read_csv("file.csv", delimiter=";", encoding='utf-8')
以上所有都无法加载有问题的数据。
问题二: 输入:TES"T_ING,_VALUE 到 TES""T_ING,_VALUE 我努力了:
df.apply(lambda s: s.str.replace('"', '""')
什么都不做。
究竟是怎么回事?我无法在任何地方找到解决此类特定问题的任何问题。
提前感谢您的帮助。
【问题讨论】: