【问题标题】:Reading CSV with pandas and ignoring commas用 pandas 读取 CSV 并忽略逗号
【发布时间】:2018-02-15 07:18:45
【问题描述】:

我有一个包含一列和一堆引号的 csv。我想将它读入熊猫系列,以便 csv 中的每一行都是一个条目。但是,当我使用pd.read_csv 时,阅读器在找到逗号时似乎会切断行。

如何忽略逗号,将excel中的整个单元格读入一个系列的对象中?

数据如下:一列多行。连续一个条目是这样的:“赫克托去洗手间了。他很紧张,因为他以前从没去过那里”,所以我的程序因为后面的逗号而将句子中的“紧张”切断了。

【问题讨论】:

  • 使用sep参数定义一个非默认分隔符,
  • 使用 sep 关键字。设置 sep = '|'什么的
  • 所以,sep 将单元格中的项目分成列,但是对于新行,它将使用 excel 中的新行,对吗?
  • 您的数据是什么样的?如果您正在阅读 csv 文件,则以逗号分隔正是它应该做的事情。毕竟,“CSV”中的“CS”代表逗号分隔。
  • 听起来您实际上没有 CSV 文件。您只有一个带有一堆行的纯文本文件。不要尝试将其作为 csv 文件处理。

标签: python python-3.x pandas csv


【解决方案1】:

您有一个文本文件,每行一个条目。因此,您可以通过设置delimiter='\n' 来加载文件,并为您的单列命名:

import pandas as pd

data = pd.read_csv('input.txt', delimiter='\n', names=['text'])
print(data['text'][0])

愿意:

Hector went to the bathroom. He was nervous, as he'd never been there before

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2019-11-30
    • 1970-01-01
    • 2018-07-17
    • 2022-06-13
    • 2017-08-08
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多