【发布时间】:2015-04-26 06:42:02
【问题描述】:
我目前正在尝试将一些数据导入 weka。目前数据在 CSV 文件中,由数字 ID 和一些字符串数据(推文)组成。我在读取“错误数量的值,读取 1,预期 2 个令牌 [EOL],第 17 行”时遇到错误。我使用引号作为字符串数据的附件字符。我知道某些东西(可能是 EOL 字符?)导致 weka 错误地将一些字符串数据分成同一行的多个条目,但我不确定如何解决 EOL 令牌问题。
我的数据集可以在这里查看。当前数据集在工作表 2 上:
https://docs.google.com/spreadsheets/d/1Yclu0t4ITFWn6itYBsVtkGalmP9BPaWFFP6U6jAeLMU/edit?usp=sharing
文本文件本身可以在这里找到:
https://drive.google.com/file/d/0B433FqC3TscQQkRxZklQclA3Z3M/view?usp=sharing
当前错误现在位于第 3 行,但错误相同。唯一的换行符是在行尾表示一个新条目,所以我不确定它为什么会出现问题。
【问题讨论】: