【发布时间】:2020-05-07 23:22:12
【问题描述】:
如何正确读取这个 ASCII 文本文件?
我可以在这里下载 zip 文件:https://www.irs.gov/pub/irs-soi/eo2016.zip 当我从 zip 文件中打开它时,将“.txt”添加到文件名中,然后在 Excel 中打开它 - 显示了许多没有任何意义的数字(附截图)。enter image description here 我也在 MatLab 和 RStudio 中打开过,但是这些数字也会显示出来。
有人知道如何正确执行此操作吗?
【问题讨论】:
-
eo2016由 22856 行组成,每行 9444 个字符长。我猜这是一个固定宽度的文件。国税局可能会告诉您有关格式的更多信息。您对文件有什么编程相关问题? -
你对线条和字符是正确的。我的问题是,如何在 Excel 中读取该文件。 IRS 还提供了一个解释文件数据的 Excel:irs.gov/pub/irs-soi/eo2016_derl.xlsx 我当前的尝试总是返回无意义的数字,如问题的屏幕截图所示。美国国税局说,需要一个统计软件包来读取文件,但是,使用 R 或 SPSS 我也会收到无意义的数字。