【问题标题】:Large CSV manipulation大型 CSV 操作
【发布时间】:2013-11-11 13:28:59
【问题描述】:

我有一个非常大的 CSV 文件(超过 1 亿条记录),我想从中删除几列。我已经尝试了应用程序 CSVed (http://csved.sjfrancke.nl/#csvuni),但是这个大小的文件将无法打开。有人知道我需要进入命令行界面来删除特定列吗?我正在使用 Windows 7。

以下是我目前拥有的列。我在要删除的列旁边放置了一个“X”。

  1. 域名
  2. registrarName - X
  3. contactEmail - X
  4. whoisServer - X
  5. nameServers - X
  6. createdDate - X
  7. 更新日期 - X
  8. expiresDate - X
  9. standardRegCreatedDate - X
  10. standardRegUpdatedDate - X
  11. standardRegExpiresDate - X
  12. 状态 - X
  13. Audit_auditUpdatedDate - X
  14. registrant_email
  15. 注册人姓名
  16. registrant_organization
  17. registrant_street1
  18. registrant_street2
  19. registrant_street3
  20. registrant_street4
  21. registrant_city
  22. registrant_state
  23. registrant_postalCode
  24. registrant_country
  25. registrant_fax - X
  26. registrant_faxExt - X
  27. registrant_telephone
  28. registrant_telephoneExt
  29. administrativeContact_email
  30. administrativeContact_name
  31. administrativeContact_organization
  32. administrativeContact_street1
  33. administrativeContact_street2
  34. administrativeContact_street3
  35. administrativeContact_street4
  36. administrativeContact_city
  37. administrativeContact_state
  38. administrativeContact_postalCode
  39. administrativeContact_country
  40. administrativeContact_fax - X
  41. administrativeContact_faxExt - X
  42. administrativeContact_telephone
  43. administrativeContact_telephoneExt

【问题讨论】:

  • 你到底想做什么?你在哪里工作:Windows / UNIX / Mac?发布一些示例输入和所需的输出。
  • 你可以看看 Perl 的 Text::CSV 模块来编写一个小脚本。

标签: csv command-line fastercsv


【解决方案1】:

你需要的东西叫做cut,可以(例如)从gnuwin32,package coreutils中得到。

一旦你拥有它,

cut -d , -f 1,14-24,27-39,42-43 fileInput.csv > fileOutput.csv

【讨论】:

  • 谢谢。看起来这个包中有很多有用的实用程序。我唯一的问题是,既然我已经下载了它们,我该如何使用它们?如果我转到程序文件下的实用程序的实际文件,它会启动命令提示符,然后立即关闭它。我在 Windows 7 机器和 Windows XP 机器上都试过。谢谢。
  • 这是一个命令行实用程序。打开命令提示符,进入程序目录并运行cut --help。回答中的命令也需要在命令行中运行或从批处理文件中调用。
猜你喜欢
  • 2021-11-25
  • 2022-08-06
  • 2016-12-15
  • 1970-01-01
  • 2019-03-14
  • 1970-01-01
  • 2014-01-27
  • 2015-09-18
  • 1970-01-01
相关资源
最近更新 更多