【发布时间】:2021-05-10 22:00:44
【问题描述】:
我正在从 Azure blob 下载一个巨大的 csv 文件,我想通过添加一个新列来转换数据,然后将转换后的 csv 文件上传到另一个位置。
由于它是一个包含大约 42 列的巨大文件,因此应用程序在尝试转换时会失败或重新启动。
有人可以建议我如何实现这个用例吗?
输入csv
col1,col2,col3....col41 10,23,asds....29 34,83,hdkd....57 so on
csv 中的预期输出
NewCol,col1,col2,col3.....col41 1023,10,23,asda......29
3483,34,83,hdkd......57 so on
提前致谢
【问题讨论】:
-
能否告知文件是如何下载的? HTTP,SFTP,其他?谢谢。
-
如何失败?请在日志中添加任何错误消息,完整的,作为文本。
-
您的问题是关于如何解决错误还是关于如何添加列?
-
我正在从 azure 存储连接器获取数据。我尝试转换以添加列,但是当我在 cloudhub 上运行它时出现此错误“[警告] PersistedLongArray(fileName:
dw-buffer-index-5.tmp正在被 GCed 但仍处于打开状态。它将被关闭以避免 tmp 泄漏。”并且应用程序重新启动。如前所述,我有 41 列。 -
能否用您的流程截图更新您的问题?谢谢