【问题标题】:convert from string to pandas dataframe从字符串转换为熊猫数据框
【发布时间】:2019-04-16 03:07:14
【问题描述】:

我在 AWS Lambda 中从 AWS S3 导入一个 csv 文件,代码如下:

file = s3.get_object(Bucket = bucket, Key = key)
rows = file['Body'].read().decode('utf-8').splitlines(False)

我收到以下格式的输入:

数据 = "a,b,c,d,\"x,y\",e,f"

我想要以下格式的输出:

>>>`>>> df
   0  1  2  3    4  5  6
0  a  b  c  d  x,y  e  f`

我必须根据 ',' 拆分数据,但如果在 " " 之间有一些丁字裤,它们应该保持原样。

或者如果您有任何其他解决方案可以将 csv 文件从 s3 导入 lambda 并在 Data Frame 中转换,请建议

【问题讨论】:

    标签: python pandas dataframe amazon-s3 aws-lambda


    【解决方案1】:

    使用csv模块

    试试这个,

    from csv import reader
    import pandas as pd
    data=["a,b,c,d,\"x,y\",e,f"]
    df=pd.DataFrame( list(reader(data)))
    print df
    

    输出:

       0  1  2  3    4  5  6
    0  a  b  c  d  x,y  e  f
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-11-23
      • 1970-01-01
      • 1970-01-01
      • 2017-03-28
      • 2017-07-31
      • 1970-01-01
      相关资源
      最近更新 更多