【问题标题】:Pandas Dataframe to tensor熊猫数据框到张量
【发布时间】:2021-03-24 00:13:40
【问题描述】:

我有一个包含 3 列的数据框(日期索引、价格和字符串符号)。 看起来是这样的:

Date Price Symbol
2019-01-02 39.480000 AAPL
2019-01-02 101.120003 MSFT
2019-01-02 62.023998 TSLA
2019-01-03 35.547501 AAPL
2019-01-03 97.400002 MSFT
2019-01-03 60.071999 TSLA

我正在寻找一些 panda/pytorch/python 语法糖来将其转换为张量/矩阵:

[ [ 39.480000, 101.120003, 62.023998], [35.547501, 97.400002, 60.071999]]

第一个维度的数字长度将是唯一日期的数量,第二个维度的长度将是唯一符号的数量。 我保证每个日期恰好有 3 个符号,并且我希望矩阵的每一行的列都遵循相同的顺序(例如,总是 AAPL、MSFT、TSLA)。

现在,使用一些 for 循环很容易,但我正在寻找更“pythonic”的东西

【问题讨论】:

    标签: python pandas pytorch


    【解决方案1】:

    您可以groupby日期列,将Price的组转换为numpy数组,然后将这个系列转换为张量:

    import torch
    import pandas as pd
    
    prices = df.groupby(['Date'])['Price'].apply(np.array)
    my_tensor = torch.tensor(prices)
    

    【讨论】:

      猜你喜欢
      • 2020-04-18
      • 2019-01-17
      • 2020-06-03
      • 1970-01-01
      • 1970-01-01
      • 2015-11-12
      • 2014-02-01
      相关资源
      最近更新 更多