【发布时间】:2019-10-01 13:48:59
【问题描述】:
所以我有一个一般性问题,但由于我是用 Python 编写的,所以它是标签。
假设我有 df 这是一个熊猫数据框 - 我通常会这样做:
df=pd.DataFrame(data = cosine_similarity(df.T))
而不是
df=df.T
df = pd.DataFrame(data = cosine_similarity(df))
但后来我想:如果 memory 是问题(而不是速度),那么第二种方法会优于第一种吗?我假设cosine_similarity 必须计算df.T 才能使用它,因此使用了两倍的内存(df 和df.T 都存储在内存中),直到计算完成。
我是对的还是这到底是怎么做的?
【问题讨论】:
-
没有。没有新的分配;你只是在改组显式引用。