【发布时间】:2021-09-01 23:57:43
【问题描述】:
考虑如下所示的数据框。
import pandas as pd
data= [
{'col1':'101', 'col2': '101', 'col3':'1321'},
{'col1':'99', 'col2': '99', 'col3':'101'},
{'col1':'21', 'col2': '23', 'col3':'99'},
{'col1':'47', 'col2': '67', 'col3':'47'},
{'col1':'1321', 'col2': '47', 'col3':'23'}
]
df = pd.DataFrame(data)
如何计算每列之间的 Jaccard 相似度,然后将其绘制在热图上?
这样做似乎不对。
df111 = df.to_numpy()
res = 1 - pdist(df111, 'jaccard')
【问题讨论】:
标签: python python-3.x pandas seaborn heatmap