【问题标题】:Applying Jaro-Winkler distance to dataframe将 Jaro-Winkler 距离应用于数据帧
【发布时间】:2019-08-05 14:10:09
【问题描述】:

我有两列的数据框。第一个是正确的字符串,第二个是损坏的。我想应用 Jaro-Winkler 距离并将其存储在新的第三列中。

import pandas as pd
from pyjarowinkler.distance import get_jaro_distance

df = pd.DataFrame(
        {"Correct" : ['Hello' , 'bread' , 'situation'],
         "Corrupt" : ['Hlloe' , 'braed' , 'sitatuion']},
        index = [1, 2, 3])

【问题讨论】:

    标签: python pandas dataframe jaro-winkler


    【解决方案1】:
    df['res'] = [get_jaro_distance(x, y) for x, y in zip(df['Correct'], df['Corrupt'])]
    
        Correct Corrupt res
    1   Hello   Hlloe   0.88
    2   bread   braed   0.95
    3   situation   sitatuion   0.97
    
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2019-07-20
      • 2013-04-05
      • 1970-01-01
      • 2021-12-05
      • 2016-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多