【问题标题】:How to remove trailling dots from pandas series?如何从熊猫系列中删除尾随点?
【发布时间】:2020-12-19 22:01:22
【问题描述】:

如何去除 pandas 系列中的尾随点?

我的尝试

import numpy as np
import pandas as pd

pd.set_option('max_colwidth',1000)

s = pd.Series(["""Finally a transparant silicon case ^^ Thanks to my uncle :) #yay #Sony #Xperia #S #sonyexperias… http://instagram.com/p/YGEt5JC6JM/"""])


s.str.replace(r'(\w)\.+',r'\1',regex=True)

我的结果

Finally a transparant silicon case ^^ Thanks to my uncle :) #yay #Sony #Xperia #S #sonyexperias… http://instagramcom/p/YGEt5JC6JM/


wanted:
Finally a transparant silicon case ^^ Thanks to my uncle :) #yay #Sony #Xperia #S #sonyexperia http://instagramcom/p/YGEt5JC6JM/

【问题讨论】:

  • 那些不是多个. 字符,它们是一个省略号字符。

标签: python pandas


【解决方案1】:

那些不是句点,它们是省略号字符,即 Unicode 字符 \u2026。见How should I write three dots?

s.str.replace(r'(\w)\u2026+',r'\1',regex=True)

【讨论】:

    【解决方案2】:

    您能否尝试以下操作,按照所示示例编写。

    pd.set_option('max_colwidth',1000)
    s = pd.Series(["""Finally a transparant silicon case ^^ Thanks to my uncle :) #yay #Sony #Xperia #S #sonyexperias… http://instagram.com/p/YGEt5JC6JM/"""])
    s.str.replace(r'…+',r'')
    

    【讨论】:

      【解决方案3】:

      根据 Barmar 的建议:

      s = pd.Series(["""Finally a transparant silicon case ^^ Thanks to my uncle :) #yay #Sony #Xperia #S #sonyexperias… http://instagram.com/p/YGEt5JC6JM/"""])
      
      
      s.str.replace(r'(\w)…',r'\1',regex=True)
      
      Gives:
      Finally a transparant silicon case ^^ Thanks to my uncle :) #yay #Sony #Xperia #S #sonyexperias http://instagram.com/p/YGEt5JC6JM/
      

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 2013-12-12
        • 1970-01-01
        • 2022-07-13
        • 2021-01-11
        • 1970-01-01
        • 1970-01-01
        • 2020-10-03
        相关资源
        最近更新 更多