【问题标题】:Stripping Characters from Pandas Dataframe Column从 Pandas 数据框列中剥离字符
【发布时间】:2020-10-29 11:56:36
【问题描述】:

我正在尝试仅获取团队名称并删除在我抓取表格时附加的团队记录。我知道我可以使用 rstrip(),但我不想输入所有要删除的团队记录。有什么想法吗?

# Using Pandas to extract rankings tables

import pandas as pd

tables = pd.read_html(base_site)
# base_site = "http://cbssports.com/college-football/rankings/cbs-sports-ranking/"

rankings=tables[0]
rankings

rankings.drop(['Trend', 'Next Game', 'Unnamed: 5', 'Unnamed: 3'], axis=1)

从中我得到:

    Rank    Team
0   1   LSU 15-0
1   2   Clemson 14-1
2   3   Ohio St. 13-1
3   4   Georgia 12-2
4   5   Oregon 12-2

...     ...     ...
125     126     New Mexico St. 2-10
126     127     Old Dominion 1-11
127     128     UTEP 1-11
128     129     Massachusetts 1-11
129     130     Akron 0-12

130 行 × 2 列

希望从“团队”列中删除团队的记录。想法?

【问题讨论】:

  • 但我不想输入所有要删除的团队记录。有任何想法吗?不明白这个...
  • 对不起,我的意思是说我需要指定要删除的字符或字符串,这将是团队记录:.即rstrip(15-1等)

标签: python-3.x pandas


【解决方案1】:

你可以rsplit

df['Team']=df['Team'].str.rsplit(' ', n=1).str[0]

【讨论】:

  • 您介意解释一下 n=1).strip(0) 的作用吗?谢谢
  • @DJF rsplit ,从右边拆分字符串,只拆分第一个空白,我们得到第一部分
猜你喜欢
  • 1970-01-01
  • 2017-04-18
  • 1970-01-01
  • 2010-09-19
  • 2012-09-30
  • 2011-12-03
  • 1970-01-01
  • 2018-04-20
相关资源
最近更新 更多