从 Pandas 数据框列中剥离字符答案

【问题标题】：Stripping Characters from Pandas Dataframe Column从 Pandas 数据框列中剥离字符
【发布时间】：2020-10-29 11:56:36
【问题描述】：

我正在尝试仅获取团队名称并删除在我抓取表格时附加的团队记录。我知道我可以使用 rstrip()，但我不想输入所有要删除的团队记录。有什么想法吗？

# Using Pandas to extract rankings tables

import pandas as pd

tables = pd.read_html(base_site)
# base_site = "http://cbssports.com/college-football/rankings/cbs-sports-ranking/"

rankings=tables[0]
rankings

rankings.drop(['Trend', 'Next Game', 'Unnamed: 5', 'Unnamed: 3'], axis=1)

从中我得到：

    Rank    Team
0   1   LSU 15-0
1   2   Clemson 14-1
2   3   Ohio St. 13-1
3   4   Georgia 12-2
4   5   Oregon 12-2

...     ...     ...
125     126     New Mexico St. 2-10
126     127     Old Dominion 1-11
127     128     UTEP 1-11
128     129     Massachusetts 1-11
129     130     Akron 0-12

130 行 × 2 列

希望从“团队”列中删除团队的记录。想法？

【问题讨论】：

但我不想输入所有要删除的团队记录。有任何想法吗？不明白这个...
对不起，我的意思是说我需要指定要删除的字符或字符串，这将是团队记录：.即rstrip(15-1等)

标签： python-3.x pandas

【解决方案1】：

你可以rsplit

df['Team']=df['Team'].str.rsplit(' ', n=1).str[0]

【讨论】：

您介意解释一下 n=1).strip(0) 的作用吗？谢谢
@DJF rsplit ，从右边拆分字符串，只拆分第一个空白，我们得到第一部分