【发布时间】:2021-08-16 20:56:28
【问题描述】:
我想区分两个同名的联赛,都是“Primera Division”,我希望从联赛的网址中获取国家/地区名称并将其附加到比赛中,创建“Primera Division Peru”或“Primera乌拉圭分部”。
这是一个代码sn-p:
class ls:
url = "https://www.livesoccertv.com/channels/goltv-play"
page = urllib.request.Request(url, headers={'User-Agent': 'Mozilla/5.0'})
data = urllib.request.urlopen(page).read()
df = pd.read_html(ls.data, index_col=False)[0]
df.columns = ["live", "date", "time", "hometeam", "comp"]
df.drop(columns='live', inplace=True)
df.hometeam.str.split(expand=True)
df[['hometeam', 'awayteam']] = df.hometeam.str.split(" vs ", expand=True)
df.to_csv('livesoccer.csv', index=False)
我得到的结果是这样的......
| date | time | hometeam | comp | awayteam |
|---|---|---|---|---|
| 16 Aug | 21:15 | Cerrito | Primera Division | Deportivo Maldonado |
| 17 Aug | 17:00 | Cusco | Primera Division | Carlos Manucci |
但我想获取比赛的 url 并从中提取国家名称,以在 CSV 文件中将两个联赛彼此区分开来,结果看起来像这样......
| date | time | hometeam | comp | awayteam |
|---|---|---|---|---|
| 16 Aug | 21:15 | Cerrito | Primera Division Uruguay | Deportivo Maldonado |
| 17 Aug | 17:00 | Cusco | Primera Division Peru | Carlos Manucci |
非常感谢任何帮助。
【问题讨论】:
-
晚上好,我想看看能不能帮上忙。我将您的代码输入到笔记本中,但是出现以下错误 NameError: name 'channel' is not defined。应该为频道分配什么?
-
啊,为了清楚起见,我将频道添加到 url,但忘记从代码中删除
+channel。我现在就编辑它。
标签: python pandas python-requests urllib python-re