【发布时间】:2020-06-29 08:56:46
【问题描述】:
我正在尝试从缩短的 URL 中获取 tiktok 视频的 URL,以便提取海报的 @username 和帖子的视频 ID。我遇到的一些缩短 URL 的例子似乎是在 Facebook/Twitter 上以“m.tiktok.com”或更具体地说是“https://vm.tiktok.com/pF6GGf/”的形式共享的 URL。该链接最终重定向到“https://www.tiktok.com/@blessy2flex/video/6796374554391448838 ...”。有什么方法可以只用缩短的 URL 来获取这个 URL?
我希望能够从实际 URL 中显示的缩短 URL 中获取用户名 (@blessy2flex) 和视频 ID (6796374554391448838)。我尝试过跟踪重定向,但最终的 URL 是“https://m.tiktok.com/v/6833793010149412101.html...”,这显然是不一样的。
我也尝试过 Selenium 之类的东西,它实际上最终给了我原始视频页面的 HTML,我可以在其中通过搜索实际的 HTML 找到用户名和视频 ID,但这种方法没有似乎太可扩展了,因为我确信 tiktok 会注意到并减慢我的流程。
【问题讨论】:
标签: python web-scraping url-shortener