【发布时间】:2013-08-29 15:26:02
【问题描述】:
我基本上必须制作一个程序,该程序接受用户输入的网址并解析 html 以查找链接。然后将所有链接以某种格式存储在另一个 HTML 文件中。我只能访问内置的 python 模块(python 3)。我能够使用 urllib.request 从链接中获取 HTML 代码并将其放入字符串中。我将如何实际从该字符串中提取链接并将它们放入字符串数组中?也可以识别链接(例如图像链接/ mp3链接),以便我可以将它们放入不同的数组中(然后我可以在创建输出文件时对它们进行分类)
【问题讨论】:
标签: python html python-3.x html-parsing