【发布时间】:2011-12-04 17:43:50
【问题描述】:
我想在 Python 中读取用户输入以获取 url(例如 http://www.google.com),然后以 HTML 格式(仅文本)将网页打印到终端。我尝试使用pexpect.spawn('elinks'),但 elinks 似乎没有写入标准输出。我还查看了 HTMLParser 模块,但我不知道如何将生成的文本格式化为类似于网页的内容。有什么建议吗?
【问题讨论】:
-
如果措辞不当,您的问题会很有趣。我相信您会问“是否有 Python 库可以以 ASCII 格式呈现 HTML 页面?”我相信这个问题的正确答案是“对不起,不”。也许有一些标签的小子集(H*、DIV、P、BR)可以查找并忽略其余部分。
标签: python html webpage pexpect html-parsing