【发布时间】:2010-10-15 17:29:18
【问题描述】:
对于显示文件树的 URL,例如 Pypi packages,
是否有一个小的实体模块来遍历 URL 树并像 ls -lR 一样列出它?
我收集(纠正我)文件属性没有标准编码,
链接类型、大小、日期...在 html 中 <A 属性
所以在流沙上构建一个可靠的 URLtree 模块是很困难的。
但肯定是这个轮子 (Unix file tree -> html -> treewalk API -> ls -lR or find)
完成了吗?
(那里似乎有几个蜘蛛/网络爬虫/刮板,但到目前为止它们看起来很丑陋且临时,尽管使用 BeautifulSoup 进行解析)。
【问题讨论】:
标签: python tree beautifulsoup directory-walk