基于大神作品修改原文,使用了一下发现有一些小问题,爬取的博客标题如果含有字符是Windows不支持的命名格式,会卡在界面,进行了一下优化,加了一些字符过滤处理,但是tomd模块对html的处理还是不是很好,比如页面中包含

这种标签,或者一些表格内容,是无法完整处理的,后面看看再优化一下。

下载地址:https://wwi.lanzous.com/ipnIFmgq4sb

CSDN博客转MD格式

相关文章: