长期逛天涯社区,许多的经典的帖子都有许多页,而且里面还夹杂了大量的回复或者广告,不能像MOP一样只看楼主,这样阅读起来非常不便,故此写了一个小程序实现离线阅读并只看楼主功能。实现的思路是通过HttpWebRequest取得要查看的网页内容,然后用正则表达式将其中感性趣的部分取出来,我主要取了分页信息,同时分离出了各贴以及作者,这样可以实现查看任意一个人帖子的功能,如果需要的话可以将取出的数据保存在本地硬盘中以方便查看,在这个程序没有作本地保存。程序中的主要代码部分有: 1、从指定网址下载网页 public string Get_SourceHtml(string a_strUrl) } 2、分离出帖子正文 public string SplitHtml(string htmlContent) } 3、获取指定作者的发帖在本地生成新的Html文件以便在程序内嵌浏览器中查看 public string GetAuthorsContent(string SourceHtml, string AuthorName) } 4、获取分页数据 public List<PageData> GetPages(string SourceHtml) } 完整源代码点击下载 相关文章: 2021-08-06 2021-11-20 2021-06-25 2021-07-09 2022-12-23 2021-12-05 2023-02-14 2021-11-17