长期逛天涯社区,许多的经典的帖子都有许多页,而且里面还夹杂了大量的回复或者广告,不能像MOP一样只看楼主,这样阅读起来非常不便,故此写了一个小程序实现离线阅读并只看楼主功能。实现的思路是通过HttpWebRequest取得要查看的网页内容,然后用正则表达式将其中感性趣的部分取出来,我主要取了分页信息,同时分离出了各贴以及作者,这样可以实现查看任意一个人帖子的功能,如果需要的话可以将取出的数据保存在本地硬盘中以方便查看,在这个程序没有作本地保存。程序中的主要代码部分有:
1、从指定网址下载网页
天涯社区离线阅读器(实现只看楼主功能)        public string Get_SourceHtml(string a_strUrl)
        }
2、分离出帖子正文
天涯社区离线阅读器(实现只看楼主功能)        public string SplitHtml(string htmlContent)
        }
3、获取指定作者的发帖在本地生成新的Html文件以便在程序内嵌浏览器中查看
天涯社区离线阅读器(实现只看楼主功能)        public string GetAuthorsContent(string SourceHtml, string AuthorName)
        }
4、获取分页数据
天涯社区离线阅读器(实现只看楼主功能)        public List<PageData> GetPages(string SourceHtml)
        }

完整源代码点击下载

相关文章:

  • 2021-08-06
  • 2021-11-20
  • 2021-06-25
  • 2021-07-09
  • 2022-12-23
  • 2021-12-05
  • 2023-02-14
  • 2021-11-17
猜你喜欢
  • 2021-05-31
  • 2022-12-23
  • 2021-09-28
  • 2022-02-08
  • 2022-12-23
  • 2022-01-15
  • 2021-08-07
相关资源
相似解决方案