【发布时间】:2012-05-03 11:19:08
【问题描述】:
我以前使用 WatIn 从网站上抓取大量数据。我知道我可以用它来处理这项任务,但如果可能的话,我希望有一个更轻松的解决方案。
我希望能够转到一个 URL,查看该网站上是否有“打开”字样,或者是否有“关闭”字样。
有人有好的建议吗?
【问题讨论】:
标签: c# .net web-scraping
我以前使用 WatIn 从网站上抓取大量数据。我知道我可以用它来处理这项任务,但如果可能的话,我希望有一个更轻松的解决方案。
我希望能够转到一个 URL,查看该网站上是否有“打开”字样,或者是否有“关闭”字样。
有人有好的建议吗?
【问题讨论】:
标签: c# .net web-scraping
您可以使用 html 解析。Html Agility Pack 可以帮助您。
【讨论】:
是的。使用WebClient.DownloadString 方法并检查带有standard string methods 的页面。这很简单。
如果您想要更多,请按照@mekici 的提示:The Html Agility Pack。
【讨论】:
探索HttpWebRequest 和HttpWebResponse。您可以在字符串变量中获取页面的文本,并使用IndexOf 或Contains 获取文本
【讨论】: