【发布时间】:2016-08-28 20:48:51
【问题描述】:
我用 C# 编写了用于抓取网站的应用程序。 现在我有一个问题 我可以确定此 URL 指向文件或网页! 如何在不发送请求的 URL 的情况下解决此问题?
【问题讨论】:
-
网址提供内容。 “文件”与“网页”是什么意思?您实际上是在要求
Content-Type响应标头吗? -
您使用的是哪个客户端?您应该能够向 url 发出 HEAD 请求并检查响应标头中的内容类型。
-
"How can I solve this problem without having to send the requested URL?"- 你不能。 URL 本身只是一个地址。它不提供任何关于该地址 at 的信息,它只是告诉您在哪里寻找某些东西。该地址的网络服务器可以返回anything。您必须发出 一些 请求(至少是HEAD请求)才能获取有关该地址内容的更多信息。
标签: c# .net url web-crawler