【发布时间】:2011-02-07 20:11:06
【问题描述】:
我有一个site,我想使用 Unix wget 下载它。
如果您查看文件的源代码和内容,它包含名为“SUMMARY”的部分。
但是在发出这样的 wget 命令后:
wget -O downdloadedtext.txt http://www.ncbi.nlm.nih.gov/IEB/Research/Acembly/av.cgi?db=mouse&c=gene&a=fiche&l=2610008E11Rik
downdloadedtext.txt的内容不完整,与源码不同
那个网站的。例如,它不包含摘要部分。有没有正确获取完整内容的正确方法?
我之所以问这个问题是因为我想从该 HTML 中的不同值自动下载。
【问题讨论】:
-
我不明白。源代码有什么区别? Javascript 与它有什么关系?
-
@Pekka:包含 javascript 的正文不会被下载。请尝试看看。
-
我现在没有 wget 方便(在 Windows 机器上)。是实际的body不同还是js文件没有被下载?
标签: javascript html linux cgi wget