【发布时间】:2012-05-14 20:33:07
【问题描述】:
我正在尝试通过 perl 检索 HTML 页面的整个源代码,以便稍后解析其中的一些数据。
最简单的方法是什么?
(最简单的意思是添加新库的开销最小)
谢谢
【问题讨论】:
-
如果您向我们展示您的尝试会有帮助吗?
-
尝试了一些与你有关的问题链接的网络爬虫,它们太具体了,无法从网页中检索预设的内容。我想要更通用的东西
我正在尝试通过 perl 检索 HTML 页面的整个源代码,以便稍后解析其中的一些数据。
最简单的方法是什么?
(最简单的意思是添加新库的开销最小)
谢谢
【问题讨论】:
LWP::Simple 是连接网站以获取源信息的好方法。
use strict;
use warnings;
use LWP::Simple;
my $url = 'http://www.example.com';
my $content = get $url or die "Unable to get $url\n";
print $content;
【讨论】: