【发布时间】:2013-05-27 04:26:14
【问题描述】:
每天我都需要打开一个网页,复制页面上的文本并将其粘贴到 Excel 文件中。有没有一种方法可以让我使用 Python 自动执行此过程,而无需打开网络浏览器?
感谢提供答案的朋友。可以举个例子吗?
谢谢。
【问题讨论】:
-
如果问题是你能做到这一点,那么答案是肯定的,但这样做的目的不是让其他人为你做这项工作。
每天我都需要打开一个网页,复制页面上的文本并将其粘贴到 Excel 文件中。有没有一种方法可以让我使用 Python 自动执行此过程,而无需打开网络浏览器?
感谢提供答案的朋友。可以举个例子吗?
谢谢。
【问题讨论】:
您可以使用一种称为网络抓取的技术;甚至还有一个用python编写的开源框架scrapy,它是专门为抓取和屏幕抓取而编写的。
只需使用搜索短语进行谷歌搜索,例如; “使用 python 进行网络抓取”这应该足以让您开始使用。
下面的帖子中有一些很好的信息; Anyone know of a good Python based web crawler that I could use?
【讨论】:
当然,只需使用urllib2 打开您的网页,然后使用BeautifulSoup 查看内容,然后使用xlwt 将该数据粘贴到Excel 文件中。简单!
【讨论】:
是的,你可以这样做。
我建议:
祝你好运
【讨论】:
您可以在 excel 本身中做同样的事情(从 Web 将数据导入 Excel)。从 Excel 功能区中选择“数据”>“来自 Web。如果您一心想使用 python,请尝试 https://datanitro.com/ 。 Datanitro 是一个优秀的 python-excel 集成。这是一个演示http://scriptogr.am/richie/post/python-for-excel-using-datanitro
【讨论】:
是的,有。您需要使用 urllib2 从网络中提取 HTML,然后需要解析 HTML 以获得所需的值(模块 BeautifulSoup 和 regex),最后将结果保存为 CSV 文件,可以在 Excel 中打开
【讨论】: