【发布时间】:2020-05-22 13:29:52
【问题描述】:
我想将 jython 用于基本的网络抓取任务,而不是学习 java。为了学习基础知识,我使用了来自http://blog.databigbang.com/web-scraping-ajax-and-javascript-sites/ 的示例,我一直未能成功尝试从 Windows cmd 运行 gartner.py 代码。任何人都可以提出一个解决方案来解决这两者的原因
jython -J-classpath "path\to\the\jars\*" path\to\gartner.py
和
jython path\to\gartner.py
继续扔
Traceback (most recent call last):
File "path\to\gartner.py", line 1, in <module>
import com.gargoylesoftware.htmlunit.WebClient as WebClient
ImportError: No module named gargoylesoftware
鉴于我已经为 jython path\to\jython\bin、java path\to\Java\jdk-14.0.1\bin 和 htmlunit-2.40.0 设置了环境变量,我已将 path\to\jars\htmlunit-2.40.0\lib 添加到 CLASSPATH。
我知道 jython 应该在jython -J-classpath "path\to\the\jars\*" path\to\gartner.py 中提取指定的包,但它没有找到它。另外,我知道在jython path\to\gartner.py 的情况下,定义的 CLASSPATH 变量可用于指向 htmlunit-2.40.0(如上所述)的 Java,而 jython 仅用作从 python 到 java 的翻译器。所以 - 在我的理解中 - java 应该有所有可用于导入所需模块的参数。请问,谁能确认一下?
我很欣赏这个主题已经进行了一些讨论,但没有明确的解决方案。我可能会错过什么?
【问题讨论】:
标签: java python web-scraping jython htmlunit