【发布时间】:2014-04-14 04:51:12
【问题描述】:
我正在使用 python for android (sl4a) 编写一个 android 应用程序,我想要它做的是搜索一个笑话网站并提取一个笑话。然后告诉我那个笑话来唤醒我。到目前为止,它将原始 html 源保存到一个列表中,但我需要它通过保存 html 标记之间的数据然后将这些数据读取给我来创建一个新列表。它是我无法工作的解析器。代码如下:
import android
droid = android.Android()
import urllib
current = 0
newlist = []
sock = urllib.urlopen("http://m.funtweets.com/random")
htmlSource = sock.read()
sock.close()
rawhtml = []
rawhtml.append (htmlSource)
while current < len(rawhtml):
while current != "<div class=":
if [current] == "</b></a>":
newlist.append (current)
current += 1
print newlist
【问题讨论】:
-
抓取见Beautiful Soup。
-
我不知道如何安装漂亮的汤模块,因为我使用的是 android 脚本层,而不是典型的 python 安装。
标签: android python html parsing scrape