【发布时间】:2010-03-04 23:41:24
【问题描述】:
现在它设置为写入文件,但我希望它将值输出到变量。不知道怎么做。
from BeautifulSoup import BeautifulSoup
import sys, re, urllib2
import codecs
woof1 = urllib2.urlopen('someurl').read()
woof_1 = BeautifulSoup(woof1)
woof2 = urllib2.urlopen('someurl').read()
woof_2 = BeautifulSoup(woof2)
GE_DB = open('GE_DB.txt', 'a')
for row in woof_1.findAll("tr", { "class" : "row_b" }):
for col in row.findAll(re.compile('td')):
GE_DB.write(col.string if col.string else '')
GE_DB.write(" ")
GE_DB.write("\n")
GE_DB.close()
for row in woof_2.findAll("tr", { "class" : "row_b" }):
for col in row.findAll(re.compile('td')):
GE_DB.write(col.string if col.string else '')
GE_DB.write("\n")
GE_DB.close()
【问题讨论】:
-
如果您解释(1)您理解“将值输出到变量”的含义以及一旦完成(2)您的脚本将如何处理“变量”,这将非常有帮助-- 只是从脚本末尾掉下来似乎不值得第 1 步的努力。
-
好的,所以当您在带有表格的站点上运行上述脚本时。它需要 td 标签之间的内容。我希望它将其值存储为变量。
-
大众-1票怎么了?
标签: python variables beautifulsoup scrape