【发布时间】:2013-06-05 04:30:18
【问题描述】:
我正在尝试提取一段嵌套在 html 代码 <span class="code"> 和 </span> 之间的文本。这个想法是我需要存储在它们之间的信息。
如何自动从网页中提取这些信息?
【问题讨论】:
-
你用什么语言解析它? Javascript?红宝石?请更具体。
-
几乎所有语言都提供此功能
-
例如,using Python and BeautifulSoup 您将拥有:
print soup('span', class='code').text
标签: html