【发布时间】:2016-05-11 10:26:03
【问题描述】:
我正在使用 import.io 软件从 Edmunds 中提取数据...示例页面http://www.edmunds.com/bugatti/veyron-164/2009/st-101194582/features-specs/
我向 support@import.io 发送了几次电子邮件,但他们只帮助了我一次,并说没有时间和资源来帮助解决有关单个项目而不是软件本身的问题。
我使用 XPATH 成功提取了技术规范,例如 //td[contains (.,"HORSEPOWER")]/span
<td>
<label>HORSEPOWER</label>
<span> 1001 hp @ 6000 rpm</span>
</td>
但是我不知道如何提取
几行。 XPATH //li 确实提取了单个列中的所有特征以及我不需要的其他数据。
请告诉我一个 XPATH,它按单个类别、舒适、娱乐、安全功能等提取特征。我需要为每个特征类别将特征放在一个列中。
<h3 id="safety_feat" class="safety-feat">Safety Features</h3>
<div class="hr thick"></div>
<table class="items only-values" data-selenium="safety">
<tr>
<td>
<ul class="items">
<li><p>4-wheel ABS</p></li>
</ul>
</td>
另一件可以为我的数据库增加好处的事情是提取颜色名称和 RGB 值,这可能吗?
<span style="display: block; background-color:rgb(255,255,255);">
<span style="display: block;" class="clrtxt">COLOR NAME</span>
【问题讨论】: