【问题标题】:RUBY Nokogiri CSS HTML ParsingRUBY Nokogiri CSS HTML Parsing
【发布时间】:2011-01-29 01:55:36
【问题描述】:

我在尝试获取下面的代码以我想要的格式输出数据时遇到了一些问题。我所追求的是以下内容:

CCC1-$5.00
CCC1-$10.00
CCC1-$15.00
CCC2-$7.00

其中$7属于CCC2,其他属于CCC1,但我只能设法以这种格式获取数据:

CCC1-$5.00
CCC1-$10.00
CCC1-$15.00
CCC1-$7.00
CCC2-$5.00
CCC2-$10.00
CCC2-$15.00
CCC2-$7.00

任何帮助将不胜感激。

require 'rubygems'  
require 'nokogiri'  
require 'open-uri'

doc = Nokogiri::HTML.parse(<<-eohtml)
<div class="AAA">
    <table cellspacing="0" cellpadding="0" border="0" summary="sum">
        <tbody>
            <tr>
                <td class="BBB">
                    <span class="CCC">CCC1</span>
                </td>
                <td class="DDD">
                    <table cellspacing="0" cellpadding="0" border="0">
                        <tbody>
                            <tr><td class="FFF">$5.00</td></tr>
                            <tr><td class="FFF">$10.00</td></tr>
                            <tr><td class="FFF">$15.00</td></tr>
                        </tbody>
                    </table>
                </td>
            </tr>
        </tbody>
    </table>
    <table cellspacing="0" cellpadding="0" border="0" summary="sum">
        <tbody>
            <tr>
                <td class="BBB">
                    <span class="CCC">CCC2</span>
                </td>
                <td class="DDD">
                    <table cellspacing="0" cellpadding="0" border="0">
                         <tbody>
                             <tr><td class="FFF">$7.00</td></tr>
                         </tbody>
                    </table>
                </td>
            </tr>
        </tbody>
    </table>
</div>
eohtml

doc.css('td.BBB > span.CCC').each do |something|
    doc.css('tr > td.EEE,  tr > td.FFF').each do |something_more|
        puts something.content + '-'+ something_more.content
    end
end

【问题讨论】:

    标签: html css ruby parsing nokogiri


    【解决方案1】:

    这个怎么样?

    doc.css('td.BBB > span.CCC').each do |something|
        something.parent.parent.css('tr > td.EEE,  tr > td.FFF').each do |something_more|
            puts something.content + '-'+ something_more.content
        end
    end
    

    【讨论】:

    猜你喜欢
    • 2010-12-17
    • 2014-09-27
    • 2011-03-27
    • 2016-09-25
    • 2011-03-17
    • 2012-07-16
    • 2014-05-20
    • 2018-01-04
    • 2012-09-21
    相关资源
    最近更新 更多