【问题标题】:how to scrape this with Simple HTML DOM [closed]如何用简单的 HTML DOM 刮这个 [关闭]
【发布时间】:2011-09-19 02:23:22
【问题描述】:

我正在尝试使用简单的 html dom 从看起来像这样的文件中提取元素。

  • 该文件有几个看起来相同的表class=sometable
  • 每个表都有几个<tr class=sometr>
  • 然后在每个 tr 中,我有一个带有标题的 th 和一个带有类别的 td。

我要提取的是所有表中所有表行的所有标题class=title 及其对应的类别编号class=category。我已经在$html 中加载了文件。有人能告诉我在那之后我应该找到什么吗?我什至尝试过$collection = $html->find('tr'); 并对集合进行了vardump,但一无所获,所以看起来我选择不正确。

<table class="sometable">
  <tbody>
    <tr class="sometr">
      <th><a class="title">Table 1 Title1</a></th>
      <td class="category" id="categ-113"></td>
      <td class="somename">Table 1 Title 1 name</td>
    </tr>
    <tr></tr>
    <tr></tr>                           
  </tbody>
</table>

<table class="sometable">
</table>

<table class="sometable">
</table>

【问题讨论】:

    标签: php screen-scraping simple-html-dom


    【解决方案1】:

    我已经测试了this 并且可以正常工作

    $tables = $dom->find('table[@class="sometable"]');
    
    foreach($tables as $table)
    {
        $titles = $table->find('a[@class="title"]');
        foreach($titles as $title)
        {
            echo "Link title = " . $title ."<br />";
        }
    
        $categories = $table->find('td[@class="category"]');
        foreach($categories as $category)
        {
            echo "Category id = " . $category->id ."<br />";
        }
    
        $titles2 = $table->find('td[@class="somename"]');
        foreach($titles2 as $title2)
        {
            echo "Title2 = " . $title2 ."<br />";
        }
    
    }
    

    【讨论】:

      猜你喜欢
      • 2021-06-24
      • 1970-01-01
      • 2013-06-08
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2023-03-04
      • 2013-04-22
      • 1970-01-01
      相关资源
      最近更新 更多