【问题标题】:Getting anchor text from a webpage using xpath within YQL在 YQL 中使用 xpath 从网页获取锚文本
【发布时间】:2010-05-12 20:58:16
【问题描述】:
SELECT content FROM html WHERE url="http://en.wikipedia.org/wiki/List_of_United_States_National_Parks_by_state" AND xpath="//a/text()"

不起作用,而

SELECT * FROM html WHERE url="http://en.wikipedia.org/wiki/List_of_United_States_National_Parks_by_state" AND xpath="//a/text()"

会。

SELECT content FROM html WHERE url="http://en.wikipedia.org/wiki/List_of_United_States_National_Parks_by_state" AND xpath="//a"

也可以,看来 YQL 有错误,还是我遗漏了什么?

【问题讨论】:

  • 那么,问题是什么?
  • 我怎样才能在不出错的情况下获得单独的锚链接? SELECT * 有效(第二次查询),但将所有锚点组合成一个结果。
  • 提供“工作”的查询有什么问题?您是在寻找链接中的文本、URL、两者还是其他?

标签: yql


【解决方案1】:

这是你要找的吗?

SELECT content FROM html WHERE url="http://en.wikipedia.org/wiki/List_of_United_States_National_Parks_by_state" AND xpath="//a"

【讨论】:

    【解决方案2】:
    SELECT href
    FROM html
    WHERE url="http://en.wikipedia.org/wiki/List_of_United_States_National_Parks_by_state"
          AND xpath="//a"
    

    在 YQL 上试用console

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-09-26
      • 2021-12-05
      • 2012-07-08
      相关资源
      最近更新 更多