【问题标题】:using the chrome console to select out data使用 chrome 控制台选择数据
【发布时间】:2013-04-23 12:25:27
【问题描述】:

我希望以纯文本形式从此页面 (https://angel.co/finder#AL_claimed=true&AL_LocationTag=1849&render_tags=1) 中提取所有公司。我看到有人使用 Chrome 开发人员工具控制台来执行此操作,并且想知道是否有人可以为我指明正确的方向?

TLDR;如何使用 Chrome 控制台从 URL 中选择和提取一些数据?

【问题讨论】:

    标签: console google-chrome-devtools


    【解决方案1】:

    注意:由于jQuery 在此页面上可用,我将继续使用它。

    首先,我们需要选择我们想要的元素,例如公司名称。这些被保存在 ID 为 startups_content 的列表中,在类 items 的内部元素中,在类 name 的字段中。因此,它们的选择器可能如下所示:

    $('#startups_content .items .name a')
    

    结果,我们会得到一堆 HTMLElements。由于我们想要纯文本,我们需要通过以下方式从这些 HTMLElement 中提取它:

    .map(function(idx, item){ return $(item).text(); }).toArray()
    

    这为我们提供了一组公司名称。但是,让我们用它制作一个纯文本列表:

    .join('\n')
    

    连接上面我们得到的所有步骤:

    $('#startups_content .items .name a').map(function(idx, item){ return $(item).text(); }).toArray().join('\n');
    

    应该在 DevTools 控制台中执行。

    如果您需要一些其他数据,例如公司网址,只需按照与上述相同的步骤进行适当的更改即可。

    【讨论】:

    • 惊人的答案。太感谢了。我继续前进,还取出了加入日期和“简历”(描述“。现在我已经获得了所有数据 - 现在想使用正则表达式将其转换为 CSV 格式,以便我可以将其输入到数据库中。任何提示从哪里开始?
    • 我不确定你最终得到了什么,但如果有 3 个文件(名称、描述、日期),那么只需启动 excel(或 google 电子表格),从每个文件中复制数据并粘贴到电子表格中的不同列,然后只需执行 CSV 导出。
    猜你喜欢
    • 1970-01-01
    • 2013-05-06
    • 1970-01-01
    • 2017-12-07
    • 2017-12-09
    • 1970-01-01
    • 2011-10-26
    • 2012-12-13
    • 1970-01-01
    相关资源
    最近更新 更多