【问题标题】:Scraping - Clean up scrape with non constant dataScraping - 使用非恒定数据清理刮擦
【发布时间】:2019-06-16 04:01:13
【问题描述】:

我正在做一些网页抓取。

我的输出数据在第 1 列:

提交日期:YYYY-MM-DD HH:MM

我只需要YYYY-MM-DD

我已添加此脚本以删除“提交日期:”

var cleanup = function(results) {

  $.each(results, function(){                

   this.values[0] = this.values[0].replace("Submission date: ", "");
        this.values[1] = this.values[1].replace("Case number: ", "");

  });

  return results;                           
};

如何删除 HH:MM? 请记住,数据每次都会改变

【问题讨论】:

  • this.values[0].replace("Submission date: ", "").split(" ")[0]this.values[0].substring(17, 27)this.values[0].split(" ")[2] PS。你的意思是数据会改变?您需要展示一些示例。
  • 投稿日期:2019-01-22 10:55 投稿日期:2019-01-22 10:44 投稿日期:2019-01-22 10:44 投稿日期:2019-01-22 10 :44 投稿日期:2019-01-22 10:38 投稿日期:2019-01-22 10:38 投稿日期:2019-01-22 10:38 投稿日期:2019-01-22 10:38 投稿日期:2019 -01-22 10:38 投稿日期:2019-01-22 10:38 投稿日期:2019-01-22 10:38 投稿日期:2019-01-22 10:38 投稿日期:2019-01-22 10: 38 投稿日期:2019-01-22 10:38 投稿日期:2019-01-22 10:38 投稿日期:2019-01-21 17:06
  • 所以是统一格式。下次只需编辑您的问题。我上面添加的任何代码都可以使用。

标签: javascript scrape dataminer


【解决方案1】:

一种简单的方法可能是在其分隔符处拆分字符串。给定一个像“2019-1-20 12:30”这样的字符串,在分隔符处拆分,在这种情况下是空格:

var value = "2019-1-20 12:30";
var parts = value.split(" "); // ["2019-1-20", "12:30"]
var dateOnly = parts[0];

【讨论】:

    猜你喜欢
    • 2018-04-18
    • 2021-11-07
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-01-09
    • 2021-09-06
    相关资源
    最近更新 更多