【问题标题】:File format for meta data of data set数据集元数据的文件格式
【发布时间】:2020-03-11 03:47:20
【问题描述】:

我想了解和比较尽可能多的文件格式,可以存储特征、属性或字段的元数据

属性的元数据可能是:

  • 存储类型:字符串、数字、整数、日期时间等
  • 刻度类型:标称、顺序、间隔、比率等
  • 要解析的日期时间格式:“YYYY-mm-dd_HH:MM:SS”等

例如,ARFF 和 SAV 可以有属性的元数据

如果您能告诉我其他数据格式以便我进行比较,我将不胜感激。

【问题讨论】:

    标签: machine-learning dataset data-mining file-format feature-engineering


    【解决方案1】:

    您需要多上网搜索一下。你错过了一些明显的选择。从 Python pickles 等“滥用”格式开始,到 JSON 和 YAML 等非特定格式,Apache Arrow 等“大数据”格式,再到 HDF 4 和 HDF 5 等科学格式。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2023-03-09
      • 2011-05-31
      • 1970-01-01
      • 1970-01-01
      • 2016-05-20
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多