【发布时间】:2019-03-16 01:36:02
【问题描述】:
我正在使用 Tensorflow 数据验证从数据中生成统计信息,并推断要在 TFX 中输入的架构。
我没有找到任何指定 NaN 值的选项,例如。 g.,在 pandas 中有一个字段“na_values”,可以在其中指定读取数据时将被视为 NaN 的值。
我查看了整个 TFDV 文档,但没有找到。
tfdv.generate_statistics_from_csv(
data_location,
column_names=None,
delimiter=',',
output_path=None,
stats_options=options.StatsOptions(),
pipeline_options=None
)
options.StatsOptions()是生成统计信息的选项,比如sample_count、sample_rate等等……
对我来说,读取处理缺失值的数据没有意义,将数据保存为 Csv 或 TFRecord 并在导入 TFDV 后生成统计信息。
【问题讨论】:
标签: tensorflow tensorflow-data-validation