【问题标题】:make FPE algorithm of DLP in GCP refrain from using a specific set of characters when encoding使 GCP 中 DLP 的 FPE 算法在编码时避免使用特定的字符集
【发布时间】:2022-09-24 06:23:40
【问题描述】:

我试图在 GCP 中使用 DLP 服务的 FPE 算法对 CSV 文件的 1 列进行去标识化。我的 CSV 文件有一个逗号 (,) 作为分隔符。但是在某些行的编码数据中,逗号(,)包含在数据中,这在重新识别数据时会造成麻烦。有没有办法指定 FPE 算法在编码时避免使用特定的字符集?

    标签: csv google-cloud-platform encoding google-cloud-dlp


    【解决方案1】:

    https://github.com/googleapis/googleapis/blob/01d4201e2620da2084d2151522c25cf49dda9da3/google/privacy/dlp/v2/dlp.proto#L852

    如果您使用 ByteContentItem.CSV 将其作为结构化文件进行检查,则转换将应用于单元格值......这将避免逗号陷入调查结果。

    【讨论】:

      猜你喜欢
      • 2012-05-11
      • 2014-03-31
      • 1970-01-01
      • 1970-01-01
      • 2013-03-16
      • 1970-01-01
      • 2021-12-02
      • 1970-01-01
      相关资源
      最近更新 更多