【问题标题】:Text transformation - model training in Python文本转换 - Python 中的模型训练
【发布时间】:2018-01-26 04:58:37
【问题描述】:

我有一个源数据文件(地区、产品、月-年、销售额)并希望通过修改“地区”ID 来转换此数据。

源数据

US, prius, 10-2017, 100000.00
US, leaf, 10-2017, 25000.00
UK, prius, 10-2017, 65000.00

目标数据

NA-US, prius, 10-2017, 100000.00    
NA-US, leaf, 10-2017, 25000.00
EU-UK, prius, 10-2017, 65000.00

我正在改变美国 -> NA-US 和 UK -> EU-UK

我不想维护映射表,训练模型和转换 ID 的方法是什么?假设源或目标中不会有新的“区域”ID。

【问题讨论】:

  • 您能告诉我们您是如何存储数据的吗?它是一个类对象、一个数组、一个列表、一个 csv...?
  • 这是一个csv文件

标签: python transformation unsupervised-learning


【解决方案1】:

我认为最简单的解决方案是使用正则表达式。

your_csv_data.replace("^US,", "NA-US,")
your_csv_data.replace("^UK,", "EU-UK,")

如果您只需要匹配这两种情况,正则表达式就足够简单了。

【讨论】:

猜你喜欢
  • 2021-04-01
  • 2017-08-19
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2021-04-26
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多