【发布时间】:2019-07-21 23:53:45
【问题描述】:
我有一个这样的 csv:
Art Category LEVEL 2 LEVEL 3 LEVEL 4 LEVEL 5 Location
0 PRINTMAKING VISUAL CONTEMPORARY 2D NaN NaN NaN
1 PAINTING VISUAL CONTEMPORARY 2D NaN NaN NaN
2 AERIAL VISUAL CONTEMPORARY 2D PHOTOGRAPHY AERIAL NaN
3 WILDLIFE VISUAL CONTEMPORARY 2D PHOTOGRAPHY WILDLIFE NaN
4 NATURE VISUAL CONTEMPORARY 2D PHOTOGRAPHY NATURE NaN
艺术和类别将在那里,但从 l1 到 l6 的级别可以为空。 我想要达到的效果是这样的:
art: PRINTMAKING
category: VISUAL
tags: [CONTEMPORARY, 2D]
级别基本上是特定艺术的标签,将存储在数组中。
我是 python 新手,到目前为止我已经编写了以下代码。我怎样才能做到这一点。
import pandas as pd
import json
data = pd.read_excel("C:\\Users\\Desktop\\visual.xlsx")
rec = {}
rec['art'] = data['Art']
rec['category'] = data['Category']
rec['tags'] = data['LEVEL 2'] + ',' + data['LEVEL 3'] + ',' + data['LEVEL 4'] + ',' + data['LEVEL 5']
我猜这不是正确的做法。
【问题讨论】:
-
不清楚你在问什么
-
你可以这样理解。每一种艺术都属于一个类别并有标签。标签位于需要存储为数组的列中。
-
如果您显示您的数据框目前的外观以及您的预期输出是什么样的,将会更容易理解
-
你有什么问题?
-
我不知道如何处理当前代码。我已经编辑了这个问题以便更好地理解。