【发布时间】:2017-11-13 02:26:54
【问题描述】:
我正在研究影响不同国家/地区不同部门的事件数据库,并希望创建一个表格来记录每个国家/地区的事件率细分。
数据库看起来像这样的atm
Incident Name | Country Affected | Sector Affected
incident_1 | US,TW,CN | Engineering,Media
incident_2 | FR,RU,CN | Government
etc., etc.
我的目标是建立一个看起来像这样的:
Country | Engineering | Media | Government
CN | 3 | 0 | 5
etc.
现在我的方法基本上是使用 if 循环来检查 country 列是否包含特定字符串(例如“CN”),如果返回 True 然后从集合中运行 Counter 以创建初始计数的字典,然后保存。
我的问题是如何将我们扩展到可以在整个数据库中运行的级别,以及如何实际保存 Counter 生成的字典。
【问题讨论】:
-
您介意编辑您的帖子以显示您目前拥有的代码吗?
-
您的数据库是否有可能被更改? (US,Engineering),(TW,Engineering),(CN,Engineering)等都应该是单独的行
标签: python database string list pandas