【发布时间】:2017-07-26 20:07:37
【问题描述】:
我想从一个制表符分隔的文件(无标题)创建两个 python3 字典。该文件有 2 列我想命名为 group_id 和gene_id。一个组可能有多个基因,一个基因可以属于多个组。我会用一个简单的例子来演示我想要什么。
group_id gene_id
A a
A b
A c
A d
B a
B c
B e
我想要两本词典:
dict1 = {'A':(a,b,c,d),'B':(a,c,e)}
和
dict2 = {'a':(A,B), 'b':(A), 'c':(A,B), 'd':(A), 'e':(B)}
我想将值存储在元组中以提高速度,因为我的文件是 2.5 GB,我最终会得到稍后必须使用的大字典。
我知道有很多这样的问题,但我无法从那些处理具有键值对的文件中找到答案。
谢谢!
【问题讨论】:
-
当然。您是否尝试过实现这一点?很高兴看到你的代码,看看你走了多远,遇到了什么困难。
-
Pandas 是一个很好的起点。
-
值可以是列表而不是元组吗?
标签: python python-3.x dictionary tuples