【发布时间】:2018-09-16 15:22:15
【问题描述】:
我正在尝试建立一个单词“数据库”及其对应的推文标识符。
我的猜测是字典是这样做的最佳选择。
标识符、用户、文本、单词在选项卡上拆分。
Example of input :
1035421931321864192 SchipholWatch RT @vinvanoort: Zo, ik heb getekend Genoeg #geschiphol, hoogste tijd voor een eerlijk en duurzaam #luchtvaartbeleid RT @vinvanoort : Zo , ik heb getekend Genoeg #geschiphol , hoogste tijd voor een eerlijk en duurzaam #luchtvaartbeleid
1035421930541772800 ev4uam2 RT @AfshinEllian1: Kennelijk vinden ze daar aan die gezellige tafel normaal dat steltje barbaren onze grondwettelijke rechten bedreigen. Zouden we ook voor andere buitenwettelijke dreigingen moeten capituleren? Wat een door ons gesubsidieerde domheid! #laatop1 #cartoonwedstrijd RT @AfshinEllian1 : Kennelijk vinden ze daar aan die gezellige tafel normaal dat steltje barbaren onze grondwettelijke rechten bedreigen . Zouden we ook voor andere buitenwettelijke dreigingen moeten capituleren ? Wat een door ons gesubsidieerde domheid ! #laatop1 #cartoonwedstrijd
Example of desired output:
{'exampleword' : ['1035421930541772800', '1235424930545772800']}
当前代码:
def main():
olist = []
worddict = {}
for line in sys.stdin:
i,u,t,w = line.split('\t')
splitword = w.split()
olist.extend(splitword)
for num,name in enumerate(olist):
print("{} [{}]".format(name.strip(), num))
main()
到目前为止,我已经尝试遍历这些行并将 splitword + i(这是推文标识符)添加到字典中,但没有成功。
【问题讨论】:
-
您想要的输出不是有效的 Python 字典(似乎一个键有两个值或一个键没有值)
-
最好将标识符用作字典的键(假设不会重复)并将其示例词用作值列表。
标签: python python-3.x loops dictionary