【发布时间】:2015-09-07 08:18:42
【问题描述】:
我想创建一个表格,显示某些单词在 3 个文本中的频率,而文本是列,单词是行。
我想在表格中查看哪个单词在哪个文本中出现的频率。
这些是我的文字和文字:
texts = [text1, text2, text3]
words = ['blood', 'young', 'mercy', 'woman', 'man', 'fear', 'night', 'happiness', 'heart', 'horse']
为了创建条件频率分布,我想创建一个元组列表,看起来应该像 lot = [('text1', 'blood'), ('text1', 'young'), ... ( 'text2', '血'), ...)
我试图创造很多这样的:
lot = [(words, texte)
for word in words
for text in texts]
而不是 lot = ('text1', 'blood') etc. 而不是 'text1' 是列表中的整个文本。
如何创建用于条件频率分布函数的元组列表?
【问题讨论】:
-
不确定我是否完全理解您想要的,但这可能会有所帮助stackoverflow.com/questions/30970342/…
标签: python tuples frequency-distribution