【发布时间】:2013-04-06 16:39:06
【问题描述】:
我有这个代码块,它遍历一个文本文件,逐行抓取它并将其拆分为单独的单词。这一切都很好,但是在我的文本文件中,我有某些以“-”开头和结尾的单词和短语,例如,“-foo-”或“-foo bar-”。现在,它们被拆分为“-foo”和“bar-”的代码。不过,我理解为什么会这样。
我的计划是抓取那些以 '-' 开头和结尾的实例,将它们存储到一个单独的列表中,然后用户将这些短语中的每一个更改为新的内容,然后将它们放回列表中。如果它是两个单独的单词,我如何告诉它抓取某个短语?
def madLibIt(text_file):
listOfWords = [] #creates a word list
for eachLine in text_file: #go through eachLine, and split it into
#seperate words
listOfWords.extend(eachLine.split())
print listOfWords
【问题讨论】:
-
虽然我已经回答了你的问题,但我相信你的想法还是有一些缺陷的。具体来说,
-字符非常常见,使用它作为分隔符可能会导致问题,连字符的单词会发生什么? (如:旋转木马)或者当它被用作句子的一部分时 - 像这样?如果您可以提供有关您的用例、您正在尝试做什么的更多信息,也许有更好的解决方案? -
实际上,我使用的字符是 _ 字符,但最终我的文本变成了斜体,所以我不得不使用 - 代替。
标签: python string list for-loop