【问题标题】:Checking words in a file检查文件中的单词
【发布时间】:2019-12-04 23:56:17
【问题描述】:

如果有意义的话,我需要搜索确切的单词并且不包含单词中的单词,我很难过

更新: 尝试使用正则表达式仍然产生类似的结果,使用重新匹配但产生 所有单词都是错误的

不正确单词的文件: dis 是我的拼写检查程序

正确单词的文件: 这是我的拼写检查程序

word = ""
    with open(sys.argv[1],"r") as fh: 
        while True:
            ch=fh.read(1)
            if ch == " " or ch == "\n" or ch == ":" or ch == ".":
                with open(sys.argv[2],"r") as fh2:
                    def check_word(word,fh2):
                        lines = fh2.readlines()
                        for line in lines:
                            x= re.match(word,line)
                            if x:
                                print(word + ": " + "0")
                                #count += 1
                            else:
                                print(word, ": " , "1")
                                #count2 += 1   
                    check_word(word,fh2)
                word = ''
            else:
                word += ch
            if not ch:
                print(word)
                print("End of file")
                print(count)
                print(count2)
                break

【问题讨论】:

  • 建议您使用正则表达式进行单词匹配。会更容易。
  • 我应该使用搜索还是匹配?我使用搜索并给了我相同的结果,当我使用匹配给我不同的结果时,所有单词都被生成为不正确的。更新了上面的代码。
  • 能否分享两个文件中的数据?
  • 用这两个文件更新了帖子。我遇到的问题是拼写这个词。由于我正在传递拼写,它会在拼写这个词中检测到它,所以当它不是时假定它是正确的。

标签: python python-3.x command-line-arguments


【解决方案1】:

对不起,我不明白你想做什么。 根据您的代码,我认为您想获得一个包含单词的列表以及该单词在文件中出现的次数。在您的问题中,我将以下文本用作文件:

“所以它基本上只是在文件中查找与确切字母匹配的任何内容,所以如果我在第一个文件中有单词pumpki,在第二个文件中有南瓜,它会产生结果表明它是正确的或被发现的,甚至虽然这不正确。我需要搜索确切的单词,并且如果这有意义的话,它不包含单词中的单词,我很难过。”

#counting words
from collections import Counter

f = open("single.txt", "r")

word_list = [] #initiate the list

for words in f:
    counting = Counter(words.split(' '))

my_word = 'pumpkin'

for k,v in counting.items():
    if my_word == k:
        #v is the counter
        pair = (k,v)
        word_list.append(pair)

print(word_list)
#[('pumpkin', 1)]

【讨论】:

  • 很抱歉造成混乱,但这不是我的任务。这是一个拼写检查程序。我正在尝试根据两个文件验证单词是否正确,一个文件拼写错误,另一个文件拼写正确
猜你喜欢
  • 1970-01-01
  • 2018-11-30
  • 1970-01-01
  • 2017-10-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2012-11-09
  • 1970-01-01
相关资源
最近更新 更多