【发布时间】:2011-11-11 23:41:04
【问题描述】:
我正在尝试开发一种 python 算法来检查一个字符串是否可以是另一个单词的缩写。例如
-
fck与fc kopenhavn匹配,因为它匹配单词的第一个字符。fhk不匹配。 -
fco不应匹配fc kopenhavn,因为没有人会将 FC Kopenhavn 缩写为 FCO。 -
irl与in real life匹配。 -
ifk与ifk goteborg匹配。 -
aik与allmanna idrottskluben匹配。 -
aid与allmanna idrottsklubben匹配。这不是一个真正的团队名称缩写,但我想除非您应用有关瑞典缩写如何形成的领域特定知识,否则很难排除它。 -
manu与manchester united匹配。
很难描述算法的确切规则,但我希望我的例子能说明我所追求的。
更新我在显示匹配字母大写的字符串时犯了一个错误。在实际场景中,所有字母都是小写的,所以并不像检查哪些字母是大写那么简单。
【问题讨论】:
-
所以你想看看字符串是否只匹配那些字符串中的大写字母?如果是这样,请尝试为它编写一些内容:只获取完整内容的大写字母并将它们放在字典中(作为具有完整版本作为值的键),然后查找起来很容易。事实上,你还没有真正问过问题......
-
我能想到的最好的办法是提取所有大写字母,将短字符串转换为大写,然后进行相等测试。
-
半加时赛:ManU 可以被视为对曼联球迷的侮辱,尽管它在非英语国家被广泛用作缩写。
-
我认为这是不可能的,例如您应该如何确定
aik有效,但aid无效?
标签: python string-matching slug abbreviation text-analysis