【发布时间】:2011-07-27 17:58:30
【问题描述】:
我不知道这里是否有人会说(或写)“死语言”拉丁语。但也许你甚至可以在不懂这种语言的情况下帮助我......
我有一个单词数据库(包括名词和动词)。现在我想生成这些名词和动词的所有不同(变形)形式。这样做的最佳策略是什么?
由于拉丁语是一种高度屈折变化的语言,因此有:
有关动词变位(“mandare”)的示例,请参阅此翻译页面:conjugation
我不想手动为所有单词输入所有这些表单。那么如何自动生成它们呢?最好的方法是什么?
- 如何使所有单词变形的复杂规则列表
- 贝叶斯方法
- ...
非常感谢您!
编辑(可能的解决方案?):
我现在发现有一个名为“William Whitaker's Words”的程序。它也会为拉丁词创建屈折变化,所以它正是在做我想做的事。
Wikipedia 说该程序的工作方式如下:“Words 使用一组基于自然前置、in- 和后缀、变格和共轭的规则来确定条目的可能性。因此分析单词结构的方法,不能保证这些单词曾经在拉丁文学或演讲中使用过,即使程序找到了给定单词的可能含义。”
该程序的源代码也可在here 获得。但我真的不明白这是如何工作的。你能帮助我吗?也许这将是我的问题的解决方案...
【问题讨论】:
标签: parsing inflection latin