【发布时间】:2014-03-27 13:22:39
【问题描述】:
如here 所述,我使用 Java 版本的 Wordnet::similarity。
这是服务器端代码。我收到一个包含两个元素的列表(即两个句子) 然后计算这两个句子的相似度矩阵
String wordNetDirectory = System.getenv("WNHOME");
JWS ws = new JWS(wordNetDirectory,"3.0");
Resnik res = ws.getResnik();
while(true) {
try {
Socket clientSocket = serverSocket.accept();
System.out.println("Socket Established...");
ObjectOutputStream outToClient = new ObjectOutputStream(clientSocket.getOutputStream());
ObjectInputStream inFromClient = new ObjectInputStream(clientSocket.getInputStream());
List<List<String>> sents;
sents = (List<List<String>>) inFromClient.readObject();
System.out.println("recieved");
List<String> s1 = sents.get(0);
List<String> s2 = sents.get(1);
Double sum = 0.0;
for(String w1 : s1) {
for(String w2 : s2) {
if(w1.equals(w2)) sum += 1;
else sum += res.max(w1, w2, "n"); // <- Server.java:54
}
}
sum /= (s1.size() * s2.size());
outToClient.writeObject(sum);
System.out.println("wrote " + sum);
} catch (IOException e) {
} catch (ClassNotFoundException e) {
}
}
客户端以串行方式向服务器查询句子相似度(即在收到前一对的相似度分数后发送另一个请求)
这是我在服务器端得到的输出
Socket Established...
recieved
wrote 0.111357828694864
Socket Established...
Exception in thread "main" java.lang.IllegalArgumentException
at edu.mit.jwi.item.IndexWordID.<init>(IndexWordID.java:62)
at edu.mit.jwi.CachingDictionary.getIndexWord(CachingDictionary.java:173)
at edu.sussex.nlp.jws.Resnik.res(Resnik.java:133)
at edu.sussex.nlp.jws.Resnik.max(Resnik.java:313)
at Server.start(Server.java:54)
at Main.main(Main.java:7)
我不明白为什么在第二次建立连接时会崩溃。
【问题讨论】:
-
据我所知,这可能是因为
w1或w2为空或全是空格或没有出现在wordnet 单词列表中。您可以更改您输入的字符串尝试一下。
标签: java similarity wordnet