【发布时间】:2014-06-07 12:45:39
【问题描述】:
我有这个代码来导入文件 .mallet:
File f=new File("/home/test/file.mallet");
InstanceList t=InstanceList.load(f);
但如果我想手动切换每个实例,我该怎么做? 我试过这个:
String str="Test for mallet.";
InstanceList t=new InstanceList();
t.add(new Instance(str,"test","test",null));
但它给了我一个错误!
编辑
我试过了,它似乎可以处理字符串数组:
ArrayList<String> aa =ArrayList<Pipe>();
aa.add("Test string 1.");
aa.add("Test string 2.");
String[] ob1=new String[aa.size];
ob1=aa.toArray(ob1);
ArrayList<Pipe> pipeList=ArrayList<Pipe>();
pipeList.add(new CharSequenceLowerCase());
//....
pipeList.add(new TokenSequence2FeatureSequence());
InstanceList training=new InstanceList(new SerialPipes(pipeList))
training.addThruPipe(new StringArrayIterator(ob1));
【问题讨论】:
-
我不明白你的问题
-
如果你想像第二个例子那样传递一个字符串,通常它被传递到一个文件 .mallet 进行主题建模?
-
我会发布你的版本作为答案。
标签: java topic-modeling mallet