【问题标题】:need an idea about text mining for mining data from bulk of files需要有关从大量文件中挖掘数据的文本挖掘的想法
【发布时间】:2012-01-25 10:24:56
【问题描述】:

我是数据挖掘的新手。我正在做我的 B.Tech 最后一年,我最后一年的项目标题是“使用文本挖掘从学生反馈中提取和分析管理学科的教师绩效”。在这里,我们将有许多包含学生反馈的文件,每个学生都有一个文件。我们必须从所有这些文件中检索有用的信息。

谁能建议我如何开始,要使用哪些工具? 要使用哪些技术? 我对JAVA(jse)很熟悉,能用java编程语言实现吗?

问候... Upendra.S

【问题讨论】:

    标签: data-mining text-mining


    【解决方案1】:

    一些想法:

    • 哪些是最常用的词或短语?
    • 哪些词经常同时出现(关联分析)
    • 按学生年级划分的单词/短语频率(排名靠前和排名靠后的学生在他们的教授评论中使用哪些词?)
    • 按教师等级划分的单词/短语频率(哪些单词与学生给教师的分数相关联?)
    • 按教师任期划分的单词/短语频率(哪些单词与新老教授相关?)

    这是我使用 rapidminer 进行文本挖掘的五部分系列:

    http://vancouverdata.blogspot.com/2010/11/text-analytics-with-rapidminer-loading.html

    【讨论】:

      【解决方案2】:

      我相信 Rapidminer 有一个文本挖掘扩展。然后是 JTMT。

      这里也使用搜索功能:

      还可以查看教育数据挖掘社区。他们可能有类似的任务。

      【讨论】:

        【解决方案3】:

        在我看来,您可以浏览这些主题。它帮助了我的一个项目。

        工具 - Matlab TMG tool

        使用的算法 - 潜在语义分析。 (LSA Example)

        数学概念 - 奇异值分解。 (SVD)

        【讨论】:

          猜你喜欢
          • 2011-02-07
          • 1970-01-01
          • 2012-07-01
          • 1970-01-01
          • 2018-04-29
          • 1970-01-01
          • 2013-04-29
          • 2012-03-22
          • 2019-05-05
          相关资源
          最近更新 更多