【问题标题】:Dataset for emotion classification on social media社交媒体情感分类数据集
【发布时间】:2012-10-29 17:54:54
【问题描述】:

我想对文本进行情感分类(来自社交媒体的帖子,例如推文、Facebook 墙贴、youtube cmets 等......)。虽然我找不到带有注释数据的好的数据集。我正在寻找的不仅仅是带有正面和负面注释的数据。我正在寻找具有多种情绪的数据集。这可以是离散值(ekman 6 基本情绪)或连续值(唤醒效价模型)。有谁知道我在哪里可以得到这样的数据集,这可以来自 twitter、Facebook、Myspace ......只要它来自社交网络

【问题讨论】:

    标签: text machine-learning social-networking


    【解决方案1】:

    嗯,我认为更好的名称(或者,更常用的)是情感分析(情感分类)——对吗?我不确定社交媒体是否确实提供了他们的私人数据(也许是其中的一部分)。不管怎样,我找到了这篇论文:

    http://www.cs.cornell.edu/home/llee/papers/sentiment.pdf

    他们正在处理数据:来自https://groups.google.com/forum/?fromgroups#!aboutgroup/rec.arts.movies.reviewshttp://www.cs.cornell.edu/people/pabo/movie-review-data/

    它适合你吗?基本上,找到合适的数据通常是 ML 中的一个大问题。通常需要自己构建(我的意思是手动对其中的一部分进行分类,然后应用一些聚类或半监督学习)

    如果您在网络上找不到任何合适的内容,我会尝试联系一些撰写与您的研究类似的文章的作者。也许他们已经创建了适合您的数据集......

    【讨论】:

    • 情绪分析通常是确定文本是正面还是负面,这与我正在寻找的内容不同。虽然我通过联系作者找到了我想要的东西。
    • @Ojtwist:你写道:“我正在寻找一个有多种情绪的数据集。”我认为它仍然是分类(甚至一个示例有多个标签)
    • 你能把教授给你的数据集给我吗?因为我需要它。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2013-03-10
    • 2014-10-12
    • 2015-03-21
    • 2012-08-19
    • 1970-01-01
    相关资源
    最近更新 更多