ISSN在线(2320 - 9801)打印(2320 - 9798)
跨域的观点挖掘利用社会媒体内容的一本同义词典
自动分类的情绪是很重要的矿业等众多应用意见,意见汇总,上下文广告,和市场分析。通常,情绪分类被建模为培训的问题二元分类器使用评论注释积极或消极的情绪。雷竞技苹果下载然而,在不同的领域,有不同的情绪表达,为每一个可能的域标注语料的兴趣是昂贵的。应用情绪分类器训练使用带安全标签的数据时为特定域分类用户评论的情绪在不同的领域往往导致表现不佳,因为单词出现在火车(源)域可能不会出现在测试(目标)域。雷竞技苹果下载我们提出一个方法来解决这个问题在跨域情绪分类。首先,我们创建一个情绪敏感分布源域和同义词典使用带安全标签的数据时无标号数据为源和目标域。情绪敏感性在同义词典实现合并文档级别情绪标签向量作为测量的基础上下文中单词之间的分布相似。接下来,我们使用同义词典,扩大创建特性向量二进制分类器在训练和测试时间。该方法明显优于许多基线和返回结果与之前类似的提议crossdomain情绪分类方法基准数据集包含亚马逊用户评论为不同类型的产品。雷竞技苹果下载我们进行该方法的一个广泛的实证分析、源域改编,非监督和监管领域适应,和众多的相似性措施创造情绪敏感词库。 Moreover, our comparisons against the SentiWordNet, a lexical resource for word polarity, show that the created sentiment-sensitive thesaurus accurately captures words that express similar sentiments.
N.Manjunathan,