所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

热门话题在社交网络感知

Kayalvizhi P1,Anoor Selvi C2
  1. 打开学生,计算机科学与工程系,载量工程学院,Karur,泰米尔纳德邦,印度
  2. 计算机科学与工程系助理教授,来对比工程学院,Karur,泰米尔纳德邦,印度
相关文章Pubmed,谷歌学者

访问更多的相关文章国际期刊的创新在计算机和通信工程的研究

文摘

社交网络已经成为一个非常大的网络,很多人讨论热趋势,事件和日常活动与他们的朋友,他们认为是重要的家庭和许多未知的人。与媒体如报纸、电视社交网络传播的最新消息以非常快速的方式,原来说话的人通过网络传播。该模型是识别的热点话题讨论的社交网络。前面的方法发现在社交网络中的热门话题有一些局限性像模型的性能较低,系统检测误判率高的话题。提出模型的文章由人民共享社会网络与朋友们转发的帖子。特定的职位由很多人转发和不规则转发自然会被监控和使用变化点检测技术和比较的帖子的内容对热门话题的看法。

关键字

社交网络,话题检测、变化点检测

我的介绍。

人与人之间的沟通是每天增加与他人通过许多方面沟通的媒体如手机、互联网新闻频道,报纸等等。可能是一个热门话题讨论的话题或个人今天的活动。在这项工作中,我们提出了一个概率模型可以捕捉用户的正常分享行为。通过社交网络的共享信息包括创建链接的数量,同时分享每发布和共享用户发生的频率。然后这个模型预测未来用户的行为。使用该概率模型,我们可以定量地衡量一篇文章的新颖性或可能影响反映在共享用户的行为。前面的方法基于链接异常检测和主题跟踪在社交网络可能会有一些缺点。可以避免在该模型考虑到分享的新闻和话题的内容也是共享的帖子是否包含文本消息或图像分析等。

二世。相关工作

在[1]作者只有提及行为的用户使用。通过使用顺序变化点检测和破裂新兴主题确定检测方法。这种技术可以检测改变聚合的统计依赖结构时间序列异常分数,和确定主题出现的地方。基于链接的缺陷检测是异常检测的质量低于其他系统,这种方法是不处理社会流实时应用程序。这个系统给较低的准确率。较低的时间复杂度率系统的最高精度。在[2]中基于关键字主题检测使用关键字分析[2]用户话题检测与跟踪(TDT),这种方法可能遭受困惑由于被认为是为分析文本。可能用不同的语言和文本意义的词可能不同于一个用户的角度到另一个用户的角度。缺点是在线检测还不能可靠地执行。大量工作需要错误减少到可控的数字。
该模型通过分析消息的内容可能是文本、图像或视频和计算发现的异常分数序列的分数在分享文章生成。社交网络的数据集是通过社交网络Facebook API如Facebook API。使用个人独特的ID生成的《社交网络》中,用户参与共享的名称的帖子和文章的内容是利用一些时间。离群值分数计算,所有用户的总和也分享帖子。从分数的变化点检测,检测完成。消息使用语义信息分析的内容没有任何延迟完成热门话题。

四、实现

拟议的工作描述与以下系统设计包含架构图和系统模块。
答:系统设计
 The 数据 集 使用 API 从 社交 网络 获得
 The 正常 用户 的 共享 模式 进行 了 分析
 The 预测 分享 的 主题 是 使用 Change Point Detection
 The 信息 共享 的 内容 进行 了 分析
b .系统模块
该模型通过分析这帖子被很多人转发他们的许多朋友。如果某一篇文章变得异常分数(异常),那么其内容使用WordNet工具分析了短信和图片和视频信息和未来工作可以通过提取图像特征,颜色,纹理等同样可以做视频和消息的内容可以分析。该模型具有以下模块。
1。培训阶段
2。变化点检测
3所示。分析文章的内容。
1。培训阶段
该模型的第一步是训练阶段。在训练阶段过去行为的用户被认为是与他们的朋友分享的帖子从社交网络中提取数据集使用社交网络API来分析用户的转发行为。这里数量在帖子中提到的用户k和IDs(用户在帖子中提到的名字)是作为诉的用户数量在这里提到的职位是有限的内部几何分布。与k V,我们计算联合概率分布来预测每个用户转发列表中提到的概率。
图像(1)
2。顺序打折规范化最大似然-变化点检测
顺序的打折规范化最大似然编码方法[5]是用来发现变化点的异常分数序列的所有帖子,这个过程是通过两层的过程。在第一层,从集合中聚合的异常分数的计算在特定时期(2),检测到异常值通过使用密度函数。在第二层的异常值检测到第一层是再次使用变化点检测。
让xj - 1= {x1,…,xj-1} be the aggregated anomaly score from time period 1 to j-1. The outlier is detected using the density function,
图像(2)
最后使用动态阈值优化算法,计算变化点(5)转换为二进制报警。它是提出动态调整阈值在很长一段时间。
为一个变量x = x (t)在离散时间序列x = {xt | t = 0, 1, ....
图像(3)
这里n是窗口大小。t1和t2移动平均线的区别:
移动平均线(t1, t2) = EMA (t1)——EMA (t2) (4)
直方图给出了移动平均线之间的差异,这种差异使破裂的离群值的分数。
3所示。分析文章的内容
确定变更后的聚合得分后使用以上两种技术的发布可以确认为动态发布的热门话题,但文章的内容应该分析自异常分数计算仅基于转发时生成的链接。文章的内容不被认为是到目前为止确认的动态主题。确认动态主题我们还需要分析文章的内容。如果帖子的内容是短信就可以使用WordNet分析工具[6]。WordNet数据库是一个词汇对英语的名词、动词、形容词分组同义词集称为同义词集。单词是根据词汇的同义词集和概念关系有关。它是通过语义同义词集的连接关系。WordNet单词之间的相似性可以确定,这可以通过使用措施之间的距离的算法语言和形式WordNet图结构通过计算同义词集之间的边的数量。分析文章的内容后,进行动态的文章主题可以被识别。

诉的结论

拟议的工作是检测动态的话题,讨论了《社交网络》中,通过考虑过去的帖子,讨论了在当前职位和预测未来行为的用户。与训练集的异常分数计算当前邮政和用户的邮政和聚合的异常分数计算。使用变化点检测,检测变化点检测到帖子的转发行为和消息的内容分析检查是否相同的主题是讨论在所有变化点进行了分析。动态主题是完成预计检测前的主题传统媒体发现热门话题。

引用




全球技术峰会