所有提交的EM系统将被重定向到网上投稿系统.作者被要求将文章直接提交给网上投稿系统各自的日志。

为《外国人大学前培训和社会适应信息与组织环境》用户搜索《理想对话者》的方法

Sergiy Paliy1, YevgeniyBorodavka2, MykolaTsiutsiura3.
  1. 助理教授,计算机科学基础,基辅国立建筑大学,乌克兰基辅
  2. 乌克兰基辅国立建筑与建筑大学信息技术设计与应用数学副教授
  3. 研究生,项目主席管理,基辅国立建筑大学,乌克兰基辅
有关文章载于Pubmed谷歌学者

更多相关文章请访问国际计算机与通信工程创新研究杂志

摘要

在本文中,我们考虑了在外国人大学前培训和社会适应的信息和组织环境设计(IOEUTSAF)中发展“理想对话者”搜索方法的前提条件。提出了用户档案数据库的建立方法和用户档案数据库的建立方法。此外,我们还定义了用于查找用户的属性和状态标准列表。作为主要成果,提出了用户符合性评价的数学方法。

关键字

大学前培训,外国人培训,社会网络,社会适应,寻找“理想对话者”。

介绍

A.上下文建立
参考文献[1]-[3]展示了利用云技术制作IOEUTSAF的原因、权宜性、可能性和基本原则。IOEUTSAF的基本原则之一是组织一个广泛的听众社区,以交流知识和有用的经验。为了让IOEUTSAF社区中众多具有必要知识和经验的用户快速参与进来,提出了IOEUTSAF与社会网络连接的概念模型和方法。
流行社交网络(SN)的活跃用户账户数量从数百万到10亿不等。在众多的用户中很难找到对IOEUTSAF的特定用户有用的人。为了促进这一任务,并使其在自动化/自动模式下解决的可能性,我们建议开发基于推荐系统的搜索«理想对话者»的方法,特别是基于内容过滤和协同过滤的方法。
B.文献综述
根据科学资料研究的结果,我们得出结论,关于推荐系统的发展有很多国内外研究者,包括Daniel Lemire, Anna Maclachlan, Prem Melville, Raymond J. Mooney, RamadassNagarajan, Hennig-Thurau, Thorsten, André Marchand, Paul Marx, DietmarJannach, Markus Zanker, Alexander Felfernig, Gerhard Friedrich, Pravykov A.A., Glibovets M.M, Gorokhovsky s.s., Pick A.A.等[5]-[10]。
在现有的工作中,推荐系统只考虑向用户提供某些资源。推荐系统作为寻找“理想对话者”的技术,应用于大学前培训和外国人社会适应的信息和组织环境中,需要进一步发展。
C.主要目的;
IOEUTSAF的所有用户分为两类:与大学签订学习合同的IOEUTSAF学生,在进行了远程培训和社会适应的初始阶段后,将前往某个假设的国家继续学习(听众);和其他在IOEUTSAF注册并可以访问一定资源的用户(主要是高级课程的外国学生,在指定国家大学就读或就读较早的研究生和博士学生)。与听众相比,这类使用者在这个国家有更丰富的停留和学习经历,与教师和导师相比,他们看到的问题是“从外国人的角度”。通常情况下,用户的建议可能比假想国家的公民的建议更重要,更可取,因为“新鲜的外观”和在相同情况下的实际经验。
这篇文章的目的是开发一种搜索“理想对话者”的方法,这种方法将在数百万用户(包括社交网络,聚集到环境中)中找到对某些听众最有用和最有兴趣的人。

2理论基础

优选地,电子商务中使用的推荐系统,在不明确的表述请求的基础上,为用户提供对某些产品或服务(资源)的一些推荐。在这种情况下,对评级资源历史的分析(由具有“喜欢”和“不喜欢”按钮的用户进行评估)分别针对每个用户进行。因此可以得到三元组的集合,形式为:
(m, n, rm,n)
其中-用户,n -资源,rm,n -评级,由用户m的资源n衍生而来。它的行对应用户,列对应资源。在行和列的交点处,放置了用户给出的资源评级。由于我们有大量的资源和用户,得到的矩阵是相当稀疏的。任务是在现有评级的基础上找到类似的用户,预测但不设置评级,因此预测用户会喜欢哪些未评级的资源。
在我们这里,任务是其他的。为了找到«理想的对话者»,有必要创建一个用户档案数据库。这个数据库可能是解释性的,在搜索查询的情况下,应该找到与给定的最相似的配置文件。
用户简介数据库(DBUP)比以前提到的评级资源(或历史评级)包含用户的人口统计数据,包括:出生日期、居住地、性别、婚姻状况、教育程度、社会地位、继续教育的地方等。
要找到最合适的个人资料数据库应该包含最大数量的记录,因此填充它不仅有意义的IOEUTSAF用户的数据,而且从社交网络接收的数据。
数据库内容概要填充的结构和功能图如图1所示。IOEUTSAF的听众和其他用户正在注册和工作过程中传递问题。通过IOEUTSAF适当的社交网络服务注册到IOEUTSAF的用户,还可以根据IOEUTSAF的请求,通过社交网络的应用程序编程接口(API)传输其帐户信息。IOEUTSAF应用程序安装在社交网络用户中,将用户的账号信息、访问资源、评分等统计信息传输到DBUP(图2),这样就收集了与IOEUTSAF有关的用户数据。雷竞技官网
为了覆盖更广泛的社交网络用户,特别是与IOEUTSAF没有关系的用户,IOEUTSAF的代理也进行了DBUP的填写(图2)。
作为代理,我们指的是某个程序实体,它代表另一个实体(程序或用户)独立运行并执行某些操作[11]。
IOEUTSAF的代理一直在使用他们的搜索机制遍历最大社交网络的用户帐户。对于搜索,我们定义了基本的标准,如:原籍城市和学习地点。学习地点应对应于假设国家的一所大学,反之,应在该国以外。此外,DBUP还包括这些人的“朋友”数据。
有一些公民,他们学习外国语言和文化,并有与外国人交流的愿望。这类社交网络用户可以通过分析«爱好»和«兴趣»属性来确定。如果他们属于相应的社区,可以由IOEUTSAF的版主«手动»添加这样的帐户。
DBUP填充的过程是永久性的,在此过程中,记录的数量正在增加,这将积极地反映在搜索结果上。
所有在DBUP中的人的数据都属于两类:由用户填写的人口统计数据(直接进入IOEUTSAF或某些社交网络),以及用户对某些资源的评分数据。在搜索“理想对话者”时,对部分用户数据采用内容过滤与人口统计学意义相结合的混合过滤方法,对资源评级数据采用协同过滤的混合过滤方法。在本例中,对于总比率,输入每种方法的权重系数。
让我们将一组已在IOE数据库中注册的学生记为s。在特殊情况下,我们有一个数据库,其中包含从不同来源收到的关于学生的所有信息。不同的学生可能会给出不同的信息集——一个学生填写了一些数据字段,而另一个学生没有。集合Sis的每个学生记为si:
图像
我们将从每个学生那里收到的个人信息称为“属性”,并用a表示。因此,我们可以写出一个等式:
图像
但是,另一方面,我们可以通过他的偏好(P)来描述每个学生:
图像
我们建议使用上面提出的两个实施例进行理想的口语搜索。让我们将两个实施例合并为一个:
图像
式(5)将IOE数据库中的每个学生描述为属性和偏好的复数。但正如我们之前所说,在IOE数据库中,我们不可能拥有每个学生的完整信息,所以可能会有一些属性是空的。IOE数据库中没有显示首选项。我们需要从学生在社交网络中的个人资料中提取学生的这些特征。
现在我们考虑如何利用现有的信息找到理想的口语。让我们把某个正在寻找口语的学生记为s0:
图像
首先,我们建议减少理想口语的候选人数量。为此,我们需要选择几个最重要的属性,并用它们来区分值得信任的不合适的学生。作为重要的属性,我们建议使用祖国,语言和大学。
如果学生si的属性与学生s0属性具有相同的值,则将其视为可能的collocutor。但是如果在student中缺少一些属性值,这些属性被认为是匹配的,student仍然被认为是可能的collocutor,并被放在列表(L)中:
图像
我们根据社交网络上的活动进行额外搜索的所选学生的列表。我们在列表中寻找每个学生喜欢或不喜欢的任何项目(照片,电影,团体,名人等),并按照规则(1)将这些分数组合在矩阵M中。这个矩阵并不像之前说的那么稀疏,因为我们通过IOE数据库中的个人信息减少了候选人的数量。但它还是太大了,不适合加工。为了解决这个问题,我们建议对矩阵M使用奇异值分解(SVD):
图像
式中eu - m x m酉矩阵;
Σ - m × n对角矩阵;
VT - nxn的共轭转置的酉矩阵V。
对角矩阵Σ由M的奇异值组成,记为ϭ。一个常见的约定是按降序列出奇异值。在这种情况下,对角矩阵Σ是由m唯一决定的。现在看来,我们只是使问题复杂化并扩大了数据量。但是由于矩阵M有一个低秩r,我们可以减小结果矩阵Σ的大小。我们可以在矩阵Σ中只留下前r个元素,并将其他元素设为0。
比大小的矩阵Σ将r x r,矩阵U - m x r,矩阵V - r x n:
图像
在最坏的情况下,r的最大值等于列表L中学生的数量,并且远低于项目的数量。
矩阵U的行用一组因子ui表示每个学生,矩阵V的列用一组因子vj表示每个项目。之后,我们使用这些因素ui∙vj的点积来预测项目j的学生i评分。结果我们再次得到矩阵m x n,但它不是稀疏的,每个项目都预测了评分。
现在我们可以使用这个可预见的矩阵来计算当前学生相对于其他人的合作排名。为此,我们建议使用Pearson相关系数:
图像
式中,wi,j -学生I与j的相关系数;
Ri,a -学生i对项目a的评分;
Rj,a -学生j对项目a的评价;
Ri -学生i对所有项目的平均评分;
Rj -学生j对所有项目的平均评分。
平均评分可以由一个简单的等式得出:
图像
经过计算,我们得到每个学生i他的合作排名向量,每个学生j。每个排名大于0.8的学生被选为理想合作者。

四。结论

在IOEUTSAF设计中对«理想对话者»搜索方法的开发过程中,我们提出以现有推荐系统的方法为基础并加以改进,即内容过滤方法和协同过滤方法。
为了寻找“理想的对话者”,我们需要创建DBUP。给出了应保存在该数据库中的属性列表。
为了增加用户数量,我们建议使用流行社交网络账户的数据。提出了社交网络用户的选择标准。
介绍了IOEUTSAF和流行社交网络用户的数据采集方法,用于DBUP填充。
提出了用户符合性评价的数学方法。
所描述的方法让我们在IOEUTSAF和社交网络用户中找到“理想的对话者”。

数字一览

图1 图2
图1 图2

参考文献












全球科技峰会