关键字 |
数据挖掘,大数据,教育数据挖掘,学习,学习分析 |
我的介绍。 |
对机器学习的研究已经产生了用于知识发现或数据挖掘的技术,这些技术可以在大量非结构化数据中发现新颖且可能有用的信息。这些技术在数据中找到模式,然后建立预测模型,概率地预测结果。这些模型的应用程序可以用于大型数据集的计算分析。教育数据挖掘和学习分析是大数据在教育中应用的两个特定领域。虽然这两个领域之间没有严格的区分,但它们的研究历史有所不同,并正在发展成为不同的研究领域。一般来说,教育数据挖掘在数据中寻找新的模式,并开发新的算法和/或新模型,而学习分析则在教学系统中应用已知的预测模型。 |
2教育数据挖掘 |
教育数据挖掘正在成为一个研究领域,它具有一套计算和心理学方法,以及理解学生如何学习的研究方法。新的计算机支持的交互式学习方法和工具——智能辅导系统、模拟和游戏——为收集和分析学生数据、发现这些数据中的模式和趋势、做出新发现和检验关于学生学习方式的假设提供了机会。从在线学习系统收集的数据可以在大量学生中聚合,并且可以包含许多变量,数据挖掘算法可以探索用于模型构建的变量。 |
就像早期理解在线行为的努力一样,教育数据挖掘的早期努力涉及挖掘网站日志数据[2],但现在更加集成、仪器化和复杂的在线学习系统提供了更多类型的数据。教育数据挖掘通常强调将学习简化为可以分析的小组件,然后由适合学生的软件进行影响。在线学习系统收集的学生学习数据正在被探索,通过应用分类数据或查找关系的教育数据挖掘方法来开发预测模型。这些模型在构建适应性学习系统中发挥着关键作用,在该系统中,基于模型预测的适应或干预可以用来改变学生接下来的体验,甚至可以推荐外部学术服务来支持他们的学习。 |
教育数据的一个重要而独特的特征是它们是分层的。击键级别、回答级别、会话级别、学生级别、教室级别、教师级别和学校级别的数据相互嵌套[4,5]。其他重要的特征是时间、顺序和上下文。时间对于获取数据很重要,比如练习时间的长度或学习时间。顺序表示概念如何建立在另一个概念上,以及实践和辅导应该如何排序。背景对于解释结果和了解模型在哪里可能工作或不工作很重要。层次数据挖掘和纵向数据建模方法是教育数据挖掘的重要发展。 |
教育数据挖掘研究者[6]认为以下是他们的研究目标: |
1.通过创建包含学生知识、动机、元认知和态度等详细信息的学生模型,预测学生未来的学习行为; |
2.发现或改进表征要学习内容的领域模型和最佳教学序列; |
3.研究学习软件所能提供的不同类型教学支持的效果;而且 |
4.通过构建包含学生模型、领域模型和软件教学法的计算模型,推进关于学习和学习者的科学知识。 |
为了实现这四个目标,教育数据挖掘研究使用了以下五类技术方法。 |
我的预测。需要开发一个模型,该模型可以从数据的其他方面(预测变量)的一些组合中推断出数据的单个方面(预测变量)。使用预测的例子包括检测学生的行为,比如当他们在游戏系统时,从事任务外的行为,或者尽管有技能却不能正确回答问题。预测模型已被用于了解在线学习环境中的哪些行为——参与论坛讨论、参加实践测试等——将预测哪些学生可能不及格。预测在开发领域模型方面显示出前景,例如将程序或事实与最适合教授它们的特定顺序和数量的练习项目联系起来,以及预测和理解学生的教育结果,例如在辅导[8]后的后测成功。 |
2聚类指的是寻找自然分组在一起的数据点,并可用于将整个数据集划分为类别。聚类应用程序的例子是根据学生的学习困难和交互模式对他们进行分组,比如他们在学习管理系统[9]中使用工具的方式和程度,以及为向类似用户推荐操作和资源而对用户进行分组。在线学习资源、学生认知访谈和论坛帖子等各种各样的数据都可以使用非结构化数据的技术进行分析,以提取数据的特征,然后对结果进行聚类。聚类可以用于任何涉及分类的领域,甚至可以确定用户根据论坛[10]上的帖子展示了多少协作 |
3关系挖掘涉及发现数据集中变量之间的关系,并将它们编码为规则以供以后使用。例如,关系挖掘可以识别在网上购物[11]中购买的产品之间的关系。 |
•关联规则挖掘可用于发现同时发生的学生错误,将内容与用户类型相关联,以建立可能有趣的内容的建议,或用于改变教学方法[12]。这些技术可用于在学习管理系统或论坛中将学生活动与学生成绩联系起来,或用于调查诸如为什么学生在一学期的学习中练习测试的使用减少等问题。 |
•顺序模式挖掘构建规则,捕捉连续事件发生之间的联系,例如,查找时间序列,例如学生错误之后寻求帮助。这可以用来检测事件,比如学生在使用更复杂和批判性思维技巧写作时,在力学上犯了错误,并分析在线论坛上的互动。 |
关系挖掘的主要教育应用包括发现学生表现和课程序列之间的关联,以及发现哪种教学策略会导致更有效或更强大的学习。后一个领域被称为教学分析,它越来越重要,旨在帮助研究人员建立自动化系统,通过挖掘教师对教育系统的使用来模拟他们如何有效地操作。 |
四、蒸馏对于人类来说,判断是一种技术,它涉及以一种使人类能够快速识别或分类数据特征的方式描述数据。这一教育数据挖掘领域改进了机器学习模型,因为人类可以识别学生学习行为、学生行为或涉及学生之间合作的数据中的模式或特征。这种方法与可视化数据分析重叠。 |
v.模型发现是一种技术,涉及使用一个经过验证的现象模型(通过预测、聚类或人工知识工程开发)作为进一步分析的组件。从数据中识别出的一个样本学生活动是Ã①Â′Â①地图探测。â ' Â:在第二个学习策略模型中使用地图探测模型,帮助研究人员研究策略在不同的实验状态下是如何变化的。模型发现支持发现学生行为和学生特征或上下文变量之间的关系,在各种各样的背景下分析研究问题,并将心理测量建模框架集成到机器学习模型中。 |
3学习分析 |
学习分析被定义为研究和应用领域,与学术分析、行动分析和预测分析相关。学习分析借鉴了比教育数据挖掘更广泛的学术学科,除了计算机科学、统计学、心理学和学习科学之外,还结合了信息科学和社会学的概念和技术。与教育数据挖掘不同,学习分析通常不强调将学习分解为组件,而是寻求理解整个系统并支持人类决策。学习分析强调测量和数据收集作为机构需要进行和理解的活动,并侧重于数据的分析和报告。与教育数据挖掘不同,学习分析通常不是针对数据分析的新计算方法的开发,而是针对已知方法和模型的应用,以回答影响学生学习和组织学习系统的重要问题。教育数据挖掘强调系统生成和自动化对学生的响应,而学习分析则不同,它可以通过调整教学内容、干预有风险的学生以及提供反馈来实现人为的响应定制。 |
学习分析中使用的技术方法多种多样,并借鉴了教育数据挖掘中使用的技术方法。此外,学习分析可以采用: |
•社会网络分析(例如,分析学生与学生、学生与教师的关系和互动,以确定不相关的学生、有影响力的人等)和 |
•Social或âÂ′ attentionâÂ′Â元数据,以确定用户在从事什么。 |
与教育数据挖掘一样,提供分析的可视化表示对于生成可操作的分析至关重要;信息通常表示为âÂ′ dashboardsâÂ′Â,以易于理解的形式显示数据。 |
学习分析的一个关键应用是监测和预测学生的学习表现,并尽早发现潜在的问题,以便提供干预措施,以识别有可能不及格的学生。已经开发了几种学习分析模型来实时识别学生的风险水平,以增加学生成功的可能性。此类系统的例子包括普渡大学的课程信号系统和加州大学圣巴巴拉分校在课程层面使用的Moodog系统,以及阿拉巴马大学在机构层面使用的Moodog系统。高等教育机构对学习分析表现出越来越大的兴趣,因为它们面临着要求提高透明度、加强对招生和留住学生做法审查的呼声。 |
对在线课程中学生行为的数据挖掘揭示了成功学生和不成功学生在讨论区参与程度、发送电子邮件的数量和完成测验的数量等变量方面的差异。基于这些学生行为变量的分析可用于反馈循环,以提供更流畅和灵活的课程,并支持根据实时学习数据的分析立即更改课程。 |
四、教育数据挖掘和学习分析应用 |
教育数据挖掘和学习分析研究开始回答越来越复杂的问题,比如学生知道什么,学生是否参与其中。例如,问题可能涉及阅读一个单词的短期提高对该单词的整体学习有什么影响,以及目光跟踪机制是否可以学会检测学生的参与度。研究人员已经尝试了建立模型的新技术,也尝试了新型学习系统数据,这些数据显示出了预测学生成绩的希望。前几节介绍了用于教育数据挖掘和学习/视觉分析的研究目标和技术。本节介绍在实践中发现的广泛应用领域,特别是在新兴公司中。这些应用领域是从已发表文献和灰色文献的回顾中识别出来的,并用于与行业专家的访谈。这些领域代表了数据挖掘和分析可以应用于在线活动的广泛类别,特别是与在线学习相关的领域。这与更普遍的大数据使用领域形成对比,如医疗保健、制造业和零售业。 |
这些应用领域是(1)用户知识、用户行为和用户体验的建模;(2)用户分析;(3)领域关键概念建模和领域知识构件建模;(4)趋势分析。另一个应用领域涉及如何使用分析来适应或个性化用户体验。这些应用程序领域中的每一个都使用不同的数据源,Exhibit简要描述了这些类别回答的问题,并列出了迄今为止在这些应用程序中使用的数据源。在本节的其余部分中,每个领域都将通过来自行业实践和学术研究的示例进行更详细的探索。 |
诉的结论 |
使用数据挖掘和分析来处理大数据在商业领域正迅速变得普遍。曾经局限于研究实验室的工具和技术正在被前瞻性行业所采用,最显著的是那些通过在线系统为最终用户服务的行业。高等教育机构正在应用学习分析来改善他们提供的服务,并提高分数和保留率等可见和可衡量的目标。现在,随着自适应学习系统的进步,在教师和学生个人层面上利用反馈循环的力量是有可能的。衡量学生的学习和评估活动并使之可见,这为学生发展监督自己学习的技能提供了可能,并直接看到他们的努力如何提高他们的成功。教师可以了解学生的表现,从而帮助他们适应教学或以辅导、量身定制的作业等形式进行干预。适应性学习系统使教育工作者能够迅速看到他们的适应和干预的有效性,为持续改进提供反馈。研究人员和开发人员可以更快速地比较设计、产品和教学方法的版本,使艺术状态和实践状态跟上采用在线和混合学习环境的快速步伐。 |
表格一览 |
|
表1 |
|
|
参考文献 |
- 阿纳亚,A. R.和J. G.博提卡里奥,2009。ÃⅱÂ′Â一种数据挖掘方法,用于揭示开放协作框架中具有代表性的协作指标。â ' Â, In education Data Mining 2009:第二届教育数据挖掘国际会议论文集,由t.b nbarnes, M. Desmarais, C. Romero和S. Ventura编辑,210-219。
- 阿默希,S.和C.科纳提,2009。âÂ′Â结合无监督分类和有监督分类,构建探索性学习环境的用户模型。ÃⅱÂ′Â教育数据挖掘1(1):18-71。
- 阿诺德,K. E. 2010。ÃⅱÂ′Â 3信号:应用学术分析。EDUCAUSE季刊33 (1).http://www.educause.edu/EDUCAUSE+Quarterly/EDUCAUSE
QuarterlyMagazineVolum / SignalsApplyingAcademicAnalyti / 199385
- R. S. J. d.贝克,S. M. Gowda, A. T. Corbett. 2011。ÃⅱÂ′ 3 .自动检测学生对未来学习的准备情况:帮助使用IsKey。â ' Â(第四届教育数据挖掘国际会议论文集,由M. Pechenizkiy, T. Calders, C. Conati, S.Ventura, C. Romero和J. Stamper编辑,179-188。
- 布里克斯坦,P. 2011。â ' Â使用学习分析来评估学生在开放式编程任务中的行为。ÃⅱÂ′Â第一届学习分析与知识国际会议论文集。纽约,纽约州:计算机协会,110-116。
- 郑,H.和G.比斯瓦斯,2008。ÃⅱÂ′Â挖掘以教为本环境下的学生行为模型。ÃⅱÂ′Â,第1届教育数据挖掘国际会议论文集,Montréal, Québec,加拿大,127-136。
- Köck, M.和A. Paramythis. 2011。â ' Â面向个性化电子学习的活动序列建模和动态聚类。用户建模与自适应交互研究21(1-2):51-97。
- Koedinger, K. R. Baker, K. Cunningham, A. Skogsholm, B. Leber, J. Stamper, 2010。â ' Â为EDM社区提供数据存储库:PSLC数据跳。â ' Â,载于C. Romero, S. Ventura, M. Pechenizkiy, R.S.J.d. Baker主编的《教育数据挖掘手册》。波卡拉顿,佛罗里达:CRC出版社,43-55。
- 王晓明,王晓明,王晓明。2011。â '  -穿透迷雾:学习与教育中的分析。ÃⅰÂ′Â教育评论46(5)。
- 《新媒体联盟》2012。NMC地平线项目高等教育入围名单。德克萨斯州奥斯汀:新媒体联盟。http://www.nmc.org/news/download地平线-项目- 2012高- ed -短名单。
- 西门子,G.和R. S. J. d.贝克。2012。â ' Â学习分析和教育数据挖掘:面向交流和协作。â ' Â, LAK12:第二届学习分析与知识国际会议论文集,纽约,NY:计算机协会,252-254。
- Lauría, E. J. M.和J.巴伦。2011。挖掘酒井来衡量学生的表现:学术分析中的机遇和挑战。http://ecc.marist.edu/conf2011 /materials /
LauriaECC2011-%20Mining%20Sakai%20到%20 Measure %20 student %20 performance %20-%20final.pdf
- 罗梅罗。C. R.和S.文图拉。2010。ÃⅱÂ′Â教育数据挖掘:研究现状综述。â ' Â: IEEE系统,人与控制论,C部分:应用与评论40(6):601-618。雷竞技苹果下载
- 马尼卡,J., M. Chui, B. Brown, J. Bughin, R. Dobbs, C. Roxburgh和A. H. Byers, 2011。大数据:创新、竞争和生产力的下一个前沿。麦肯锡全球研究所。http://www.mckinsey.com/Insights/MGI/Research/
Technology_and_Innovation / Big_data_The_next_frontier_for_innovation。
|