关键字 |
数据挖掘、大数据、教育数据挖掘学习,学习分析 |
我的介绍。 |
机器学习的研究已经产生了知识发现和数据挖掘技术发现小说和大量非结构化数据中潜在的有用的信息。这些技术发现数据中的模式,然后建立预测模型概率预测的结果。应用这些模型可以用于计算分析在大型数据集。两个地区的教育是教育中使用大数据的数据挖掘和学习分析。虽然没有硬性的区别这两个领域,他们有不同的研究历史和发展不同的研究领域。一般来说,教育数据挖掘寻找新数据中的模式和发展新的算法和/或新模式,在学习分析已知的预测模型适用于教学系统。 |
二世。教育数据挖掘 |
教育数据挖掘作为一种新兴研究领域与一套计算和心理了解学生学习方法和研究方法[1]。新的计算机支持交互式学习方法和tools-intelligent辅导系统、模拟、游戏数据收集和分析学生打开了机会之门,发现这些数据的模式和趋势,做出新的发现和测试假设学生如何学习。收集的数据来自在线学习系统可以在大量的学生和聚合可以包含很多变量,数据挖掘算法可以探索建立模型。 |
正如早期努力理解网络行为,早期教育数据挖掘涉及矿业网站日志数据[2],但现在更多的集成,仪器和先进的在线学习系统提供更多种类的数据。教育数据挖掘通常强调减少学习可以分析成小的组件,然后受到软件,适应学生[3]。学生学习在线学习系统采集的数据正在探索开发预测模型运用教育数据挖掘分类数据的方法或找关系。这些模型起着关键的作用在构建自适应学习系统中适应性或干预基于模型的预测可以用来改变学生的经验下,甚至推荐学术以外的服务,以支持他们的学习。 |
教育的一个重要而独特的特性数据分层。数据在击键级、答案水平会话水平,学生水平,教室,老师水平,学校级别是嵌套在另一个(4、5)。其他重要特性的时间、顺序和上下文。时间是重要的捕获数据,如练习的长度或时间来学习。序列代表概念的基础上,如何实践和辅导应该是有序的。上下文是重要的解释结果,知道一个模型可能会或可能不会工作。分层的数据挖掘方法和纵向数据建模取得了重要的发展教育数据挖掘。 |
教育数据挖掘研究[6]视图作为他们的研究目标如下: |
1。通过创建学生未来预测学生的学习行为等详细信息模型,结合学生的知识、动机、元认知,和态度; |
2。发现或改善域模型,描述的内容是学习和优化教学序列; |
3所示。研究的影响,可以提供不同的教学支持通过学习软件;和 |
4所示。推进科学知识学习和学习者通过建立计算模型,结合模型的学生,领域,软件的教育学。 |
完成这四个目标,教育数据挖掘研究利用技术方法的五类[7]下面描述。 |
我的预测。需要开发一个模型,可以推断出一个方面的数据(预测变量)的一些组合的其他方面(预测变量)的数据。使用预测的例子包括检测等学生行为当他们游戏系统,参与一下分派的行为,或未能正确回答一个问题,尽管有一个技能。预测模型已被用于理解行为在一个在线学习environment-participation论坛,以实践测试,这样预测这类学生可能会失败。预测显示承诺在发展中域模型,如连接过程或事实的特定序列和最好的实践项目,教他们,和预测和理解学生的教育成果,如成功后期末测验辅导[8]。 |
二世。聚类指发现数据点,自然地组织在一起,可以使用一个完整的数据集分割成类别。集群应用的例子是分组学生基于自己的学习困难和交互模式,如和他们如何使用工具在学习管理系统[9],和分组用户为了推荐类似的用户行为和资源。数据在线学习资源、学生认知采访,帖子在论坛可以分析usingtechniques处理非结构化数据中提取的特征数据,然后聚类结果。聚类可以用在任何领域,包括分类、甚至决定多少协作用户展示基于帖子在论坛[10] |
三世。关系挖掘包括发现变量之间的关系在一个数据集和编码规则,供以后使用。例如,矿产的关系可以确定购买产品网上购物之间的关系[11]。 |
•关联规则挖掘可用于发现学生的错误,共现,将内容与用户类型构建的建议内容,可能是有趣,或更改教学方法[12]。这些技术可用于学生活动联系起来,在学习管理系统或论坛,学生成绩或调查等问题为什么学生使用的实践测试减少超过一个学期的学习。 |
•序列模式挖掘构建规则捕获序列事件的事件之间的联系,例如,发现时间序列,如学生错误之后,寻求帮助。这可能是用来检测事件,如学生回归时犯错误在力学与更复杂的和批判性思维技巧,写作和分析交互在网络论坛。 |
主要教育关系挖掘的应用包括发现学生成绩和课程之间的关联序列和发现教学策略导致或健壮的学习更加有效。后者叫做教学分析是越来越重要,目的是帮助研究人员构建自动化系统,模型有效的教师是如何运作的挖掘他们的教育系统的使用。 |
四、蒸馏人类的判断是一种描述数据的技术方法,使人类能够快速识别或分类数据的特性。这个地区的教育数据挖掘提高机器学习模型,因为人类可以识别模式,或特征,学生的学习行为,学生的行为,或数据包括学生之间的协作。这种方法与可视化数据分析。 |
诉发现与模型技术涉及到使用验证模型的现象(通过预测、聚类或手动知识工程)作为一个组件在进一步分析。学生活动从样本数据是¢地图探索。一个¢探索地图的模型然后第二个模型中使用的学习策略,帮助研究人员研究策略不同的在不同的实验。发现与模型支持发现学生的行为和学生特点或上下文变量之间的关系,分析在各种背景下研究问题,为machine-learned模型和心理的集成建模框架。 |
三世。学习分析 |
学习分析成为研究和应用的定义为一个区域和相关学术分析,动作分析和预测分析。学习分析利用一系列更广泛的学科比教育数据挖掘,将从信息科学和社会学概念和技术,除了计算机科学、统计学、心理学、学习科学。学习与教育数据挖掘,分析一般不强调减少学习为组件,而是寻求理解整个系统和支持人类的决策。学习分析强调测量和数据收集机构需要进行的活动和理解,并侧重于数据的分析和报告。学习与教育数据挖掘,分析一般不会处理新的数据分析计算方法的发展,而是已知地址的应用方法和模型回答重要问题,影响学生的学习和组织学习系统。与教育数据挖掘,它强调systemgenerated和自动反应学生学习分析使人类裁剪的反应,比如通过调整教学内容,与高危学生干预,并提供反馈。 |
学习分析技术方法是多种多样的,从那些用于教育数据挖掘。此外,学习分析可以使用: |
•社会网络分析(例如,教师与学生的关系和交互分析student-to-student和确定断开连接的学生,有影响力的人,等等) |
•社会或一个¢attentionA¢元数据来确定什么是用户参与。 |
与教育数据挖掘,提供一个可视化表示的分析是至关重要的生成可执行的分析;信息通常表示为一个¢dashboardsA¢显示数据在一个易于消化的形式。 |
学习分析的一个关键应用程序监控和预测学生的学习性能和早期发现潜在的问题,这样可以提供干预措施来识别学生的课程或项目失败的风险研究[13]。几个学习分析模型已经开发实时识别学生风险水平来增加学生的成功的可能性。这类系统的例子包括普渡大学的课程信号系统和Moodog系统被使用在课程层面在加州大学圣芭芭拉,在阿拉巴马大学的制度水平。高等教育机构显示增加学习兴趣分析,因为他们面对呼吁更大的透明度和更严格的审查他们的招生和保留实践。 |
数据挖掘在线课程的学生的行为揭示了成功和不成功的学生之间的差异等变量的水平的参与讨论版,发送的邮件数量,数量的测试完成。分析基于这些学生的行为变量可用于反馈回路提供更多的流体和灵活的课程和课程支持立即改变基于实时学习数据的分析。 |
四、教育数据挖掘和学习分析应用程序 |
教育数据挖掘和学习分析研究开始回答关于一个学生知道日益复杂的问题和一个学生是否参与。例如,问题可能关注短期提振性能在阅读一个字说的整体学习这个词,以及视线跟踪机器是否可以检测学生参与学习。研究人员已经尝试新的技术模型构建以及新的学习系统数据显示前景预测学生的结果。前面部分提出了研究的目标和技术用于教育数据挖掘和学习/视觉分析。本节提供了广泛领域的应用程序被发现在实践中,尤其是在新兴公司。这些应用领域从发表的评论和灰色文献和被用于帧采访的业内专家。这些地区代表的大类数据挖掘和分析可以应用于在线活动,特别是当它涉及到在线学习。这与大数据的更一般的区域使用,如医疗、制造、零售[14]。 |
这些应用领域(1)建模的用户知识、用户行为和用户体验;(2)用户分析;(3)建模的关键概念域和建模域的知识组件,(4)和趋势分析。另一个应用程序区域关注如何使用分析适应或个性化用户体验。这些应用领域使用不同来源的数据,和展览,简述这些类别的问题答案和列出数据源,迄今为止已经使用这些应用程序。在本节的其余部分,每个区域中更详细地探讨连同的例子来自工业实践和学术研究。 |
诉的结论 |
处理大数据使用数据挖掘和分析正迅速成为常见的商业部门。工具和技术一旦仅限于研究实验室正在通过前瞻性的产业,尤其是那些最终用户通过在线服务系统。高等教育机构学习分析应用于改善他们所提供的服务和提高成绩和保留等可见的和可衡量的目标。现在,随着进步在自适应学习系统中,可能存在利用反馈回路在个别教师和学生的水平。测量,可见学生学习和评估活动开放学生发展技能的可能性在直接监控自己的学习,看看他们如何努力改善他们的成功。教师获得视图到学生的表现帮助他们适应他们的教学或发起干预辅导的形式,定制任务,等等。自适应学习系统使教育者很快看到他们的适应性和干预措施的有效性,为持续改进提供反馈。研究人员和开发人员可以更迅速地比较版本的设计,产品,和教学和学习方法,使艺术的状态和状态的做法跟上网络的飞速普及和混合学习环境。 |
表乍一看 |
|
表1 |
|
|
引用 |
- 安娜雅,a。R。,和J. G. Boticario. 2009. âÂÂA Data Mining Approach to Reveal Representative Collaboration Indicators in Open Co llaborationFrameworks.â In Educational Data Mining 2009: Proceedings of the 2nd International Conference on Educational Data Mining, edited by T.Barnes, M. Desmarais, C. Romero, and S. Ventura, 210–219.
- Amershi, S。,和C. Conati. 2009. âÂÂCombining Unsupervised and Supervised Classification to Build User Models for Exploratory LearningEnvironments.â Journal of Educational Data Mining 1 (1): 18–71.
- 阿诺德,k . e . 2010。一个¢信号:应用学术分析。EDUCAUSE季度33(1).北京:/季度/ EDUCAUSE /www.educause.edu/EDUCAUSE +
QuarterlyMagazineVolum / SignalsApplyingAcademicAnalyti / 199385
- 贝克,r . s . j . d。,S. M. Gowda, and A. T. Corbett. 2011. âÂÂAutomatically Detecting a Student’s Preparation for Future Learning: Help Use IsKey.â In Proceedings of the 4th International Conference on Educational Data Mining, edited by M. Pechenizkiy, T. Calders, C. Conati, S.Ventura, C. Romero, and J. Stamper, 179–188.
- Blikstein, p . 2011。一个¢使用分析来评估学生的学习行为的编程任务。一个¢学报FirstInternational会议学习分析和知识。纽约:计算机协会,110 - 116。
- 宋,H。,和G. Biswas. 2008. âÂÂMining Student Behavior Models in Learning-by-Teaching Environments.â In Proceedings of the 1stInternational Conference on Educational Data Mining, Montréal, Québec, Canada,127–136.
- 考克,M。,和A. Paramythis. 2011. âÂÂActivity Sequence Modeling and Dynamic Clustering for Personalized E-Learning. Journal of UserModeling and User-Adapted Interaction 21 (1-2): 51–97.
- Koedinger, k . R。,R. Baker, K. Cunningham, A. Skogsholm, B. Leber, and J. Stamper. 2010. âÂÂA Data Repository for the EDM Community:The PSLC DataShop.â In Handbook of Educational Data Mining, edited by C. Romero, S. Ventura, M. Pechenizkiy, and R.S.J.d. Baker. BocaRaton, FL: CRC Press, 43–55.
- 长,p和西门子,g . 2011。一个¢穿透雾:分析在学习和教育。一个¢EDUCAUSE 46 (5)。
- 新媒体联盟。2012。NMC地平线项目高等教育短名单。奥斯汀新MediaConsortium TX:。http://www.nmc.org/news/download地平线-项目- 2012高- ed -短名单。
- 西门子、G。,和R. S. J. d. Baker. 2012. âÂÂLearning Analytics and Educational Data Mining: Towards Communication and Collaboration.â InProceedings of LAK12: 2nd International Conference on Learning Analytics & Knowledge, New York, NY: Association for ComputingMachinery, 252–254.
- Lauria, e . j . M。,和J. Baron. 2011. Mining Sakai to Measure Student Performance: Opportunities and Challenges in Academic Analytics.http://ecc.marist.edu/conf2011 /materials /
LauriaECC2011 % 20矿业% 20酒井法子% 20 % 20测量% 20学生% 20 % 20 - % 20 final.pdf性能
- 罗梅罗c R。,和S. Ventura. 2010. âÂÂEducational Data Mining: A Review of the State of the Art.â IEEE Transactions on Systems, Man andCybernetics, Part C: Applications and Reviews 40 (6): 601–618.
- 艾,J。,M. Chui, B. Brown, J. Bughin, R. Dobbs, C. Roxburgh, and A. H. Byers. 2011. Big Data: The Next Frontier for Innovation,Competition, and Productivity. McKinsey Global Institute.http://www.mckinsey.com/Insights/MGI/Research/
Technology_and_Innovation / Big_data_The_next_frontier_for_innovation。
|