关键字 |
主观答案,预处理,贴标签,解析树,评分系统,推理系统,知识表示系统,图形表示,相似度测量,主观评价,词网 |
介绍 |
对于不断增长的人口,政府努力提供良好的教育系统,适当的饮用水和食物,以及其他设施,以改善人民的生活。 |
对于像印度这样的国家,不断增长的人口和落后的基础设施阻碍了高质量的教育体系。在北方邦参加董事会考试的学生数量[1]。可以想象,评估答案副本的数量给教育系统和教师带来了多大的压力。此外,根据2012年年度教育状况报告(ASER)的数字[2],6-14岁的农村儿童中有96.5%入学。这是第四次年度调查报告显示入学率超过96%。农村15-16岁儿童入学率达到83%。然而,展望未来,印度将需要更多地关注质量。高等教育的总入学率已经超过了20%(根据安永2013年1月在教育新闻/minglebox.com上引用的报告)。根据全印度技术教育委员会(AICTE)发布的最新(2013年)报告,全国有超过3524所文凭和文凭后教育机构,每年招收人数超过120万。AICTE还报告称,印度有3495所授予学位的工程学院,年招生能力超过176万,实际招生人数超过120万。管理教育能力超过38.5万,计算机科学研究生学位名额超过10万。 Pharmacy slots reached over 121,000.Total annual intake capacity for technical diplomas and degrees exceeded 3.4 million in 2012. According to the University Grants Commission (UGC) total enrollment in Science, Medicine, Agriculture and Engineering crossed 6.5 million in 2010. Charu Sudan Kasturi reported in the Hindustan Times (New Delhi, January 10, 2011) that the number of women choosing engineering has more than doubled since 2001.We propose an Approach to Evaluate Subjective Questions for Online Examination System. |
相关工作 |
近年来,我们看到许多政府和半政府考试都在网上进行,例如IBPS通用笔试(CWE)。这个系统或任何其他这样的系统在节省资源方面都有优势。然而,我们注意到这些系统只适用于多项选择题,并没有规定将这些系统扩展到主观问题。我们研究了一些在董事会考试、大学考试学生主观答题时不能使用这些系统的问题,这些问题如下: |
•来自不同教育背景的学生在语法错误、形成正确完整的句子等方面存在困难。 |
•自然语言具有丰富的可表达性;因此,相同的意思可以用不同的形式表达,使用不同的词语。 |
•同样地,在评估同一个问题的答案时,不同的老师可能会有不同的看法,例如:生物(生物总是充满例外) |
公式和数学表达式的使用是这些系统的另一类困难。 |
•到目前为止,多项选择在线考试系统的设计方式是,在链接受到干扰或中断(暂时)的情况下,要保持与主服务器的连续链接。 |
到目前为止,我们已经回顾了很多文学相关的领域,我们已经找到了一种以上)这样的问题,为什么,怎么做,可以问时,给出的系统(. .)一个答案可以评估),没有人试图评估主观不同的人给出的答案c)我们发现没有标准化的雕刻系统授予标志/等级给出的答案d)我们发现一些文学生成简单的问题为数学问题和公式。已经提出了许多用于描述性答案评估的体系结构和特征。目前的方法主要是基于关键词匹配、序列匹配和定量分析,但描述性答案的语义分析仍然是一个悬而未决的问题。考虑到自然语言处理中文本分析的一般结构,形态学和句法分析[7],[8],[9],[10]已经完成了大部分工作,但语义,语用和语篇仍在探索中。 |
支持在线评估管理的在线工具,如Moodle和Zoho,基于短答案的字符串匹配技术,但长答案评估仍然由大多数系统[9],[10]手动处理。目前在线评估的功能有[9],[10]: |
•试卷设置 |
在线评估客观类型的问题 |
•题库编辑 |
•拼写检查器 |
•语法检查器 |
•结果报告的生成 |
•描述性答案评估仍然是一个开放的问题。[6] |
A.在线主观考试系统的好处 |
•能够迅速被采纳和实施 |
减少/消除教师在仪器开发和分级方面的时间要求(即,相对较低的“前置”和“后置”工作量) |
•客观评分 |
•提供测量的外部性(即,外部有效性是指你的研究结论在其他地点和其他时间对其他人适用的程度——将结果推广到原始测试组之外的能力。) |
•提供通常要求的规范参照组比较。 |
•在该学科或职业存在国家或国家标准的情况下可能是有益的或必需的。 |
•非常有价值的基准和跨机构比较研究 |
B.网上主观考试系统存在的问题 |
•主观考试的主要问题是学生给出的解释、例子和描述,这些解释、例子和描述可能有不同的单词,即用来构建句子的同义词,但它们必须有相同的意思和要点,才能保证答案正确。 |
•第二个问题是答案中句子的大小或长度。间接地,答案因人而异,这需要巨大的努力来根据上下文将它们归类。 |
提出了在线主观考试系统模型 |
在这项工作中,我们将提出上述问题的解决方案,正是我们的系统将解决由部分或语法错误的句子所代表的知识的推导问题,我们将用不同的形式和句子来解释学生所传达的意思,提出一个标准化的评分策略,解释数学公式和表达式的方法,但我们的系统将仅限于非数学科目。系统的建议架构为: |
为了从UML图中计算功能点,我们使用序列图和类图。因为这些图包含了关于系统中所有功能和数据的信息。 |
i.预处理:对文本进行规范化处理,包括丢弃多余的单词、词干等。然而,这是依赖于领域的过程,手动规则是根据需要创建的。所有关系操作符都由空白分隔开。预处理依赖于解析算法识别所需格式的句子标签的能力。把复合句拆分成简单句。 |
2词性标记:它为句子中的每个单词分配一个词性,在信息检索、词义消除歧义方面很有用,它通过为每个单词分配唯一的标记来帮助解析,从而减少解析次数。我们使用POS标记器,该标记器使用来自华尔街日报和布朗语料库的英语数据训练的模型。最新创建的模型在未见数据上的准确率达到了96%以上。[3]。 |
3等级制度:印度理工学院受印度政府控制,因此有严格的等级规定。根据课程的不同,评估是基于课堂参与、出勤率、测验、考试和/或论文。持续评估由课程教师完成。印度理工学院马德拉斯分校的评估体系是累积平均绩点,范围从0到10,转换为字母[4]。 |
iv.解析树:“自然语言解析器将一个句子作为输入,并确定对应于句子解释的标记语法树结构”[Ratnaparkhi, A.(1998)。自然语言歧义消解的最大熵模型。宾夕法尼亚大学博士论文。我们使用基于Adwait Ratnaparki 1998年论文[Ratnaparkhi, A.(1998)]的shift - reduce风格解析器。自然语言歧义消解的最大熵模型。宾夕法尼亚大学博士论文。],利用基于Penn Treebank的工具生成各语句[5]的解析树。 |
结论 |
在线考试主观题自动评价系统为教师和考试评价单元提供了方便,有利于大学、学校和学院的学术目的。因此,该模型将学生的主观答案和标准答案转换为图形形式,然后应用一些相似度度量方法,如字符串匹配、wordNet和扩散过程来计算相似度分数。该模型为主观答案评价过程的自动化提供了一种解决方案。 |
未来的工作 |
相似度匹配需要更多的分析。提出了一种对两个短语的领域本体进行检查的方法,找出了一种合适的方法来减小人机之间的差距。对多句答案的评价算法进行了升级。 |
数字一览 |
|
图1 |
|
参考文献 |
- 国际发明工程与科学杂志(IJIES) ISSN: 2319-9598,第1卷,第9期,2013年8月
- “一种基于描述型答案的智能辅导系统的开发”,《计算机科学》,2012年,pp 985-990
- 刘国强,“文本自动分类技术综述”,《计算机应用》,2011年第4期
- Meghan Kambli,“在线考试系统报告”,可下载:http://www.cdacmumbai.in/design/corporate_site/override /pdfdoc/ meghareport.pdf
- 尼赫鲁理工大学,海得拉巴,“考试和评价系统”,可申请:
- http://articles.timesofindia.indiatimes.co/2011-03 17 /阿拉哈巴德/ 29138537 _1_first-paper-examination-centres-boys。
- https://en.wikipedia.org/wiki/Education_in_India
- http://www.cs.umd.edu/~nau/cmsc421/part-of-speech-tagging.pdf
- http://en.wikipedia.org/wiki/Academic_grading_in_India
- http://www.cs.rochester.edu/~nelson/courses/csc_173/grammars/parsetrees.html
|