所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

在门户网站数据表示

Dr.A。Muthu Kumaravel
MCA, Bharath科技研究所Bharath大学,钦奈- 73
相关文章Pubmed,谷歌学者

访问更多的相关文章国际期刊的创新在计算机和通信工程的研究

文摘

数据挖掘是一个推理的过程知识从巨大的数据量。数据挖掘可以进行数据量化表示,文本或多媒体形式。网络信息系统的特点是大量数据的显示广泛的听众,可以非常异构的质量。网络上的信息系统需要发布高质量的信息后在最短的时间内提供信息来源。质量数据必须是完美的,准确的,完整的、一致的、及时、灵活地满足用户的需求。数据质量是web服务中一个非常重要的方面。活跃起来的数据质量,现在,然后需要泥土免费数据,可以涉及删除重复的记录,规范数据库中的值用于表示信息,占缺失的数据点,去除不必要的数据字段,确定异常数据,和标准化的数据格式。门户网站提供的数据的质量进行了分析。内在和表示类别的数据质量是非常重要的门户网站给数据以最有效的方式。介绍了研究的质量表示的属性数据和案例研究如何有效,数据表示已经用“科技”专栏„印度教”每日新闻门户网站。

关键字

数据质量、内在DQ表征DQ,门户网站。

介绍

由于信息和通信技术的进步和成长,所有每一个通用的信息活动像新闻,健康,娱乐,教育,等等,通过互联网可以在网站。万维网是一个存储库的各种数据。但有一个网站的公布的数据质量问题。数据质量是一个新的研究领域,代表了数据挖掘面临的最大挑战之一。数据质量指的是数据的准确性和完整性,还测量了结构和一致性,数据如何被代表的门户网站。门户网站或公共门户网站,有很多来自多个来源的信息在网络上。它在一个简单的用户友好的方式组织信息。在全球众多用户使用门户网站获取信息对他们的工作和决策提供帮助。用户和数据消费者需要确保获得的数据适合他们的需求。因此,组织提供门户网站需要提供满足用户需求的数据。 Data quality represents a common interest between data consumers and portal providers. Data quality plays an important role in the efficiency and effectiveness of organizations and businesses.

分类数据质量

数据质量分为四类,内在DQ,可访问性DQ,上下文DQ和表征DQ。每个类别有很多维度如准确性、完整性、一致性、时效性等从文献调查[2]在表1。数据精度的数据正确地反映了现实世界所描述对象或一个事件。数据准确性的一个例子是在客户的帐户是银行资产的真实价值客户值得从银行。数据完整性的程度预计提供的数据属性。例如,一个客户数据被认为是完整的,如果所有客户地址、联系信息和其他信息是可用的,所有客户的数据是可用的。雷竞技网页版一致性的数据意味着数据在整个企业应该在相互同步或缺乏数据冲突。数据一致性的一个例子是一个信用卡取消了,和不活跃,但信用卡账单状态显示。数据的及时性是极其重要的,取决于用户的期望。门户网站中的数据质量可以通过调查分析的方法。 The survey has been made with the web users who are regular to use the online “The Hindu” web portal.
本文研究的范围只包括内在和表征数据质量类别的“科技”专栏„印度教?门户网站。表2显示了数据质量,其维度和定义。

质量分析

数据质量(DQ)是通常定义为“适合使用”,即。,the ability of a collection of data to meet user requirements [3, 14].
这个定义当前视图的评估DQ,涉及到从用户的角度理解DQ [15]。报纸可以提供在线版本,不打印版本的镜像,而不是提供额外的东西,比如交互式功能或信息可能不适合打印版本[1]。网上报纸的数量有一些一般信息和一些文件与档案完整。印度报纸中是一个完整的报纸在网上通过门户网站http://www.thehindu.com/.The的在线门户网站本文包括许多列包含各种信息的每一天。但是本文的案例研究分析了数据质量内在DQ,和表征DQ„科技吗?(科技)单独列。
门户的“科技”列包含几个子列如农业、能源与环境、设备、互联网、科学和技术。已经完成的调查反馈分析使用统计工具。问卷调查已经框定和反馈收集的本科生和研究生,各种学科的研究学者、院士和web用户在定期通过这个门户。
调查问卷被陷害为每个维度5到6的问题。网络用户输入他们的评级在指定的百分比值列。
同样80多反馈形式收集并计算每个维度的平均值。表3显示了属性问卷调查的一部分。

内在质量

内在DQ指定的基本品质数据的准确性和及时性。确保数据是正确的和有效值准确性,及时性是指信息是最新的文章是有用的对我们的工作和生活。Chart1代表的内在DQ准确性为80%和及时性是90%。平均来说,数据的内在质量,?年代测量准确性和及时性85%的反馈收集。

表征数据质量

表征DQ指定的方式提出了数据或可用的web门户。
表征DQ包括内容、写作风格、交互性、布局、多媒体演示、导航、组织和存档。这些因素帮助在线门户网站来展示他们的信息以最有效的方式广泛的用户。Chart2代表的具象DQ数据表征质量已经观察到通过各种因素。
从chart2观察到数据的导航是非常高的86%,和布局、组织和表示的档案数据,发现高85%,84%和85%,其中一个很小的差异1%反馈收集。
内容和交互性发现65%和70%。多媒体演示发现的中值为45%。

结论

理解内容和消费者偏好是独一无二的,而不是让消费者描述他们想要什么样的新闻和信息,以及他们如何应该覆盖,本研究测量在线报纸内容和测量消费者的反应。研究的“科技”专栏“印度教”门户网站显示存在内在的数量和表征数据量化的品质数据质量维如前所述在数据分类部分。通过量化数据质量维度,研究由内在的确切存在和表征数据质量。本文进行了示例研究量化数据品质通过他们的尺寸,这样可以给领域重要性量化测量显示。未来研究可能导致论文的所有列,识别门户中缺乏数据质量,改善数据质量的建议也可以包括在内。

表乍一看

表的图标 表的图标 表的图标 表的图标 表的图标
表1 表2 表3 表4 表5

数据乍一看

图1 图2
图1 图2

引用

















全球技术峰会