在线刊号(2320-9801)印刷刊号(2320-9798)
基于预处理和聚类的Web日志挖掘
由于测井数据通常具有噪声和不清晰的特点,因此数据预处理在有效的挖掘过程中起着重要作用。在数据预处理方法中,会话和路径的重建是通过附加丢失的页面来完成的。此外,通过计算用户浏览特定页面所花费的时间,在预处理中精确地解释用户行为的事务以字节率的形式被访问。通过使用网络聚类,各种类型的对象可以聚到不同的组。算法中的信念函数相似度度量包括基于Dempster - Shafer理论的聚类任务。本工作的主要目的是实现web日志的预处理和聚类,提高网站的性能
Pankaj M. Meshram, Gauri A. Chaudhary教授