中国科学院大学学报 ›› 2008, Vol. 25 ›› Issue (4): 445-451.DOI: 10.7523/j.issn.2095-6134.2008.4.003
王 铮 张君玉
Wang zheng, Zhang jun-yu
摘要: 从提高Web用法挖掘系统整体运行效率的角度出发,优化设计Web用法挖掘数据方案;通过细化采集工作,实施简化待采集信息元集合,扩展信息元标识功能,在信息抽象基础上对信息进行分类提交和存储,进行分布式数据预处理等策略,使得在高质量完成数据采集工作的基础上,系统的存储效率、性能平衡、解析与转储效率也得到明显提升。