中国科学院大学学报 ›› 2008, Vol. 26 ›› Issue (6): 771-780.DOI: 10.7523/j.issn.2095-6134.2008.6.008
荆巍巍,黄刘生,姚亦飞,徐维江
Jing Wei-Wei , Huang Liu-Sheng, Yao Yi-Fei, Xu Wei-Jiang
摘要: 统计量化规则(SQ rule)在数据挖掘中拥有重要和有用的地位。尽管集中式挖掘SQ规则的算法已经存在,但是集中式算法不能简单应用到分布式环境中,尤其涉及到分布式环境中各方的私有信息保护的时候。考虑数据分布共享的多方,在不泄漏各自的私有信息的情况下,合作完成SQ规则的挖掘问题。该问题属于保护私有信息的数据挖掘(PPDM)研究领域的问题。基于3个PPDM的基本工具,包括安全求和、安全求平均和安全求频繁项集的集合等,提交2个算法,共同完成水平划分数据下的保护私有信息的SQ规则挖掘。其中,一个算法安全计算置信区间,该区间用来检验规则的重要性;另一个算法安全挖掘规则。最后,给出算法的正确性、安全性和复杂性分析。