-
关联规则挖掘基础篇
什么是关联规则挖掘?
作为数据挖掘的重要研究方向之一,关联规则挖掘的目的是从事务数据集中分析数据项之间潜在的关联关系,揭示其中蕴含的对于用户有价值的模式。一般认为,关联规则挖掘主要由两个步骤组成:(1)从事务数据集中挖掘所有支持度不小于最小支持度阈值的频繁项集;(2)从上一步结果中生成满足最小置信度阈值要求的关联规则。其中,由于具有指数级别的时间复杂度,频繁项集挖掘所消耗的时间往往超过用户可以接受的程度。在过去的十多年中,国内外的研究者们提出了许多算法来不断改进相关算法的性能。这里的性能主要指的是执行时间。