頻繁項(xiàng)集挖掘算法的計(jì)算復(fù)雜性和生成的頻繁項(xiàng)集數(shù)量隨著事務(wù)集項(xiàng)數(shù)的增加呈指數(shù)增長,最小支持度閾值成為控制這種增長的關(guān)鍵.然而,實(shí)際應(yīng)用中僅使用支持度閾值難以有效控制頻繁項(xiàng)集的規(guī)模.為此定義N個(gè)
最頻繁項(xiàng)集挖掘問題,并提出基于支持度閾值動(dòng)態(tài)調(diào)整策略的寬度優(yōu)先搜索算法Apriori和深度優(yōu)先搜索算法IntvMatrix挖掘N個(gè)最頻繁項(xiàng)集.實(shí)驗(yàn)表明,本文的2種方法的效率比樸素方法高2倍以上,特別當(dāng)N值較低時(shí),本
文方法的效率優(yōu)勢(shì)更為明顯.
標(biāo)簽:
頻繁
項(xiàng)集挖掘
算法
計(jì)算
上傳時(shí)間:
2016-08-06
上傳用戶:星仔