K-Means算法是最古老也是應(yīng)用最廣泛的聚類算法,它使用質(zhì)心定義原型,質(zhì)心是一組點(diǎn)的均值,通常該算法用于n維連續(xù)空間中的對(duì)象。 K-Means算法流程 step1:選擇K個(gè)點(diǎn)作為初始質(zhì)心 step2:repeat 將每個(gè)點(diǎn)指派到最近的質(zhì)心,形成K個(gè)簇 重新計(jì)算每個(gè)簇的質(zhì)心 until 質(zhì)心不在變化 例如下圖的樣本集,初始選擇是三個(gè)質(zhì)心比較集中,但是迭代3次之后,質(zhì)心趨于穩(wěn)定,并將樣本集分為3部分 我們對(duì)每一個(gè)步驟都進(jìn)行分析 step1:選擇K個(gè)點(diǎn)作為初始質(zhì)心 這一步首先要知道K的值,也就是說(shuō)K是手動(dòng)設(shè)置的,而不是像EM算法那樣自動(dòng)聚類成n個(gè)簇 其次,如何選擇初始質(zhì)心 最簡(jiǎn)單的方式無(wú)異于,隨機(jī)選取質(zhì)心了,然后多次運(yùn)行,取效果最好的那個(gè)結(jié)果。這個(gè)方法,簡(jiǎn)單但不見(jiàn)得有效,有很大的可能是得到局部最優(yōu)。 另一種復(fù)雜的方式是,隨機(jī)選取一個(gè)質(zhì)心,然后計(jì)算離這個(gè)質(zhì)心最遠(yuǎn)的樣本點(diǎn),對(duì)于每個(gè)后繼質(zhì)心都選取已經(jīng)選取過(guò)的質(zhì)心的最遠(yuǎn)點(diǎn)。使用這種方式,可以確保質(zhì)心是隨機(jī)的,并且是散開(kāi)的。 step2:repeat 將每個(gè)點(diǎn)指派到最近的質(zhì)心,形成K個(gè)簇 重新計(jì)算每個(gè)簇的質(zhì)心 until 質(zhì)心不在變化 如何定義最近的概念,對(duì)于歐式空間中的點(diǎn),可以使用歐式空間,對(duì)于文檔可以用余弦相似性等等。對(duì)于給定的數(shù)據(jù),可能適應(yīng)與多種合適的鄰近性度量。
標(biāo)簽: K-means Java 數(shù)據(jù)挖掘 聚類 算法
上傳時(shí)間: 2018-11-27
上傳用戶:1159474180
C算法(第一卷)-帶目錄.pdfC語(yǔ)言數(shù)值算法程序大全(第二版).pdfC語(yǔ)言經(jīng)典算法大全.pdfff6f5d529e875d2bec2713adc98d25b477aa8a63.pdfIntroduction to Algorithms(3rd Edition).pdfMATLAB語(yǔ)言常用算法程序集.pdfNetflix Prize中的協(xié)同過(guò)濾算法.pdfp范數(shù)正則化支持向量機(jī)分類算法_劉建偉.pdf[數(shù)據(jù)結(jié)構(gòu)與算法分析C.描述].(美國(guó))Mark.Allen.Weiss.掃描版.pdf[程序語(yǔ)言的奧妙:算法解讀(四色全彩)].(杉浦賢).李克秋.掃描版.pdf《算法導(dǎo)論(原書(shū)第3版)》.pdf【愛(ài)生活的程序員-氣宗】算法導(dǎo)論(第三版).pdf【算法(第4版)迷你書(shū)】.pdf一種基于灰度變換的紅外圖像增強(qiáng)算法.pdf一種改進(jìn)的支持向量機(jī)的文本分類算法.pdf一種靜態(tài)圖像壓縮編碼算法的改進(jìn).pdf個(gè)性化搜索引擎推薦算法研究.pdf分布式計(jì)算——原理、算法和系統(tǒng).pdf十五個(gè)經(jīng)典算法研究與總結(jié)、目錄+索引by_July (1).pdf十五個(gè)經(jīng)典算法研究與總結(jié)、目錄+索引by_July.pdf十大濾波算法程序大全(Arduino精編無(wú)錯(cuò)版) - Powered by Discuz!.pdf圖論及其算法.pdf基于模擬退火與遺傳算法結(jié)合的神經(jīng)網(wǎng)絡(luò)圖像分割.pdf大數(shù)據(jù)算法.PDF嵌入式系統(tǒng)軟件設(shè)計(jì)中的常用算法 (周航慈 清晰.pdf支持向量機(jī)通俗導(dǎo)論(理解SVM的三層境界) - 結(jié)構(gòu)之法 算法之道 - 博客頻道 - CSDN.pdf支持向量機(jī):理論、算法與拓展.pdf改進(jìn)的基于DCT的自適應(yīng)水印算法(重要).pdf數(shù)學(xué)建模MATLAB算法大全.pdf數(shù)學(xué)建模競(jìng)賽中應(yīng)當(dāng)掌握的十類算法.pdf數(shù)據(jù)挖掘十大算法(英).pdf數(shù)據(jù)結(jié)構(gòu)與算法分析 C++描述(高清非掃描).pdf最優(yōu)化理論與算法(第2版).pdf機(jī)器學(xué)習(xí)十大算法(9):樸素貝葉斯.pdf算法 英文版第4版 Robert Sedgewick .pdf.pdf算法(algorithm)手寫(xiě)代碼必備手冊(cè)(C++版).pdf算法導(dǎo)論(CLRS)筆記.p...
標(biāo)簽: 算法
上傳時(shí)間: 2022-06-06
上傳用戶:
matlab數(shù)學(xué)建模算法全收錄 超清書(shū)簽版
標(biāo)簽: matlab 數(shù)學(xué)建模 收錄 算法
上傳時(shí)間: 2013-05-15
上傳用戶:eeworm
視頻圖像格式轉(zhuǎn)換芯片的算法研究
標(biāo)簽: 視頻圖像 格式轉(zhuǎn)換 芯片 算法研究
上傳時(shí)間: 2013-05-25
上傳用戶:eeworm
精通:VISUAL C++指紋模式識(shí)別系統(tǒng)算法及實(shí)現(xiàn)_0
上傳時(shí)間: 2013-06-01
上傳用戶:eeworm
VISUAL+C++指紋模式識(shí)別系統(tǒng)算法及實(shí)現(xiàn)_0
上傳時(shí)間: 2013-04-15
上傳用戶:eeworm
VISUAL+C++指紋模式識(shí)別系統(tǒng)算法及實(shí)現(xiàn)_0
上傳時(shí)間: 2013-05-29
上傳用戶:eeworm
Visual_C++數(shù)字圖像處理典型算法及實(shí)現(xiàn)
標(biāo)簽: Visual_C 數(shù)字圖像處理 典型 算法
上傳時(shí)間: 2013-07-24
上傳用戶:eeworm
視頻圖像格式轉(zhuǎn)換芯片的算法研究
標(biāo)簽: 視頻圖像 格式轉(zhuǎn)換 芯片 算法研究
上傳時(shí)間: 2013-04-15
上傳用戶:eeworm
視頻圖像格式轉(zhuǎn)換芯片的算法研究 .nh
標(biāo)簽: nh 視頻圖像 格式轉(zhuǎn)換 芯片
上傳時(shí)間: 2013-08-04
上傳用戶:eeworm
蟲(chóng)蟲(chóng)下載站版權(quán)所有 京ICP備2021023401號(hào)-1