聚類(lèi)分析的現(xiàn)狀與前景研究.ppt
-
資源ID:3722451
資源大?。?span id="xqxf7uf" class="font-tahoma">6.46MB
全文頁(yè)數(shù):25頁(yè)
- 資源格式: PPT
下載積分:9.9積分
快捷下載
會(huì)員登錄下載
微信登錄下載
微信掃一掃登錄
友情提示
2、PDF文件下載后,可能會(huì)被瀏覽器默認(rèn)打開(kāi),此種情況可以點(diǎn)擊瀏覽器菜單,保存網(wǎng)頁(yè)到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請(qǐng)使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站資源下載后的文檔和圖紙-無(wú)水印,預(yù)覽文檔經(jīng)過(guò)壓縮,下載后原文更清晰。
5、試題試卷類(lèi)文檔,如果標(biāo)題沒(méi)有明確說(shuō)明有答案則都視為沒(méi)有答案,請(qǐng)知曉。
|
聚類(lèi)分析的現(xiàn)狀與前景研究.ppt
聚類(lèi)分析,簡(jiǎn)要介紹,聚類(lèi)分析是研究如何將樣品或變量進(jìn)行分類(lèi)的一種方法(將一些觀察對(duì)象依據(jù)某些微量特征加以歸類(lèi))。主要應(yīng)用于探索性的研究,其分析的結(jié)果可以提供多個(gè)可能的解,選擇最終的解需要研究者的主觀判斷和后續(xù)的分析。,分類(lèi):系統(tǒng)聚類(lèi):用于對(duì)小樣本的樣品間聚類(lèi)以及對(duì)變量聚類(lèi)。動(dòng)態(tài)聚類(lèi):適用于樣本量較大時(shí)樣品間的聚類(lèi),常用k-means法處理。有序樣品聚類(lèi):對(duì)有排列次序的樣本的樣品間聚類(lèi),要求必須是次序相鄰的樣品才能聚成一類(lèi)。,房?jī)r(jià)問(wèn)題,2004年全國(guó)37大城市國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展統(tǒng)計(jì)公報(bào)的相關(guān)數(shù)據(jù),分別從國(guó)內(nèi)生產(chǎn)總值(GDP)、居民家庭人均可、支配收入、房?jī)r(jià)收入比、人均GDP這四個(gè)維度對(duì)全國(guó)37大城市的房?jī)r(jià)問(wèn)題進(jìn)行聚類(lèi)分析,房?jī)r(jià)收入比,房?jī)r(jià)收入比:是指居住單元的中等自由市場(chǎng)價(jià)格與中等家庭年收入之比。例如一套售價(jià)為49萬(wàn)元的房子對(duì)于一個(gè)年收入7萬(wàn)元的家庭,其比值便為7:1,->,消費(fèi)群體,聚類(lèi)分析在銀行客戶細(xì)分領(lǐng)域中的應(yīng)用:所用變量:,結(jié)果:,前景與優(yōu)缺點(diǎn),高維聚類(lèi)分析已成為聚類(lèi)分析的一個(gè)重要研究方向。同時(shí)高維數(shù)據(jù)聚類(lèi)也是聚類(lèi)技術(shù)的難點(diǎn)。隨著技術(shù)的進(jìn)步使得數(shù)據(jù)收集變得越來(lái)越容易,導(dǎo)致數(shù)據(jù)庫(kù)規(guī)模越來(lái)越大、復(fù)雜性越來(lái)越高,如各種類(lèi)型的貿(mào)易交易數(shù)據(jù)、Web文檔、基因表達(dá)數(shù)據(jù)等,它們的維度(屬性)通常可以達(dá)到成百上千維,甚至更高。但是,受“維度效應(yīng)”的影響,許多在低維數(shù)據(jù)空間表現(xiàn)良好的聚類(lèi)方法運(yùn)用在高維空間上往往無(wú)法獲得好的聚類(lèi)效果。高維數(shù)據(jù)聚類(lèi)分析是聚類(lèi)分析中一個(gè)非?;钴S的領(lǐng)域,同時(shí)它也是一個(gè)具有挑戰(zhàn)性的工作。目前,高維數(shù)據(jù)聚類(lèi)分析在市場(chǎng)分析、信息安全、金融、娛樂(lè)、反恐等方面都有很廣泛的應(yīng)用。,聚類(lèi)分析本身也存在著一些不足,比如快速聚類(lèi)雖然速度快,但是其分類(lèi)指標(biāo)要求是定距變量,而實(shí)際研究中,有很多的定類(lèi)變量,如性別、學(xué)歷、職業(yè)、重復(fù)購(gòu)買(mǎi)的可能性等多個(gè)與研究目的緊密相關(guān)的指標(biāo)無(wú)法直接參與運(yùn)算,而大大限制了它的使用范圍。聚類(lèi)分析通常不能單獨(dú)的應(yīng)用解決一些問(wèn)題,需要和其他方法一起結(jié)合使用才能使分析更全面、科學(xué)。并且在聚類(lèi)分析過(guò)程中,針對(duì)具體情況分為幾類(lèi)比較合適,有的軟件沒(méi)有提供具體的操作,有時(shí)需要驗(yàn)證。例如用相關(guān)系數(shù)法進(jìn)行聚類(lèi)分析和指數(shù)法的時(shí)候存在加權(quán)問(wèn)題。聚類(lèi)分析的準(zhǔn)確性還不算是很高,有待于完善。比如算法時(shí)空復(fù)雜,孤立點(diǎn)、代表點(diǎn)、鏈接過(guò)濾等問(wèn)題還沒(méi)有得到徹底解決。,