歡迎來(lái)到裝配圖網(wǎng)! | 幫助中心 裝配圖網(wǎng)zhuangpeitu.com!
裝配圖網(wǎng)
ImageVerifierCode 換一換
首頁(yè) 裝配圖網(wǎng) > 資源分類 > PPT文檔下載  

SPSS數(shù)據(jù)分析教程-10聚類分析.ppt

  • 資源ID:2984993       資源大小:565.51KB        全文頁(yè)數(shù):47頁(yè)
  • 資源格式: PPT        下載積分:9.9積分
快捷下載 游客一鍵下載
會(huì)員登錄下載
微信登錄下載
三方登錄下載: 微信開(kāi)放平臺(tái)登錄 支付寶登錄   QQ登錄   微博登錄  
二維碼
微信掃一掃登錄
下載資源需要9.9積分
郵箱/手機(jī):
溫馨提示:
用戶名和密碼都是您填寫的郵箱或者手機(jī)號(hào),方便查詢和重復(fù)下載(系統(tǒng)自動(dòng)生成)
支付方式: 支付寶    微信支付   
驗(yàn)證碼:   換一換

 
賬號(hào):
密碼:
驗(yàn)證碼:   換一換
  忘記密碼?
    
友情提示
2、PDF文件下載后,可能會(huì)被瀏覽器默認(rèn)打開(kāi),此種情況可以點(diǎn)擊瀏覽器菜單,保存網(wǎng)頁(yè)到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請(qǐng)使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站資源下載后的文檔和圖紙-無(wú)水印,預(yù)覽文檔經(jīng)過(guò)壓縮,下載后原文更清晰。
5、試題試卷類文檔,如果標(biāo)題沒(méi)有明確說(shuō)明有答案則都視為沒(méi)有答案,請(qǐng)知曉。

SPSS數(shù)據(jù)分析教程-10聚類分析.ppt

SPSS數(shù)據(jù)分析教程,SPSS數(shù)據(jù)分析教程,第10章 聚類分析,目錄,10.1 聚類分析簡(jiǎn)介 10.2 個(gè)案間的距離 10.2.1 定距數(shù)據(jù)(Scale Mearsurement) 距離定義方式 10.2.2 分類數(shù)據(jù)的頻數(shù) 數(shù)據(jù)(Count) 10.2.3 二分類數(shù)據(jù) 10.3 類之間的距離 10.4 系統(tǒng)聚類算法過(guò)程 10.5 系統(tǒng)聚類案例 10.6 K-均值聚類 10.6.1 K-均值法簡(jiǎn)介 10.5.2 K-均值法案例 10.7 兩步法聚類 10.7.1 兩步法簡(jiǎn)介 10.7.2 兩步法案例分析 10.8 聚類分析注意事項(xiàng),本章學(xué)習(xí)目標(biāo),理解聚類分析的基本概念; 了解個(gè)案之間距離的定義方式; 了解類之間距離的定義方式; 掌握系統(tǒng)聚類方法; 掌握兩步法聚類方法; 掌握K均值聚類方法。,10.1 聚類分析簡(jiǎn)介,根據(jù)對(duì)象的某些屬性把它們分到一些組中,使得同組內(nèi)的對(duì)象盡可能地相似,不同組中的對(duì)象盡可能地不一樣,即所謂的聚類分析。 聚類分析方法被稱為“無(wú)監(jiān)督的分析方法”,意即沒(méi)有因變量。而另外一種分類的方法是判別分析,它是把樣本歸入到已知的事先已經(jīng)確定下來(lái)的類中去, 它有因變量(即事先確定的類別),是“有監(jiān)督的分析方法”。,聚類分析不必事先知道分類對(duì)象的結(jié)構(gòu),從一批樣品的多個(gè)觀測(cè)指標(biāo)中,找出能度量樣品之間或指標(biāo)(變量)之間相似程度或親疏關(guān)系的統(tǒng)計(jì)量,構(gòu)成一個(gè)對(duì)稱相似性矩陣,并按相似程度的大小,把樣品或變量逐一歸類。 根據(jù)對(duì)樣品聚類還是對(duì)變量聚類,聚類分析分Q型聚類和R型聚類。對(duì)變量的聚類稱為R型聚類,而對(duì)樣品(即觀測(cè)值)聚類稱為Q型聚類。通俗講,R型聚類是對(duì)數(shù)據(jù)中的列分類,Q型聚類是對(duì)數(shù)據(jù)中的行分類。,SPSS Statistics提供了3種聚類方法,它們是系統(tǒng)聚類法(又稱層次聚類)、K-均值聚類(又稱快速聚類法)和兩步法聚類。,10.2 個(gè)案間的距離,定距數(shù)據(jù)距離定義方式 歐式(Euclidean)距離 平方歐式距離 余弦距離 皮爾遜(Pearson)相關(guān)性距離 切比雪夫(Chebychev)距離 塊(Block)距離 閔考斯基(Minkowski)距離 冪(Power)距離,10.2.2 分類數(shù)據(jù)之間的距離,卡方度量 Phi方度量,10.3 類之間的距離,SPSS提供了7種計(jì)算兩個(gè)類距離的方法。 組間連接法(Between-groups Linkage) 組內(nèi)連接法(Within-Groups Linkage) 最近鄰元素法(Nearest Neighbor) 最長(zhǎng)距離法(Furthest Neighbor) 質(zhì)心聚類法(Centroid Clustering) 中位數(shù)聚類法(Median Clustering) 離差平方和法(Wards Method),10.4 系統(tǒng)聚類算法過(guò)程,系統(tǒng)聚類的步驟,第1步:數(shù)據(jù)標(biāo)準(zhǔn)化。把原始數(shù)據(jù)標(biāo)準(zhǔn)化得到標(biāo)準(zhǔn)化數(shù)據(jù)矩陣。 第2步:計(jì)算相似系數(shù)矩陣。這里以余弦距離為例。計(jì)算Q型聚類任意兩個(gè)樣品xj和xk的相似系數(shù)矩陣。,第3步:選出有最大相似系數(shù)的樣品組 。 第4步:把該組樣品加權(quán)平均,這樣就形成了一個(gè)新的組合樣品 。 第5步:用新的樣品類代替原來(lái)的一對(duì)樣品點(diǎn)。 第6步:對(duì)新形成的樣品與其余樣品數(shù)據(jù)重新計(jì)算相似系數(shù)矩陣。 第7步:如此重復(fù)第2步到第5步的過(guò)程,直到把所有樣品都?xì)w類完畢。,第8步:最后,按下列原則構(gòu)成類關(guān)系圖。 若兩個(gè)樣品在已經(jīng)連接成的組中未出現(xiàn)過(guò),則它們連接成一個(gè)新組。 若兩個(gè)樣品中有一個(gè)在某組中出現(xiàn)過(guò),則另一個(gè)就加入該組。 若兩個(gè)樣品都在同一組中,則這對(duì)樣品不再分組。 若兩個(gè)樣品都在不同組中出現(xiàn)過(guò),則把這兩組連接在一起。,10.5 系統(tǒng)聚類案例,打開(kāi)本章的數(shù)據(jù)文件Cluster_cars.sav。 該數(shù)據(jù)是市場(chǎng)上一些品牌汽車的資料,它包括汽車制造商、型號(hào)、新車價(jià)錢、4年以后的二手車價(jià)錢,還有功率、引擎大小、車重、車體長(zhǎng)、車體寬、車輪大小、油耗等諸多屬性。 按照這些數(shù)據(jù)對(duì)當(dāng)前市場(chǎng)上的車進(jìn)行聚類,看看哪些品牌的車定位有類似之處,制造商可以據(jù)此制定相應(yīng)的策略。,選擇【分析】【分類】【系統(tǒng)聚類】 把從“Price in thousand”到“Fuel efficiency”的所有變量選入右邊的“變量框”。 把“Model”變量選入“標(biāo)注個(gè)案”框。 依次單擊【統(tǒng)計(jì)量】、【繪制】、【方法】和【保存】按鈕,10.6 K-均值聚類,K-均值聚類的算法過(guò)程,第1步:用戶給定聚類個(gè)數(shù)K。 第2步:給出初始類中心。 第3步:計(jì)算所有個(gè)體到這K個(gè)類中心的距離,然后按照到K個(gè)類中心距離最短原則,把所有個(gè)體分別劃分到距最近的中心點(diǎn)所在的類中,這樣形成了K個(gè)類,完成一次迭代過(guò)程。 第4步:重新計(jì)算K個(gè)類的類中心。 第5步:重復(fù)進(jìn)行第3步、第4步。直到迭代次數(shù)達(dá)到限制的次數(shù)或者類中心不再變化為止。,K-均值法案例,打開(kāi)本章的數(shù)據(jù)文件Cluster_cars.sav。 該數(shù)據(jù)是市場(chǎng)上一些品牌汽車的資料,它包括汽車制造商、型號(hào)、新車價(jià)錢、4年以后的二手車價(jià)錢,還有功率、引擎大小、車重、車體長(zhǎng)、車體寬、車輪大小、油耗等諸多屬性。 按照這些數(shù)據(jù)對(duì)當(dāng)前市場(chǎng)上的車進(jìn)行聚類,看看哪些品牌的車定位有類似之處,制造商可以據(jù)此制定相應(yīng)的策略。,選擇【分析】【分類】【K-均值聚類】,10.7 兩步法聚類,兩步法聚類又稱兩階段聚類,它與系統(tǒng)聚類相似,是揭示數(shù)據(jù)所蘊(yùn)含的自然組別的一種探索性分析方法。,兩步法聚類的特點(diǎn),(1)聚類變量可以是連續(xù)變量,也可以是分類變量。兩步法聚類充分考慮到這兩種變量的不同性質(zhì),采用對(duì)數(shù)似然距離來(lái)衡量相似性。 (2)它能自動(dòng)確定出類的個(gè)數(shù)。 (3)能夠有效地分析大數(shù)據(jù)集。,兩階段聚類算法的兩個(gè)階段,第1步:建立一個(gè)聚類特性樹。 第2步:應(yīng)用凝聚算法對(duì)聚類特性樹的葉節(jié)點(diǎn)進(jìn)行分類。,兩步法的距離度量,兩步法的距離度量有兩種 (1)對(duì)數(shù)似然(SPSS 翻譯為對(duì)數(shù)相似值):這里由于聚類指標(biāo)中含有分類變量,所以只能選擇該項(xiàng)。 (2)歐式距離(Euclidean):當(dāng)聚類指標(biāo)不含有分類變量時(shí)可以選擇該距離。,聚類數(shù)量,(1)自動(dòng)確定:可以選擇自動(dòng)確定,這里可以限定類個(gè)數(shù)的上限。默認(rèn)最多15個(gè)類。也可以據(jù)需要修改類個(gè)數(shù)的最大值。 (2)指定固定值:如果很有把握,那么你可以輸入你想要的類個(gè)數(shù)。,聚類準(zhǔn)則,有AIC和BIC兩個(gè)準(zhǔn)則,這兩個(gè)模型選擇準(zhǔn)則在選擇模型方面基本類似,都是綜合考慮樣本數(shù)和模型的復(fù)雜程度。AIC或者BIC的值越小,模型越好。,兩步法案例分析,數(shù)據(jù)文件Twosteps_car.sav 選擇【分析】【分類】【兩步聚類】,兩步法聚類選項(xiàng)設(shè)置(1),兩步法聚類選項(xiàng)設(shè)置(2),評(píng)估字段:評(píng)估字段不用于聚類過(guò)程,但是可以用它們來(lái)描述兩步法生成的類的特征。,兩步法聚類的模型摘要,兩步法模型視圖,兩步法模型視圖,兩步法模型視圖,作業(yè),

注意事項(xiàng)

本文(SPSS數(shù)據(jù)分析教程-10聚類分析.ppt)為本站會(huì)員(za****8)主動(dòng)上傳,裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。 若此文所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng)(點(diǎn)擊聯(lián)系客服),我們立即給予刪除!

溫馨提示:如果因?yàn)榫W(wǎng)速或其他原因下載失敗請(qǐng)重新下載,重復(fù)下載不扣分。




關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號(hào):ICP2024067431號(hào)-1 川公網(wǎng)安備51140202000466號(hào)


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺(tái),本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng),我們立即給予刪除!