對(duì)數(shù)據(jù)進(jìn)行聚類分析實(shí)驗(yàn)報(bào)告.doc
《對(duì)數(shù)據(jù)進(jìn)行聚類分析實(shí)驗(yàn)報(bào)告.doc》由會(huì)員分享,可在線閱讀,更多相關(guān)《對(duì)數(shù)據(jù)進(jìn)行聚類分析實(shí)驗(yàn)報(bào)告.doc(4頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
對(duì)數(shù)據(jù)進(jìn)行聚類分析實(shí)驗(yàn)報(bào)告1. 方法背景聚類分析又稱群分析,是多元統(tǒng)計(jì)分析中研究樣本或指標(biāo)的一種主要的分類方法,在古老的分類學(xué)中,人們主要靠經(jīng)驗(yàn)和專業(yè)知識(shí),很少利用數(shù)學(xué)方法。隨著生產(chǎn)技術(shù)和科學(xué)的發(fā)展,分類越來越細(xì),以致有時(shí)僅憑經(jīng)驗(yàn)和專業(yè)知識(shí)還不能進(jìn)行確切分類,于是數(shù)學(xué)這個(gè)有用的工具逐漸被引進(jìn)到分類學(xué)中,形成了數(shù)值分類學(xué)。近些年來,數(shù)理統(tǒng)計(jì)的多元分析方法有了迅速的發(fā)展,多元分析的技術(shù)自然被引用到分類學(xué)中,于是從數(shù)值分類學(xué)中逐漸的分離出聚類分析這個(gè)新的分支。結(jié)合了更為強(qiáng)大的數(shù)學(xué)工具的聚類分析方法已經(jīng)越來越多應(yīng)用到經(jīng)濟(jì)分析和社會(huì)工作分析中。在經(jīng)濟(jì)領(lǐng)域中,主要是根據(jù)影響國(guó)家、地區(qū)及至單個(gè)企業(yè)的經(jīng)濟(jì)效益、發(fā)展水平的各項(xiàng)指標(biāo)進(jìn)行聚類分析,然后很據(jù)分析結(jié)果進(jìn)行綜合評(píng)價(jià),以便得出科學(xué)的結(jié)論。2. 基本要求用FAMALE.TXT、MALE.TXT和/或test2.txt的數(shù)據(jù)作為本次實(shí)驗(yàn)使用的樣本集,利用C均值和分級(jí)聚類方法對(duì)樣本集進(jìn)行聚類分析,對(duì)結(jié)果進(jìn)行分析,從而加深對(duì)所學(xué)內(nèi)容的理解和感性認(rèn)識(shí)。3. 實(shí)驗(yàn)要求(1)把FAMALE.TXT和MALE.TXT兩個(gè)文件合并成一個(gè),同時(shí)采用身高和體重?cái)?shù)據(jù)作為特征,設(shè)類別數(shù)為2,利用C均值聚類方法對(duì)數(shù)據(jù)進(jìn)行聚類,并將聚類結(jié)果表示在二維平面上。嘗試不同初始值對(duì)此數(shù)據(jù)集是否會(huì)造成不同的結(jié)果。(2)對(duì)1中的數(shù)據(jù)利用C均值聚類方法分別進(jìn)行兩類、三類、四類、五類聚類,畫出聚類指標(biāo)與類別數(shù)之間的關(guān)系曲線,探討是否可以確定出合理的類別數(shù)目。(3)對(duì)1中的數(shù)據(jù)利用分級(jí)聚類方法進(jìn)行聚類,分析聚類結(jié)果,體會(huì)分級(jí)聚類方法。(4)利用test2.txt數(shù)據(jù)或者把test2.txt的數(shù)據(jù)與上述1中的數(shù)據(jù)合并在一起,重復(fù)上述實(shí)驗(yàn),考察結(jié)果是否有變化,對(duì)觀察到的現(xiàn)象進(jìn)行分析,寫出體會(huì)4. 實(shí)驗(yàn)步驟及流程圖根據(jù)以上實(shí)驗(yàn)要求,本次試驗(yàn)我們將分為兩組:一、首先對(duì)FEMALE 與MALE中數(shù)據(jù)組成的樣本按照上面要求用C均值法進(jìn)行聚類分析,然后對(duì)FEMALE、MALE、test2中數(shù)據(jù)組成的樣本集用C均值法進(jìn)行聚類分析,比較二者結(jié)果。二、將上述兩個(gè)樣本用分即聚類方法進(jìn)行聚類,觀察聚類結(jié)果。并將兩種聚類結(jié)果進(jìn)行比較。(1)、C均值算法思想C均值算法首先取定C個(gè)類別和選取C個(gè)初始聚類中心,按最小距離原則將各模式分配到C類中的某一類,之后不斷地計(jì)算類心和調(diào)整各模式的類別,最終使各模式到其判屬類別中心的距離平方之和最小(2)、實(shí)驗(yàn)步驟第一步:確定類別數(shù)C,并選擇C個(gè)初始聚類中心。本次試驗(yàn),我們分別將C的值取為2和3。用的是憑經(jīng)驗(yàn)選擇代表點(diǎn)的方法。比如:在樣本數(shù)為N時(shí),分為兩類時(shí),取第1個(gè)點(diǎn)和第個(gè)點(diǎn)作為代表點(diǎn);分為三類時(shí),取第1、個(gè)點(diǎn)作為代表點(diǎn);第二步:將待聚類的樣本集中的樣本逐個(gè)按最小距離規(guī)則分劃給C個(gè)類中的某一類。第三步:計(jì)算重新聚類后的個(gè)各類心,即各類的均值向量。第四步:如果重新得到的類別的類心與上一次迭代的類心相等,則結(jié)束迭代,否則轉(zhuǎn)至第二步。第五步:迭代結(jié)束時(shí),換不同的初始值進(jìn)行試驗(yàn),將實(shí)驗(yàn)結(jié)果進(jìn)行比較(3)、實(shí)驗(yàn)流程圖(4)、本次試驗(yàn)我們用的聚類指標(biāo)是誤差平方和聚類準(zhǔn)則Je設(shè)是第聚類的樣本數(shù)目,是這些樣本的均值,則把中得各樣本與均值間的誤差平方和對(duì)所有類相加后為:當(dāng)C取不同的值時(shí)各自算出它們的,進(jìn)行比較。5. 心得體會(huì)通過本次試驗(yàn),我們隊(duì)C均值聚類法以及分級(jí)聚類法都有了較好的理解,并且在用MATLAB編程方面都有了很大進(jìn)步。部分代碼:%C=2clc;clear all;FH FW=textread(C:UsersxuydDesktophomeworkFEMALE.txt,%f %f);MH MW=textread(C:UsersxuydDesktophomeworkMALE.txt,%f %f);FA=FH FW;FA=FA;MA=MH MW;MA=MA;for k=1:50 NT(:,k)=FA(:,k);end for k=51:100 NT(:,k)=MA(:,k-50); end z1=NT(:,1);z2=NT(:,51); for k=1:100 a=z1,b=z2 G1=zeros(2,100);G2=zeros(2,100); for i=1:100 d1=sqrt(NT(1,i)-z1(1,1)2+(NT(2,i)-z1(2,1)2); d2=sqrt(NT(1,i)-z2(1,1)2+(NT(2,i)-z2(2,1)2); if d1d2 G1(:,i)=NT(:,i); else G2(:,i)=NT(:,i); end end G1(:,find(sum(abs(G1),1)=0)=; G2(:,find(sum(abs(G2),1)=0)=; z1=mean(G1,2); z2=mean(G2,2); if isequal(a,z1)=1&isequal(z2,b)=1 break end end z1,z2,G1,G2,size(G1,2),size(G2,2) for i=1:size(G1,2) x=G1(1,i); y=G1(2,i); plot(x,y,G.); hold on end for i=1:size(G2,2) x=G2(1,i); y=G2(2,i); plot(x,y,R*); hold on endplot(z1(1,1),z1(2,1),B+)hold onplot(z2(1,1),z2(2,1),B+)hold on- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 數(shù)據(jù) 進(jìn)行 聚類分析 實(shí)驗(yàn) 報(bào)告
鏈接地址:http://italysoccerbets.com/p-9066676.html