歡迎來到裝配圖網(wǎng)! | 幫助中心 裝配圖網(wǎng)zhuangpeitu.com!
裝配圖網(wǎng)
ImageVerifierCode 換一換
首頁 裝配圖網(wǎng) > 資源分類 > DOC文檔下載  

對數(shù)據(jù)進行聚類分析實驗報告.doc

  • 資源ID:9066676       資源大?。?span id="9td2lzv" class="font-tahoma">53KB        全文頁數(shù):4頁
  • 資源格式: DOC        下載積分:9.9積分
快捷下載 游客一鍵下載
會員登錄下載
微信登錄下載
三方登錄下載: 微信開放平臺登錄 支付寶登錄   QQ登錄   微博登錄  
二維碼
微信掃一掃登錄
下載資源需要9.9積分
郵箱/手機:
溫馨提示:
用戶名和密碼都是您填寫的郵箱或者手機號,方便查詢和重復下載(系統(tǒng)自動生成)
支付方式: 支付寶    微信支付   
驗證碼:   換一換

 
賬號:
密碼:
驗證碼:   換一換
  忘記密碼?
    
友情提示
2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網(wǎng)頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站資源下載后的文檔和圖紙-無水印,預覽文檔經(jīng)過壓縮,下載后原文更清晰。
5、試題試卷類文檔,如果標題沒有明確說明有答案則都視為沒有答案,請知曉。

對數(shù)據(jù)進行聚類分析實驗報告.doc

對數(shù)據(jù)進行聚類分析實驗報告1. 方法背景聚類分析又稱群分析,是多元統(tǒng)計分析中研究樣本或指標的一種主要的分類方法,在古老的分類學中,人們主要靠經(jīng)驗和專業(yè)知識,很少利用數(shù)學方法。隨著生產(chǎn)技術(shù)和科學的發(fā)展,分類越來越細,以致有時僅憑經(jīng)驗和專業(yè)知識還不能進行確切分類,于是數(shù)學這個有用的工具逐漸被引進到分類學中,形成了數(shù)值分類學。近些年來,數(shù)理統(tǒng)計的多元分析方法有了迅速的發(fā)展,多元分析的技術(shù)自然被引用到分類學中,于是從數(shù)值分類學中逐漸的分離出聚類分析這個新的分支。結(jié)合了更為強大的數(shù)學工具的聚類分析方法已經(jīng)越來越多應用到經(jīng)濟分析和社會工作分析中。在經(jīng)濟領(lǐng)域中,主要是根據(jù)影響國家、地區(qū)及至單個企業(yè)的經(jīng)濟效益、發(fā)展水平的各項指標進行聚類分析,然后很據(jù)分析結(jié)果進行綜合評價,以便得出科學的結(jié)論。2. 基本要求用FAMALE.TXT、MALE.TXT和/或test2.txt的數(shù)據(jù)作為本次實驗使用的樣本集,利用C均值和分級聚類方法對樣本集進行聚類分析,對結(jié)果進行分析,從而加深對所學內(nèi)容的理解和感性認識。3. 實驗要求(1)把FAMALE.TXT和MALE.TXT兩個文件合并成一個,同時采用身高和體重數(shù)據(jù)作為特征,設類別數(shù)為2,利用C均值聚類方法對數(shù)據(jù)進行聚類,并將聚類結(jié)果表示在二維平面上。嘗試不同初始值對此數(shù)據(jù)集是否會造成不同的結(jié)果。(2)對1中的數(shù)據(jù)利用C均值聚類方法分別進行兩類、三類、四類、五類聚類,畫出聚類指標與類別數(shù)之間的關(guān)系曲線,探討是否可以確定出合理的類別數(shù)目。(3)對1中的數(shù)據(jù)利用分級聚類方法進行聚類,分析聚類結(jié)果,體會分級聚類方法。(4)利用test2.txt數(shù)據(jù)或者把test2.txt的數(shù)據(jù)與上述1中的數(shù)據(jù)合并在一起,重復上述實驗,考察結(jié)果是否有變化,對觀察到的現(xiàn)象進行分析,寫出體會4. 實驗步驟及流程圖根據(jù)以上實驗要求,本次試驗我們將分為兩組:一、首先對FEMALE 與MALE中數(shù)據(jù)組成的樣本按照上面要求用C均值法進行聚類分析,然后對FEMALE、MALE、test2中數(shù)據(jù)組成的樣本集用C均值法進行聚類分析,比較二者結(jié)果。二、將上述兩個樣本用分即聚類方法進行聚類,觀察聚類結(jié)果。并將兩種聚類結(jié)果進行比較。(1)、C均值算法思想C均值算法首先取定C個類別和選取C個初始聚類中心,按最小距離原則將各模式分配到C類中的某一類,之后不斷地計算類心和調(diào)整各模式的類別,最終使各模式到其判屬類別中心的距離平方之和最小(2)、實驗步驟第一步:確定類別數(shù)C,并選擇C個初始聚類中心。本次試驗,我們分別將C的值取為2和3。用的是憑經(jīng)驗選擇代表點的方法。比如:在樣本數(shù)為N時,分為兩類時,取第1個點和第個點作為代表點;分為三類時,取第1、個點作為代表點;第二步:將待聚類的樣本集中的樣本逐個按最小距離規(guī)則分劃給C個類中的某一類。第三步:計算重新聚類后的個各類心,即各類的均值向量。第四步:如果重新得到的類別的類心與上一次迭代的類心相等,則結(jié)束迭代,否則轉(zhuǎn)至第二步。第五步:迭代結(jié)束時,換不同的初始值進行試驗,將實驗結(jié)果進行比較(3)、實驗流程圖(4)、本次試驗我們用的聚類指標是誤差平方和聚類準則Je設是第聚類的樣本數(shù)目,是這些樣本的均值,則把中得各樣本與均值間的誤差平方和對所有類相加后為:當C取不同的值時各自算出它們的,進行比較。5. 心得體會通過本次試驗,我們隊C均值聚類法以及分級聚類法都有了較好的理解,并且在用MATLAB編程方面都有了很大進步。部分代碼:%C=2clc;clear all;FH FW=textread(C:UsersxuydDesktophomeworkFEMALE.txt,%f %f);MH MW=textread(C:UsersxuydDesktophomeworkMALE.txt,%f %f);FA=FH FW;FA=FA;MA=MH MW;MA=MA;for k=1:50 NT(:,k)=FA(:,k);end for k=51:100 NT(:,k)=MA(:,k-50); end z1=NT(:,1);z2=NT(:,51); for k=1:100 a=z1,b=z2 G1=zeros(2,100);G2=zeros(2,100); for i=1:100 d1=sqrt(NT(1,i)-z1(1,1)2+(NT(2,i)-z1(2,1)2); d2=sqrt(NT(1,i)-z2(1,1)2+(NT(2,i)-z2(2,1)2); if d1<d2 G1(:,i)=NT(:,i); else G2(:,i)=NT(:,i); end end G1(:,find(sum(abs(G1),1)=0)=; G2(:,find(sum(abs(G2),1)=0)=; z1=mean(G1,2); z2=mean(G2,2); if isequal(a,z1)=1&&isequal(z2,b)=1 break end end z1,z2,G1,G2,size(G1,2),size(G2,2) for i=1:size(G1,2) x=G1(1,i); y=G1(2,i); plot(x,y,G.); hold on end for i=1:size(G2,2) x=G2(1,i); y=G2(2,i); plot(x,y,R*); hold on endplot(z1(1,1),z1(2,1),B+)hold onplot(z2(1,1),z2(2,1),B+)hold on

注意事項

本文(對數(shù)據(jù)進行聚類分析實驗報告.doc)為本站會員(jian****018)主動上傳,裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對上載內(nèi)容本身不做任何修改或編輯。 若此文所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知裝配圖網(wǎng)(點擊聯(lián)系客服),我們立即給予刪除!

溫馨提示:如果因為網(wǎng)速或其他原因下載失敗請重新下載,重復下載不扣分。




關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網(wǎng)安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知裝配圖網(wǎng),我們立即給予刪除!