模式識(shí)別實(shí)驗(yàn)報(bào)告.doc
《模式識(shí)別實(shí)驗(yàn)報(bào)告.doc》由會(huì)員分享,可在線(xiàn)閱讀,更多相關(guān)《模式識(shí)別實(shí)驗(yàn)報(bào)告.doc(41頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
院 系: 計(jì)算機(jī)科學(xué)學(xué)院 專(zhuān) 業(yè): 智能科學(xué)與技術(shù) 年 級(jí): 2012 級(jí) 課程名稱(chēng): 模式識(shí)別 組 號(hào): 13組 組 員: 徐燦 馬卿 指導(dǎo)教師: 孫陽(yáng)光老師 2014年12月30日年級(jí)2012級(jí)學(xué)號(hào)20122138552012213875專(zhuān)業(yè)智能科學(xué)與技術(shù)姓名徐燦馬卿實(shí)驗(yàn)時(shí)間2014.10.8實(shí)驗(yàn)地點(diǎn)9#206實(shí)驗(yàn)名稱(chēng)用身高和/或體重?cái)?shù)據(jù)進(jìn)行性別分類(lèi)的實(shí)驗(yàn)實(shí)驗(yàn)類(lèi)型設(shè)計(jì)型綜合型創(chuàng)新型實(shí)驗(yàn)?zāi)康幕蛞蠡疽螅?用PR_Exp1_Data_1.TXT 和PR_Exp1_Data_2.TXT 的數(shù)據(jù)作為訓(xùn)練樣本集,建立Bayes 分類(lèi)器,用PR_Exp1_Data_3.TXT測(cè)試樣本數(shù)據(jù)對(duì)該分類(lèi)器進(jìn)行測(cè)試。調(diào)整特征、分類(lèi)器等方面的一些因素,考察它們對(duì)分類(lèi)器性能的影響,從而加深對(duì)所學(xué)內(nèi)容的理解和感性認(rèn)識(shí)。 具體做法: 1 應(yīng)用單個(gè)特征進(jìn)行實(shí)驗(yàn):以(a)身高或者(b)體重?cái)?shù)據(jù)作為特征,在正態(tài) 分布假設(shè)下利用最大似然法或者貝葉斯估計(jì)法估計(jì)分布密度參數(shù)(只利用訓(xùn) 練數(shù)據(jù)估計(jì)密度),建立最小錯(cuò)誤率Bayes 分類(lèi)器,寫(xiě)出得到的決策規(guī)則,將 該分類(lèi)器應(yīng)用到測(cè)試樣本,考察測(cè)試錯(cuò)誤情況。在分類(lèi)器設(shè)計(jì)時(shí)可以考察采 用不同先驗(yàn)概率(如0.5 對(duì)0.5, 0.75 對(duì)0.25, 0.9 對(duì)0.1 等)進(jìn)行實(shí)驗(yàn),考察對(duì) 決策規(guī)則和錯(cuò)誤率的影響。 2 應(yīng)用兩個(gè)特征進(jìn)行實(shí)驗(yàn):同時(shí)采用身高和體重?cái)?shù)據(jù)作為特征,分別假設(shè)二者 相關(guān)或不相關(guān),在正態(tài)分布假設(shè)下估計(jì)概率密度,建立最小錯(cuò)誤率Bayes 分 類(lèi)器,寫(xiě)出得到的決策規(guī)則,將該分類(lèi)器應(yīng)用到訓(xùn)練/測(cè)試樣本,考察訓(xùn)練/ 測(cè)試錯(cuò)誤情況。比較相關(guān)假設(shè)和不相關(guān)假設(shè)下結(jié)果的差異。在分類(lèi)器設(shè)計(jì)時(shí) 可以考察采用不同先驗(yàn)概率(如0.5 vs. 0.5, 0.75 vs. 0.25, 0.9 vs. 0.1 等)進(jìn)行 實(shí)驗(yàn),考察對(duì)決策和錯(cuò)誤率的影響。 3 自行給出一個(gè)決策表,采用最小風(fēng)險(xiǎn)的Bayes 決策重復(fù)上面的某個(gè)或全部實(shí) 驗(yàn)。 需要用到的數(shù)據(jù)文件: 訓(xùn)練和測(cè)試樣本集: PR_Exp1_Data_1.txt 124 個(gè)同學(xué)的身高、體重、性別數(shù)據(jù)(40 個(gè)女生、84 個(gè)男生) PR_Exp1_Data_2.txt 328 個(gè)同學(xué)的身高、體重、性別數(shù)據(jù)(78 個(gè)女生、250 個(gè)男生) PR_Exp1_Data_3.txt 90 個(gè)同學(xué)的身高、體重、性別數(shù)據(jù)(16 個(gè)女生、74 個(gè)男生) 實(shí)驗(yàn)代碼(身高或者體重)clear all;load datasetf1.txt; %讀入樣本數(shù)據(jù)男生load datasetm1.txt; %讀入樣本數(shù)據(jù)女生%樣本的分析figure;for i=1:250 if(i79) plot(datasetf1(i,2),datasetf1(i,1),r+); end plot(datasetm1(i,2),datasetm1(i,1),k*); hold on;endtitle(樣本數(shù)據(jù));xlabel(體重(Kg),ylabel(身高(cm);legend(男生,女生);%打開(kāi)文件(測(cè)試文件和訓(xùn)練文件)此處選擇文件為第三組測(cè)試文件fid=fopen(dataset3.txt,r); test1=fscanf(fid,%f %f %s,3,inf);%文件讀取格式test=test1;fclose(fid);Fmean = mean(datasetf1);Mmean = mean(datasetm1);Fvar = std(datasetf1);Mvar = std(datasetm1);preF = 0.5; %先驗(yàn)概率的設(shè)定和修改preM = 0.5;error = 0;Nerror = 0; %錯(cuò)誤個(gè)數(shù)和錯(cuò)誤率的設(shè)定%身高的決策sprintf(%s,樣本數(shù)為90時(shí)P0.50.5:) %測(cè)試或者訓(xùn)練樣本的個(gè)數(shù)figure;for i = 1:90 %測(cè)試或者訓(xùn)練樣本的個(gè)數(shù)PFheight = normpdf(test(i,1),Fmean(1,1),Fvar(1,1) ; %得到男生身高的數(shù)據(jù)PMheight = normpdf(test(i,1),Mmean(1,1),Mvar(1,1) ; %得到女生身高的數(shù)據(jù)pFemale = preF*PFheight;pMale = preM*PMheight; if(pFemalepMale) plot(i,test(i,1),k*); if (test(i,3)=0) Nerror = Nerror +1; end 實(shí)驗(yàn)代碼(身高或者體重)else plot(I,test(I,1),r+); if (test(I,3)=1) Nerror = Nerror +1; end end hold on;end;error = Nerror/90*100; %根據(jù)樣本的選擇來(lái)確定除以的樣本個(gè)數(shù)title(身高最小錯(cuò)誤率Bayes分類(lèi));xlabel(測(cè)試序號(hào)),ylabel(身高(cm);sprintf(%s %d %s %0.2f%s,身高分類(lèi)錯(cuò)誤個(gè)數(shù):,Nerror,身高分類(lèi)錯(cuò)誤率為:,error,%)%體重決策figure;error = 0;Nerror = 0;for j= 1:90Pfweight = normpdf(test(j,2),Fmean(1,2),Fvar(1,2) ; %得到男生體重的數(shù)據(jù)Pmweight = normpdf(test(j,2),Mmean(1,2),Mvar(1,2) ; %得到女生體重的數(shù)據(jù)pwFemale = preF*Pfweight;pwMale = preM*Pmweight;if(pwFemalepwMale) plot(j,test(j,2),k*); if (test(j,3)=0) Nerror = Nerror +1; end else plot(j,test(j,2),r+); if (test(j,3)=1) Nerror = Nerror +1; end end hold on;end;error = Nerror/90*100; %根據(jù)樣本的選擇來(lái)確定除以的樣本個(gè)數(shù)title(體重最小錯(cuò)誤率Bayes分類(lèi));xlabel(測(cè)試序號(hào)),ylabel(體重(kg);sprintf(%s %d %s %0.2f%s,體重分類(lèi)錯(cuò)誤個(gè)數(shù):,Nerror,體重分類(lèi)錯(cuò)誤率為:,error,%)實(shí)驗(yàn)代碼(身高和體重的乘積)%以身高乘以體重計(jì)算(男生的身高乘以體重比值較大,女生較?。ヽlear all;load datasetf1.txt; load datasetm1.txt;fid=fopen(dataset3.txt,r); %測(cè)試和訓(xùn)練樣本test1=fscanf(fid,%f %f %s,3,inf);test=test1;fclose(fid);Fmean = mean(datasetf1); %求每一列的均值Mmean = mean(datasetm1);Fvar = std(datasetf1);%算出每一列的標(biāo)準(zhǔn)偏差。Mvar = std(datasetm1);preF = 0.5; %先驗(yàn)概率的設(shè)定,根據(jù)先驗(yàn)概率的不同修改preM = 0.5;error = 0;Nerror = 0;%身高的決策sprintf(%s,樣本數(shù)為90時(shí)P0.50.5:) %測(cè)試或者訓(xùn)練樣本的個(gè)數(shù)figure;for i = 1:90 %測(cè)試或者訓(xùn)練樣本的個(gè)數(shù)PFheight = normpdf(test(i,1),Fmean(1,1),Fvar(1,1)*normpdf(test(i,2),Fmean(1,2),Fvar(1,2) ;%正態(tài)分布密度函數(shù)PMheight = normpdf(test(i,1),Mmean(1,1),Mvar(1,1)*normpdf(test(i,2),Mmean(1,2),Mvar(1,2) ;pFemale = preF*PFheight;pMale = preM*PMheight; if(pFemale0?X女生2實(shí)驗(yàn)結(jié)果分析樣本分析的圖像(此處把數(shù)據(jù)改成兩類(lèi),男生的單獨(dú)為一個(gè)文件,女生的單獨(dú)為一個(gè)文件)P0.5-P0.5時(shí)328個(gè)樣本的錯(cuò)誤率分析P0.5-P0.5時(shí)124個(gè)樣本的錯(cuò)誤率分析P0.75-P0.25時(shí)328個(gè)樣本的錯(cuò)誤率分析P0.75-P0.25時(shí)124個(gè)樣本的錯(cuò)誤率分析P0.9-P0.1時(shí)328個(gè)樣本的錯(cuò)誤率分析P0.9-P0.1時(shí)124個(gè)樣本的錯(cuò)誤率分析表格 1身高和體重單獨(dú)下各樣本下各種概率的錯(cuò)誤率分析樣本概率為P0.5-P0.5誤差概率概率P 0.75P0.25誤差概率概率P 0.9P0.1誤差概率328個(gè)樣本身高錯(cuò)誤個(gè)數(shù): 33錯(cuò)誤率為: 10.06%錯(cuò)誤個(gè)數(shù): 60錯(cuò)誤率為: 18.29%錯(cuò)誤個(gè)數(shù): 81 錯(cuò)誤率為: 24.70%體重錯(cuò)誤個(gè)數(shù): 45錯(cuò)誤率為: 13.72%錯(cuò)誤個(gè)數(shù): 68錯(cuò)誤率為: 20.73%錯(cuò)誤個(gè)數(shù): 89 錯(cuò)誤率為: 27.13%124個(gè)樣本身高錯(cuò)誤個(gè)數(shù): 16錯(cuò)誤率為: 12.90%錯(cuò)誤個(gè)數(shù): 31錯(cuò)誤率為: 25.00%錯(cuò)誤個(gè)數(shù): 34錯(cuò)誤率為: 27.42%體重錯(cuò)誤個(gè)數(shù): 21錯(cuò)誤率為: 16.94%錯(cuò)誤個(gè)數(shù): 35錯(cuò)誤率為: 28.23%錯(cuò)誤個(gè)數(shù): 37錯(cuò)誤率為: 29.84%根據(jù)表格內(nèi)容,選擇P0.5P0.5時(shí)的概率對(duì)樣本3進(jìn)行分析,得到的結(jié)果以身高乘以體重的算法來(lái)計(jì)算錯(cuò)誤率分類(lèi)時(shí)的結(jié)果P0.5-P0.5時(shí)328個(gè)樣本的錯(cuò)誤率分析P0.5-P0.5時(shí)124個(gè)樣本的錯(cuò)誤率分析P0.75-P0.25時(shí)328個(gè)樣本的錯(cuò)誤率分析 P0.75-P0.25時(shí)124個(gè)樣本的錯(cuò)誤率分析P0.9-P0.1時(shí)328個(gè)樣本的錯(cuò)誤率分析P0.9-P0.1時(shí)124個(gè)樣本的錯(cuò)誤率分析表格 2身高和體重乘積下各樣本下各種概率的錯(cuò)誤率分析樣本概率為P0.5P0.5時(shí)的身高體重錯(cuò)誤率概率為P0.75P0.25時(shí)的身高體重錯(cuò)誤率概率為P0.9P0.1時(shí)的身高體重錯(cuò)誤率樣本為328時(shí)分類(lèi)錯(cuò)誤個(gè)數(shù): 30 分類(lèi)錯(cuò)誤率為: 9.15%分類(lèi)錯(cuò)誤個(gè)數(shù): 37 分類(lèi)錯(cuò)誤率為: 11.28%分類(lèi)錯(cuò)誤個(gè)數(shù): 49 分類(lèi)錯(cuò)誤率為: 14.94%樣本為124時(shí)分類(lèi)錯(cuò)誤個(gè)數(shù): 17 分類(lèi)錯(cuò)誤率為: 13.71%分類(lèi)錯(cuò)誤個(gè)數(shù): 19分類(lèi)錯(cuò)誤率為: 15.32%分類(lèi)錯(cuò)誤個(gè)數(shù): 23分類(lèi)錯(cuò)誤率為: 18.55%根據(jù)表格內(nèi)容,選擇P0.5P0.5時(shí)的概率對(duì)樣本3進(jìn)行分析,得到的結(jié)果 年級(jí)2012級(jí)學(xué)號(hào)20122138552012213875專(zhuān)業(yè)智能科學(xué)與技術(shù)姓名徐燦馬卿實(shí)驗(yàn)時(shí)間2014.11.8實(shí)驗(yàn)地點(diǎn)9#206實(shí)驗(yàn)名稱(chēng)用身高/體重?cái)?shù)據(jù)進(jìn)行性別分類(lèi)的實(shí)驗(yàn)(二)實(shí)驗(yàn)類(lèi)型設(shè)計(jì)型綜合型創(chuàng)新型實(shí)驗(yàn)?zāi)康幕蛞蠡疽螅篲試驗(yàn)利用Fisher線(xiàn)性判別方法獲取分類(lèi)器。_試驗(yàn)直接設(shè)計(jì)線(xiàn)性分類(lèi)器的方法,與基于概率密度估計(jì)的貝葉斯分離器進(jìn)行比較。具體做法:1同時(shí)采用身高和體重?cái)?shù)據(jù)作為特征,用Fisher線(xiàn)性判別方法求分類(lèi)器,將該分類(lèi)器應(yīng)用到訓(xùn)練和測(cè)試樣本,考察訓(xùn)練和測(cè)試錯(cuò)誤情況。2將訓(xùn)練樣本和求得的決策邊界畫(huà)到圖上,同時(shí)把以往用Bayes方法求得的分類(lèi)器也畫(huà)到圖上,比較結(jié)果的異同。需要用到的數(shù)據(jù)文件:訓(xùn)練樣本集:PR_Exp2_Data_1.txtPR_Exp2_Data_2.txtPR_Exp2_Data_3.txtPR_Exp2_Data_4.txtPR_Exp2_Data_5.txtPR_Exp2_Data_6.txt測(cè)試樣本集:實(shí)驗(yàn)(一)中的樣本集。要求:參見(jiàn)實(shí)驗(yàn)(一)。Fisher線(xiàn)性判別函數(shù)%用fisher線(xiàn)性判別函數(shù)來(lái)判斷clcclear allfilename,pathname,filterindex = uigetfile(FEMALE.txt, 請(qǐng)讀入男生訓(xùn)練集);fileAddrs = pathname,filename;A1 A2=textread(fileAddrs,%f%f);filename,pathname,filterindex = uigetfile(MALE.txt, 請(qǐng)讀入女生訓(xùn)練集);fileAddrs = pathname,filename;B1 B2=textread(fileAddrs,%f%f);AA=A1 A2;BB=B1 B2;w,y0=fisher(AA,BB);wT=w;girl=0;boy=0;bad=0;errorgirl=0;errorboy=0;error=0;errorgirlrate=0;errorboyrate=0; errorrate=0;Fisher線(xiàn)性判別函數(shù)(樣本數(shù)為90時(shí)的判斷和錯(cuò)誤率分析)%以測(cè)試數(shù)據(jù)為90的樣本為例子filename,pathname,filterindex = uigetfile(dataset3.txt, 請(qǐng)讀入測(cè)試集);fileAddrs = pathname,filename;T1 T2=textread(fileAddrs,%f%f%*s);TT=T1 T2;T=TT;k3 l3=size(T);for k=1:16 y(k)=wT*T(:,k); if y(k)y0 girl=girl+1; end endendfor k=16:90 y(k)=wT*T(:,k); if y(k)y0 errorboy=errorboy+1; bad=bad+1; end endenderrorgirlerrorboybadgirl=errorboy+girlboy=boy+errorgirlerror=errorgirl+errorboyerrorgirlrate=errorgirl/16errorboyrate=errorboy/74errorrate=error/90調(diào)用函數(shù)%用fisher線(xiàn)性判別法求閾值的調(diào)用函數(shù)function w,y0=fisher(AA,BB)A=AA;B=BB;k1,l1=size(A);k2,l2=size(B);M1=sum(AA);M1=M1;M1=M1/l1;%男生均值向量M2=sum(BB);M2=M2;M2=M2/l2;%女生均值向量S1=zeros(k1,k1);%建立矩陣S2=zeros(k2,k2);for i=1:l1 S1=S1+(A(:,i)-M1)*(A(:,i)-M1).);%男生的類(lèi)內(nèi)離散度矩陣endfor i=1:l2 S2=S2+(B(:,i)-M2)*(B(:,i)-M2).);%女生的類(lèi)內(nèi)離散度矩陣endSw=0.5*S1+0.5*S2;%總類(lèi)內(nèi)離散度矩陣,先驗(yàn)概率0.5w=inv(Sw)*(M1-M2);%兩列wT=w;%wT就是使Fisher準(zhǔn)則函數(shù)JF(w)取極大值時(shí)的解,也就是d維X空間到1維Y空間的最好的投影方向for i=1:l1 Y1(i)=wT(1,1)*A(1,i)+wT(1,2)*A(2,i);%求出二維男生樣本集映射到一維時(shí)的量endfor i=1:l2 Y2(i)=wT(1,1)*B(1,i)+wT(1,2)*B(2,i);%求出二維女生樣本集映射到一維時(shí)的量endm1=sum(Y1)/l1;m2=sum(Y2)/l2;y0=(l1*m1+l2*m2)/(l1+l2);%function value=classify_CH(x,y,w,y0)%程序:模式識(shí)別%功能:應(yīng)用Fisher準(zhǔn)則判斷一個(gè)身高體重二維數(shù)據(jù)的性別vector=x;y;yy=(w.)*vector;if yyy0 value=2;%表示樣本是男生else value=1;%表示樣本是女生endFisher分類(lèi)器畫(huà)圖%fisher分類(lèi)器畫(huà)圖filename,pathname,filterindex = uigetfile(datasetf1*.txt, 請(qǐng)讀入男生訓(xùn)練集);fileAddrs = pathname,filename;A1 A2=textread(fileAddrs,%f%f);filename,pathname,filterindex = uigetfile(datasetm1*.txt, 請(qǐng)讀入女生訓(xùn)練集);fileAddrs = pathname,filename;B1 B2=textread(fileAddrs,%f%f);AA=A1 A2;BB=B1 B2;A=AA;B=BB;k1,l1=size(A);k2,l2=size(B);w,y0=fisher(AA,BB);for i=1:l1 x=A(1,i); y=A(2,i);%x是身高,y是體重 plot(x,y,R.); hold onendfor i=1:l2 x=B(1,i); y=B(2,i); plot(x,y,G.); hold onEnda1=min(A(1,:);%男生身高最小值a2=max(A(1,:);%男生身高最大值b1=min(B(1,:);%女生身高最小值b2=max(B(1,:);%女生身高最大值a3=min(A(2,:);%男生體重最小值a4=max(A(2,:);%男生體重最大值b3=min(B(2,:);%女生體重最小值b4=max(B(2,:);%女生體重最大值 if a1b2 b=a2;else b=b2;%b是所有人中身高最大值endFisher分類(lèi)器畫(huà)圖if a3b4 d=a4;else d=b4;%d為所有人中體重最大值endx=a:0.01:b;y=(y0-x*w(1,1)/w(2,1);plot(x,y,B);hold on;%身高體重相關(guān),判別測(cè)試樣本%手動(dòng)先驗(yàn)概率P1=0.5;P2=0.5;FA=B;MA=A;a=cov(FA)*(length(FA)-1)/length(FA);b=cov(MA)*(length(MA)-1)/length(MA);W1=-1/2*inv(a);W2=-1/2*inv(b);Ave1=(sum(FA)/length(FA);Ave2=(sum(MA)/length(MA);w1=inv(a)*Ave1;w2=inv(b)*Ave2;w10=-1/2*Ave1*inv(a)*Ave1-1/2*log(det(a)+log(P1);w20=-1/2*Ave2*inv(b)*Ave2-1/2*log(det(b)+log(P2); syms x ; syms y ; h=x y; h1=h*W1*h+w1*h+w10; h2=h*W2*h+w2*h+w20 ; h=h1-h2; ezplot(h,130,200,30,100)Fisher方法求分界線(xiàn)clcclear all;load FEMALE.txt;load MALE.txt;FEMALE=FEMALE; %特征為列向量MALE=MALE;fid=fopen(dataset3.txt,r); test1=fscanf(fid,%f %f %s,3,inf);test=test1;fclose(fid);FS=0 0;0 0;MS=0 0;0 0;Fmean = mean(FEMALE);Mmean = mean(MALE);figure;for i=1:16FS1=(FEMALE(:,i)-Fmean)*(FEMALE(:,i)-Fmean);MS2=(MALE(:,i)-Mmean)*(MALE(:,i)-Mmean);FS = FS1+FS;MS = MS2+MSend; SW=FS+MS;Sb=(Fmean-Mmean)*(Fmean-Mmean);w=inv(SW)*(Fmean-Mmean);mu1=w*Fmean;mu2=w*Mmean;b=(mu1+mu2)/2;for i=1:90 if (test(i,3)=102)plot(test(i,1),test(i,2),r+); end; if (test(i,3)=109) plot(test(i,1),test(i,2),k*); end; hold on;end;x=test(:,1); y=(b-w(1,1)*x)/w(2,1);plot(x,y);title(Fisher方法求分界線(xiàn));xlabel(身高(cm),ylabel(體重(kg)Bayes(貝葉斯)判別性別時(shí)的概率分類(lèi)線(xiàn)clcclear all;X=120:0.1:200pw1=0.5;pw2=0.5sample1=textread(FEMALE.txt)samplew1=zeros(1,length(sample1(:,1);u1=mean(sample1(:,1);m1=std(sample1(:,1);y1=normpdf(X,u1,m1);figure(1);subplot(2,1,1);plot(X,y1);title(身高條件先驗(yàn)概率);hold onsample2=textread(MALE.txt)samplew2=zeros(1,length(sample2(:,1)u2=mean(sample2(:,1);m2=std(sample2(:,1);y2=normpdf(X,u2,m2);subplot(2,1,2);plot(X,y2);D=(pw1*y1+pw2*y2)E1=pw1*y1;E2=pw2*y2P1=E1./DP2=E2./Dfigure(2)subplot(2,1,1);plot(X,P1);title(身高條件后驗(yàn)概率)subplot(2,1,2);plot(X,P2);title(最小風(fēng)險(xiǎn)bayes概率分布曲線(xiàn));figure(3)subplot(3,1,1);plot(X,E1)subplot(3,1,2);plot(X,E2)subplot(3,1,3);plot(X,E1,X,E2)sample=textread(all sample.txt)result=bayes(sample1(:,1),sample2(:,1),pw1,pw2)實(shí)驗(yàn)原理實(shí)驗(yàn)思路1.得到fisher函數(shù)和分界線(xiàn)選擇合適的樣本和對(duì)應(yīng)的先驗(yàn)概率,然后運(yùn)用到測(cè)試樣本中。(1) 先選擇相應(yīng)的概率分布P0.5p0.5對(duì)328個(gè)樣本進(jìn)行分析(2) 先選擇相應(yīng)的概率分布P0.5p0.5對(duì)90個(gè)樣本進(jìn)行分析(3) 得到fisher分類(lèi)線(xiàn)2.將bayes方法得到的概率分布曲線(xiàn)和fisher分界線(xiàn)放在一起比較,觀察其中的容錯(cuò)分析。將fisher分界線(xiàn)和bayes概率分布線(xiàn)放在一起比較,從概率分布曲線(xiàn)得到概率分布的重合部分看出易錯(cuò)的部分。代碼來(lái)源:Fisher的第一個(gè)分類(lèi)器是在網(wǎng)上找的,fisher匪類(lèi)起的第二個(gè)程序是自己改編的,里面沒(méi)有女生畫(huà)出來(lái)的那一個(gè)分界線(xiàn)。Bayes的男生女生概率分布曲線(xiàn)分類(lèi)器是在網(wǎng)上搜索的代碼。求各類(lèi)樣本均值向量求類(lèi)內(nèi)離散度矩陣用公式求最好的變換向量二維空間向一維y空間投影一維空間樣本均值求取閾值決策判斷計(jì)算各類(lèi)樣本的錯(cuò)誤率 導(dǎo)入兩個(gè)訓(xùn)練樣本集依次將女生樣本集中的每一個(gè)樣本當(dāng)做測(cè)試集,余下的所有樣本做訓(xùn)練集用Fisher法判斷被選出來(lái)的樣本,若判斷錯(cuò)誤,計(jì)數(shù)一次將男生按照以上方法再進(jìn)行判別,計(jì)數(shù),得到錯(cuò)誤率再將以上方法用以測(cè)試集,得到錯(cuò)誤率實(shí)驗(yàn)結(jié)果分析根據(jù)樣本得到的fisher分界線(xiàn)樣本為328時(shí)的錯(cuò)誤率分析:樣本為90時(shí)的錯(cuò)誤率分析 身高和體重相關(guān)時(shí)的bayes(貝葉斯)判別性別時(shí)的分類(lèi)線(xiàn)身高條件先驗(yàn)概率分布曲線(xiàn)身高條件后驗(yàn)概率分布曲線(xiàn)最小風(fēng)險(xiǎn)時(shí)bayes分類(lèi)器概率分布曲線(xiàn)根據(jù)樣本得到的fisher分界線(xiàn)最小風(fēng)險(xiǎn)時(shí)bayes分類(lèi)器概率分布曲線(xiàn)結(jié)果分析;由兩個(gè)圖可以看出,由fisher分類(lèi)法得到的錯(cuò)誤率比bayes的錯(cuò)誤率低很多,但是當(dāng)樣本的數(shù)據(jù)分布不均時(shí),使用fisher分類(lèi)法得到的錯(cuò)誤率會(huì)比bayes分類(lèi)法得到的錯(cuò)誤率高。所以可以根據(jù)合適的樣本數(shù)據(jù)選擇兩種方法進(jìn)行比較,選出比較合適的方法。年級(jí)2012級(jí)學(xué)號(hào)20122138552012213875專(zhuān)業(yè)智能科學(xué)與技術(shù)姓名徐燦馬卿實(shí)驗(yàn)時(shí)間2014.11.8實(shí)驗(yàn)地點(diǎn)9#206實(shí)驗(yàn)名稱(chēng)用身高/體重?cái)?shù)據(jù)進(jìn)行性別分類(lèi)的實(shí)驗(yàn)(三)實(shí)驗(yàn)類(lèi)型設(shè)計(jì)型綜合型創(chuàng)新型實(shí)驗(yàn)?zāi)康幕蛞?基本要求: 用*_FAMALE_*.TXT、*_MALE_*.TXT的數(shù)據(jù)作為本次實(shí)驗(yàn)使用的樣本集,利用C 均值和分級(jí)聚類(lèi)方法對(duì)樣本集進(jìn)行聚類(lèi)分析,對(duì)結(jié)果進(jìn)行分析,從而加深對(duì)所學(xué)內(nèi)容的理解和感性認(rèn)識(shí)。 具體做法: 1 把實(shí)驗(yàn)數(shù)據(jù)文件中任意兩個(gè)*_FAMALE_*.TXT 和*_MALE_*.TXT 兩個(gè)文件合并成一個(gè)(實(shí)驗(yàn)報(bào)告中應(yīng)指明具體是采用那個(gè)數(shù)據(jù)文件進(jìn)行的實(shí)驗(yàn)),同時(shí)采用身高和體重?cái)?shù)據(jù)作為特征,設(shè)類(lèi)別數(shù)為2,利用C 均值聚類(lèi)方法對(duì)數(shù)據(jù)進(jìn)行聚類(lèi),并將聚類(lèi)結(jié)果表示在二維平面上。嘗試不同初始值對(duì)此數(shù)據(jù)集是否會(huì)造成不同的結(jié)果。 2 (選做)對(duì)1 中的數(shù)據(jù)利用C 均值聚類(lèi)方法分別進(jìn)行三類(lèi)、四類(lèi)、五類(lèi)聚類(lèi),畫(huà)出聚類(lèi)指標(biāo)與類(lèi)別數(shù)之間的關(guān)系曲線(xiàn),探討是否可以確定出合理的類(lèi)別數(shù)目。 3 (選做)利用某兩個(gè)*_FAMALE_*.TXT 和*_MALE_*.TXT的文件數(shù)據(jù),與把全部數(shù)據(jù)文件相應(yīng)合并在一起,重復(fù)上述各實(shí)驗(yàn),考察結(jié)果是否有變化,對(duì)觀察到的現(xiàn)象進(jìn)行分析,寫(xiě)出體會(huì)。 需要用到的數(shù)據(jù)文件: PR_Exp3_Data_FAMALE_1.txt PR_Exp3_Data_MALE_2.txt PR_Exp3_Data_FAMALE_3.txt PR_Exp3_Data_MALE_4.txtPR_Exp3_Data_FAMALE_5.txt PR_Exp3_Data_MALE_5.txt實(shí)驗(yàn)原理clc;clear all;FH FW=textread(FEMALE.txt,%f %f); %讀取合并的數(shù)據(jù)MH MW=textread(MALE.txt,%f %f);FA=FH FW;FA=FA;MA=MH MW;MA=MA;for k=1:134 %數(shù)據(jù)里面男生人數(shù) NT(:,k)=FA(:,k)end for k=135:542 %數(shù)據(jù)里面女生人數(shù) NT(:,k)=MA(:,k-134); end z1=NT(:,1);z2=NT(:,135); for k=1:542 %數(shù)據(jù)里面總?cè)藬?shù) a=z1,b=z2 G1=zeros(2,100);G2=zeros(2,100); for i=1:542 d1=sqrt(NT(1,i)-z1(1,1)2+(NT(2,i)-z1(2,1)2); d2=sqrt(NT(1,i)-z2(1,1)2+(NT(2,i)-z2(2,1)2); if d1d2 G1(:,i)=NT(:,i); else G2(:,i)=NT(:,i); end end G1(:,find(sum(abs(G1),1)=0)=; G2(:,find(sum(abs(G2),1)=0)=; z1=mean(G1,2); z2=mean(G2,2);if isequal(a,z1)=1&isequal(z2,b)=1 break end end z1,z2,G1,G2,size(G1,2),size(G2,2)for i=1:size(G1,2) %標(biāo)記男生的點(diǎn)x=G1(1,i);y=G1(2,i);plot(x,y,m*);hold on end for i=1:size(G2,2) %標(biāo)記女生的點(diǎn)x=G2(1,i);y=G2(2,i);plot(x,y,co);hold on endplot(z1(1,1),z1(2,1),B+) %標(biāo)記男生的均值類(lèi)聚hold onplot(z2(1,1),z2(2,1),B+) %標(biāo)記女生的均值類(lèi)聚hold on實(shí)驗(yàn)原理代碼來(lái)源:C 均值聚類(lèi)的代碼是在網(wǎng)上搜索的,然后所有的代碼都是根據(jù)源代碼更改的。后面的樣本整合是把所有的樣本整合在一起分成男生女生兩類(lèi)。自己畫(huà)了一個(gè)關(guān)于男生女生的身高體重的關(guān)系圖,然后整體得到的均值點(diǎn)在關(guān)系線(xiàn)上。實(shí)驗(yàn)結(jié)果分析心得體會(huì)使用數(shù)據(jù)一二得到的C值分聚類(lèi) (165.2348,53.5303) (176.5255,70.1633)使用數(shù)據(jù)三四得到的C值分聚類(lèi)(162.50,51.6979)(175.3158,66.7039)使用數(shù)據(jù)五六得到的C值分聚類(lèi)(168.3023,54.9651)(177.4894,70.7021)使用6組數(shù)據(jù)得到的C值分聚類(lèi)使用數(shù)據(jù)123456合并得到的C值分聚類(lèi)( 165.7438,53.8512)(176.6767, 70.0783)實(shí)驗(yàn)三第3小題分析額為接近平均水平。取值樣本越多時(shí),整體的聚類(lèi)點(diǎn)越為接近平均水平。,組數(shù)據(jù)表現(xiàn)出身高與體重呈現(xiàn)一定的關(guān)系,當(dāng)所有的樣本聚集起來(lái)之后,可以發(fā)現(xiàn)最后得到的聚類(lèi)點(diǎn)在前面的三在這個(gè)關(guān)系之上更是前面三個(gè)樣本的聚類(lèi)點(diǎn)的平均點(diǎn)。所以當(dāng)樣本數(shù)據(jù)越龐大時(shí),越能得到正確的結(jié)果。成績(jī)?cè)u(píng)定教師簽名: 年 月 日心得體會(huì)成績(jī)?cè)u(píng)定教師簽名: 年 月 日心得體會(huì)成績(jī)?cè)u(píng)定教師簽名: 年 月 日- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開(kāi)word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 模式識(shí)別 實(shí)驗(yàn) 報(bào)告
鏈接地址:http://italysoccerbets.com/p-9101635.html