《模式識(shí)別實(shí)驗(yàn)報(bào)告.doc》由會(huì)員分享,可在線閱讀,更多相關(guān)《模式識(shí)別實(shí)驗(yàn)報(bào)告.doc(41頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
院 系: 計(jì)算機(jī)科學(xué)學(xué)院
專 業(yè): 智能科學(xué)與技術(shù)
年 級(jí): 2012 級(jí)
課程名稱: 模式識(shí)別
組 號(hào): 13組
組 員: 徐燦 馬卿
指導(dǎo)教師: 孫陽(yáng)光老師
2014年12月30日
年級(jí)
2012級(jí)
學(xué)號(hào)
2012213855
2012213875
專業(yè)
智能科學(xué)
與技術(shù)
姓名
徐燦
馬卿
實(shí)驗(yàn)時(shí)間
2014.10.8
實(shí)驗(yàn)地點(diǎn)
9#206
實(shí)驗(yàn)
名稱
用身高和/或體重?cái)?shù)據(jù)進(jìn)行性別分類的實(shí)驗(yàn)
實(shí)驗(yàn)
類型
設(shè)計(jì)型
綜合型
創(chuàng)新型
√
實(shí)
驗(yàn)
目
的
或
要
求
基本要求:
用PR_Exp1_Data_1.TXT 和PR_Exp1_Data_2.TXT 的數(shù)據(jù)作為訓(xùn)練樣本集,建立Bayes 分類器,用PR_Exp1_Data_3.TXT測(cè)試樣本數(shù)據(jù)對(duì)該分類器進(jìn)行測(cè)試。調(diào)整特征、分類器等方面的一些因素,考察它們對(duì)分類器性能的影響,從而加深對(duì)所學(xué)內(nèi)容的理解和感性認(rèn)識(shí)。
具體做法:
1. 應(yīng)用單個(gè)特征進(jìn)行實(shí)驗(yàn):以(a)身高或者(b)體重?cái)?shù)據(jù)作為特征,在正態(tài)
分布假設(shè)下利用最大似然法或者貝葉斯估計(jì)法估計(jì)分布密度參數(shù)(只利用訓(xùn)
練數(shù)據(jù)估計(jì)密度),建立最小錯(cuò)誤率Bayes 分類器,寫出得到的決策規(guī)則,將
該分類器應(yīng)用到測(cè)試樣本,考察測(cè)試錯(cuò)誤情況。在分類器設(shè)計(jì)時(shí)可以考察采
用不同先驗(yàn)概率(如0.5 對(duì)0.5, 0.75 對(duì)0.25, 0.9 對(duì)0.1 等)進(jìn)行實(shí)驗(yàn),考察對(duì)
決策規(guī)則和錯(cuò)誤率的影響。
2. 應(yīng)用兩個(gè)特征進(jìn)行實(shí)驗(yàn):同時(shí)采用身高和體重?cái)?shù)據(jù)作為特征,分別假設(shè)二者
相關(guān)或不相關(guān),在正態(tài)分布假設(shè)下估計(jì)概率密度,建立最小錯(cuò)誤率Bayes 分
類器,寫出得到的決策規(guī)則,將該分類器應(yīng)用到訓(xùn)練/測(cè)試樣本,考察訓(xùn)練/
測(cè)試錯(cuò)誤情況。比較相關(guān)假設(shè)和不相關(guān)假設(shè)下結(jié)果的差異。在分類器設(shè)計(jì)時(shí)
可以考察采用不同先驗(yàn)概率(如0.5 vs. 0.5, 0.75 vs. 0.25, 0.9 vs. 0.1 等)進(jìn)行
實(shí)驗(yàn),考察對(duì)決策和錯(cuò)誤率的影響。
3. 自行給出一個(gè)決策表,采用最小風(fēng)險(xiǎn)的Bayes 決策重復(fù)上面的某個(gè)或全部實(shí)
驗(yàn)。
需要用到的數(shù)據(jù)文件:
訓(xùn)練和測(cè)試樣本集:
PR_Exp1_Data_1.txt
124 個(gè)同學(xué)的身高、體重、性別數(shù)據(jù)(40 個(gè)女生、84 個(gè)男生)
PR_Exp1_Data_2.txt
328 個(gè)同學(xué)的身高、體重、性別數(shù)據(jù)(78 個(gè)女生、250 個(gè)男生)
PR_Exp1_Data_3.txt
90 個(gè)同學(xué)的身高、體重、性別數(shù)據(jù)(16 個(gè)女生、74 個(gè)男生)
實(shí)
驗(yàn)
代
碼
(
身
高
或
者
體
重
)
clear all;
load datasetf1.txt; %讀入樣本數(shù)據(jù)男生
load datasetm1.txt; %讀入樣本數(shù)據(jù)女生
%樣本的分析
figure;
for i=1:250
if(i<79)
plot(datasetf1(i,2),datasetf1(i,1),r+);
end
plot(datasetm1(i,2),datasetm1(i,1),k*);
hold on;
end
title(樣本數(shù)據(jù));
xlabel(體重(Kg)),ylabel(身高(cm));
legend(男生,女生);
%打開文件(測(cè)試文件和訓(xùn)練文件)此處選擇文件為第三組測(cè)試文件
fid=fopen(dataset3.txt,r);
test1=fscanf(fid,%f %f %s,[3,inf]);%文件讀取格式
test=test1;
fclose(fid);
Fmean = mean(datasetf1);
Mmean = mean(datasetm1);
Fvar = std(datasetf1);
Mvar = std(datasetm1);
preF = 0.5; %先驗(yàn)概率的設(shè)定和修改
preM = 0.5;
error = 0;
Nerror = 0; %錯(cuò)誤個(gè)數(shù)和錯(cuò)誤率的設(shè)定
%身高的決策
sprintf(%s,樣本數(shù)為90時(shí)P0.5——0.5:) %測(cè)試或者訓(xùn)練樣本的個(gè)數(shù)
figure;
for i = 1:90 %測(cè)試或者訓(xùn)練樣本的個(gè)數(shù)
PFheight = normpdf(test(i,1),Fmean(1,1),Fvar(1,1)) ; %得到男生身高的數(shù)據(jù)
PMheight = normpdf(test(i,1),Mmean(1,1),Mvar(1,1)) ; %得到女生身高的數(shù)據(jù)
pFemale = preF*PFheight;
pMale = preM*PMheight;
if(pFemale
0?
X∈女生2
實(shí)
驗(yàn)
結(jié)
果
分
析
樣本分析的圖像(此處把數(shù)據(jù)改成兩類,男生的單獨(dú)為一個(gè)文件,女生的單獨(dú)為一個(gè)文件)
P0.5-P0.5時(shí)328個(gè)樣本的錯(cuò)誤率分析
P0.5-P0.5時(shí)124個(gè)樣本的錯(cuò)誤率分析
P0.75-P0.25時(shí)328個(gè)樣本的錯(cuò)誤率分析
P0.75-P0.25時(shí)124個(gè)樣本的錯(cuò)誤率分析
P0.9-P0.1時(shí)328個(gè)樣本的錯(cuò)誤率分析
P0.9-P0.1時(shí)124個(gè)樣本的錯(cuò)誤率分析
表格 1身高和體重單獨(dú)下各樣本下各種概率的錯(cuò)誤率分析
樣本
概率為
P0.5--P0.5
誤差概率
概率
P 0.75—P0.25
誤差概率
概率
P 0.9—P0.1
誤差概率
328
個(gè)樣本
身高
錯(cuò)誤個(gè)數(shù): 33
錯(cuò)誤率為: 10.06%
錯(cuò)誤個(gè)數(shù): 60
錯(cuò)誤率為: 18.29%
錯(cuò)誤個(gè)數(shù): 81
錯(cuò)誤率為: 24.70%
體重
錯(cuò)誤個(gè)數(shù): 45
錯(cuò)誤率為: 13.72%
錯(cuò)誤個(gè)數(shù): 68
錯(cuò)誤率為: 20.73%
錯(cuò)誤個(gè)數(shù): 89
錯(cuò)誤率為: 27.13%
124
個(gè)樣本
身高
錯(cuò)誤個(gè)數(shù): 16
錯(cuò)誤率為: 12.90%
錯(cuò)誤個(gè)數(shù): 31
錯(cuò)誤率為: 25.00%
錯(cuò)誤個(gè)數(shù): 34
錯(cuò)誤率為: 27.42%
體重
錯(cuò)誤個(gè)數(shù): 21
錯(cuò)誤率為: 16.94%
錯(cuò)誤個(gè)數(shù): 35
錯(cuò)誤率為: 28.23%
錯(cuò)誤個(gè)數(shù): 37
錯(cuò)誤率為: 29.84%
根據(jù)表格內(nèi)容,選擇P0.5——P0.5時(shí)的概率對(duì)樣本3進(jìn)行分析,得到的結(jié)果
以身高乘以體重的算法來計(jì)算錯(cuò)誤率分類時(shí)的結(jié)果
P0.5-P0.5時(shí)328個(gè)樣本的錯(cuò)誤率分析
P0.5-P0.5時(shí)124個(gè)樣本的錯(cuò)誤率分析
P0.75-P0.25時(shí)328個(gè)樣本的錯(cuò)誤率分析
P0.75-P0.25時(shí)124個(gè)樣本的錯(cuò)誤率分析
P0.9-P0.1時(shí)328個(gè)樣本的錯(cuò)誤率分析
P0.9-P0.1時(shí)124個(gè)樣本的錯(cuò)誤率分析
表格 2身高和體重乘積下各樣本下各種概率的錯(cuò)誤率分析
樣本
概率為P0.5—P0.5時(shí)的身高體重錯(cuò)誤率
概率為P0.75—P0.25時(shí)的身高體重錯(cuò)誤率
概率為P0.9—P0.1時(shí)的身高體重錯(cuò)誤率
樣本為328時(shí)
分類錯(cuò)誤個(gè)數(shù): 30
分類錯(cuò)誤率為: 9.15%
分類錯(cuò)誤個(gè)數(shù): 37
分類錯(cuò)誤率為: 11.28%
分類錯(cuò)誤個(gè)數(shù): 49
分類錯(cuò)誤率為: 14.94%
樣本為124時(shí)
分類錯(cuò)誤個(gè)數(shù): 17
分類錯(cuò)誤率為: 13.71%
分類錯(cuò)誤個(gè)數(shù): 19分類錯(cuò)誤率為: 15.32%
分類錯(cuò)誤個(gè)數(shù): 23
分類錯(cuò)誤率為: 18.55%
根據(jù)表格內(nèi)容,選擇P0.5——P0.5時(shí)的概率對(duì)樣本3進(jìn)行分析,得到的結(jié)果
年級(jí)
2012級(jí)
學(xué)號(hào)
2012213855
2012213875
專業(yè)
智能科學(xué)與技術(shù)
姓名
徐燦
馬卿
實(shí)驗(yàn)時(shí)間
2014.11.8
實(shí)驗(yàn)地點(diǎn)
9#206
實(shí)驗(yàn)
名稱
用身高/體重?cái)?shù)據(jù)進(jìn)行性別分類的實(shí)驗(yàn)(二)
實(shí)驗(yàn)
類型
設(shè)計(jì)型
綜合型
創(chuàng)新型
√
實(shí)
驗(yàn)
目
的
或
要
求
基本要求:
_試驗(yàn)利用Fisher線性判別方法獲取分類器。
_試驗(yàn)直接設(shè)計(jì)線性分類器的方法,與基于概率密度估計(jì)的貝葉斯分離器進(jìn)行
比較。
具體做法:
1.同時(shí)采用身高和體重?cái)?shù)據(jù)作為特征,用Fisher線性判別方法求分類器,將該分類器應(yīng)用到訓(xùn)練和測(cè)試樣本,考察訓(xùn)練和測(cè)試錯(cuò)誤情況。
2.將訓(xùn)練樣本和求得的決策邊界畫到圖上,同時(shí)把以往用Bayes方法求得的分類器也畫到圖上,比較結(jié)果的異同。
需要用到的數(shù)據(jù)文件:
訓(xùn)練樣本集:
PR_Exp2_Data_1.txtPR_Exp2_Data_2.txtPR_Exp2_Data_3.txt
PR_Exp2_Data_4.txtPR_Exp2_Data_5.txtPR_Exp2_Data_6.txt
測(cè)試樣本集:
實(shí)驗(yàn)(一)中的樣本集。
要求:
參見實(shí)驗(yàn)(一)。
Fisher
線
性
判
別
函
數(shù)
%用fisher線性判別函數(shù)來判斷
clc
clear all
[filename,pathname,filterindex] = uigetfile(FEMALE.txt, 請(qǐng)讀入男生訓(xùn)練集);
fileAddrs = [pathname,filename];
[A1 A2]=textread(fileAddrs,%f%f);
[filename,pathname,filterindex] = uigetfile(MALE.txt, 請(qǐng)讀入女生訓(xùn)練集);
fileAddrs = [pathname,filename];
[B1 B2]=textread(fileAddrs,%f%f);
AA=[A1 A2];
BB=[B1 B2];
[w,y0]=fisher(AA,BB);
wT=w;
girl=0;
boy=0;
bad=0;
errorgirl=0;
errorboy=0;
error=0;
errorgirlrate=0;
errorboyrate=0;
errorrate=0;
Fisher
線
性
判
別
函
數(shù)
(
樣
本
數(shù)
為
90
時(shí)
的
判
斷
和
錯(cuò)
誤
率
分
析
)
%以測(cè)試數(shù)據(jù)為90的樣本為例子
[filename,pathname,filterindex] = uigetfile(dataset3.txt, 請(qǐng)讀入測(cè)試集);
fileAddrs = [pathname,filename];
[T1 T2]=textread(fileAddrs,%f%f%*s);
TT=[T1 T2];T=TT;
[k3 l3]=size(T);
for k=1:16
y(k)=wT*T(:,k);
if y(k)y0
girl=girl+1;
end
end
end
for k=16:90
y(k)=wT*T(:,k);
if y(k)y0
errorboy=errorboy+1;
bad=bad+1;
end
end
end
errorgirl
errorboy
bad
girl=errorboy+girl
boy=boy+errorgirl
error=errorgirl+errorboy
errorgirlrate=errorgirl/16
errorboyrate=errorboy/74
errorrate=error/90
調(diào)
用
函
數(shù)
%用fisher線性判別法求閾值的調(diào)用函數(shù)
function [w,y0]=fisher(AA,BB)
A=AA;
B=BB;
[k1,l1]=size(A);
[k2,l2]=size(B);
M1=sum(AA);
M1=M1;
M1=M1/l1;%男生均值向量
M2=sum(BB);
M2=M2;
M2=M2/l2;%女生均值向量
S1=zeros(k1,k1);%建立矩陣
S2=zeros(k2,k2);
for i=1:l1
S1=S1+(A(:,i)-M1)*((A(:,i)-M1).);%男生的類內(nèi)離散度矩陣
end
for i=1:l2
S2=S2+(B(:,i)-M2)*((B(:,i)-M2).);%女生的類內(nèi)離散度矩陣
end
Sw=0.5*S1+0.5*S2;%總類內(nèi)離散度矩陣,先驗(yàn)概率0.5
w=inv(Sw)*(M1-M2);%兩列
wT=w;%wT就是使Fisher準(zhǔn)則函數(shù)JF(w)取極大值時(shí)的解,也就是d維X空間到1維Y空間的最好的投影方向
for i=1:l1
Y1(i)=wT(1,1)*A(1,i)+wT(1,2)*A(2,i);%求出二維男生樣本集映射到一維時(shí)的量
end
for i=1:l2
Y2(i)=wT(1,1)*B(1,i)+wT(1,2)*B(2,i);%求出二維女生樣本集映射到一維時(shí)的量
end
m1=sum(Y1)/l1;
m2=sum(Y2)/l2;
y0=(l1*m1+l2*m2)/(l1+l2);%
function value=classify_CH(x,y,w,y0)
%程序:模式識(shí)別
%功能:應(yīng)用Fisher準(zhǔn)則判斷一個(gè)身高體重二維數(shù)據(jù)的性別
vector=[x;y];
yy=(w.)*vector;
if yy>y0
value=2;%表示樣本是男生
else
value=1;%表示樣本是女生
end
Fisher
分
類
器
畫
圖
%fisher分類器畫圖
[filename,pathname,filterindex] = uigetfile(datasetf1*.txt, 請(qǐng)讀入男生訓(xùn)練集);
fileAddrs = [pathname,filename];
[A1 A2]=textread(fileAddrs,%f%f);
[filename,pathname,filterindex] = uigetfile(datasetm1*.txt, 請(qǐng)讀入女生訓(xùn)練集);
fileAddrs = [pathname,filename];
[B1 B2]=textread(fileAddrs,%f%f);
AA=[A1 A2];
BB=[B1 B2];
A=AA;
B=BB;
[k1,l1]=size(A);
[k2,l2]=size(B);
[w,y0]=fisher(AA,BB);
for i=1:l1
x=A(1,i);
y=A(2,i);%x是身高,y是體重
plot(x,y,R.);
hold on
end
for i=1:l2
x=B(1,i);
y=B(2,i);
plot(x,y,G.);
hold on
End
a1=min(A(1,:));%男生身高最小值
a2=max(A(1,:));%男生身高最大值
b1=min(B(1,:));%女生身高最小值
b2=max(B(1,:));%女生身高最大值
a3=min(A(2,:));%男生體重最小值
a4=max(A(2,:));%男生體重最大值
b3=min(B(2,:));%女生體重最小值
b4=max(B(2,:));%女生體重最大值
if a1b2
b=a2;
else
b=b2;%b是所有人中身高最大值
end
Fisher
分
類
器
畫
圖
if a3b4
d=a4;
else
d=b4;%d為所有人中體重最大值
end
x=a:0.01:b;
y=(y0-x*w(1,1))/w(2,1);
plot(x,y,B);
hold on;
%身高體重相關(guān),判別測(cè)試樣本
%手動(dòng)先驗(yàn)概率
P1=0.5;
P2=0.5;
FA=B;
MA=A;
a=cov(FA)*(length(FA)-1)/length(FA);
b=cov(MA)*(length(MA)-1)/length(MA);
W1=-1/2*inv(a);
W2=-1/2*inv(b);
Ave1=(sum(FA)/length(FA));
Ave2=(sum(MA)/length(MA));
w1=inv(a)*Ave1;
w2=inv(b)*Ave2;
w10=-1/2*Ave1*inv(a)*Ave1-1/2*log(det(a))+log(P1);
w20=-1/2*Ave2*inv(b)*Ave2-1/2*log(det(b))+log(P2);
syms x ;
syms y ;
h=[x y];
h1=h*W1*h+w1*h+w10;
h2=h*W2*h+w2*h+w20 ;
h=h1-h2;
ezplot(h,[130,200,30,100])
Fisher方
法
求
分
界
線
clc
clear all;
load FEMALE.txt;
load MALE.txt;
FEMALE=FEMALE; %特征為列向量
MALE=MALE;
fid=fopen(dataset3.txt,r);
test1=fscanf(fid,%f %f %s,[3,inf]);
test=test1;
fclose(fid);
FS=[0 0;0 0];
MS=[0 0;0 0];
Fmean = mean(FEMALE);
Mmean = mean(MALE);
figure;
for i=1:16
FS1=(FEMALE(:,i)-Fmean)*(FEMALE(:,i)-Fmean);
MS2=(MALE(:,i)-Mmean)*(MALE(:,i)-Mmean);
FS = FS1+FS;
MS = MS2+MS
end;
SW=FS+MS;
Sb=(Fmean-Mmean)*(Fmean-Mmean);
w=inv(SW)*(Fmean-Mmean);
mu1=w*Fmean;
mu2=w*Mmean;
b=(mu1+mu2)/2;
for i=1:90
if (test(i,3)==102)
plot(test(i,1),test(i,2),r+);
end;
if (test(i,3)==109)
plot(test(i,1),test(i,2),k*);
end;
hold on;
end;
x=test(:,1);
y=(b-w(1,1)*x)/w(2,1);
plot(x,y);
title(Fisher方法求分界線);
xlabel(身高(cm)),ylabel(體重(kg))
Bayes
(
貝
葉
斯
)
判
別
性
別
時(shí)
的
概
率
分
類
線
clc
clear all;
X=120:0.1:200
pw1=0.5;
pw2=0.5
sample1=textread(FEMALE.txt)
samplew1=zeros(1,length(sample1(:,1)));
u1=mean(sample1(:,1));
m1=std(sample1(:,1));
y1=normpdf(X,u1,m1);
figure(1);
subplot(2,1,1);
plot(X,y1);
title(身高條件先驗(yàn)概率);
hold on
sample2=textread(MALE.txt)
samplew2=zeros(1,length(sample2(:,1)))
u2=mean(sample2(:,1));
m2=std(sample2(:,1));
y2=normpdf(X,u2,m2);
subplot(2,1,2);
plot(X,y2);
D=(pw1*y1+pw2*y2)
E1=pw1*y1;
E2=pw2*y2
P1=E1./D
P2=E2./D
figure(2)
subplot(2,1,1);
plot(X,P1);
title(身高條件后驗(yàn)概率)
subplot(2,1,2);
plot(X,P2);
title(最小風(fēng)險(xiǎn)bayes概率分布曲線);
figure(3)
subplot(3,1,1);
plot(X,E1)
subplot(3,1,2);
plot(X,E2)
subplot(3,1,3);
plot(X,E1,X,E2)
sample=textread(all sample.txt)
[result]=bayes(sample1(:,1),sample2(:,1),pw1,pw2)
實(shí)
驗(yàn)
原
理
實(shí)驗(yàn)思路
1.得到fisher函數(shù)和分界線
選擇合適的樣本和對(duì)應(yīng)的先驗(yàn)概率,然后運(yùn)用到測(cè)試樣本中。
(1) 先選擇相應(yīng)的概率分布P0.5—p0.5對(duì)328個(gè)樣本進(jìn)行分析
(2) 先選擇相應(yīng)的概率分布P0.5—p0.5對(duì)90個(gè)樣本進(jìn)行分析
(3) 得到fisher分類線
2.將bayes方法得到的概率分布曲線和fisher分界線放在一起比較,觀察其中的容錯(cuò)分析。
將fisher分界線和bayes概率分布線放在一起比較,從概率分布曲線得到概率分布的重合部分看出易錯(cuò)的部分。
代碼來源:
Fisher的第一個(gè)分類器是在網(wǎng)上找的,fisher匪類起的第二個(gè)程序是自己改編的,里面沒有女生畫出來的那一個(gè)分界線。
Bayes的男生女生概率分布曲線分類器是在網(wǎng)上搜索的代碼。
求各類樣本均值向量
求類內(nèi)離散度矩陣
用公式求最好的變換向量
二維空間向一維y空間投影
一維空間樣本均值
求取閾值
決策判斷
計(jì)算各類樣本的錯(cuò)誤率
導(dǎo)入兩個(gè)訓(xùn)練樣本集
依次將女生樣本集中的每一個(gè)樣本當(dāng)
做測(cè)試集,余下的所有樣本做訓(xùn)練集
用Fisher法判斷被選出來的樣本,若判斷錯(cuò)誤,計(jì)數(shù)一次
將男生按照以上方法再進(jìn)行
判別,計(jì)數(shù),得到錯(cuò)誤率
再將以上方法用以測(cè)試集,得到錯(cuò)誤率
實(shí)
驗(yàn)
結(jié)
果
分
析
根據(jù)樣本得到的fisher分界線
樣本為328時(shí)的錯(cuò)誤率分析:
樣本為90時(shí)的錯(cuò)誤率分析
身高和體重相關(guān)時(shí)的bayes(貝葉斯)判別性別時(shí)的分類線
身高條件先驗(yàn)概率分布曲線
身高條件后驗(yàn)概率分布曲線
最小風(fēng)險(xiǎn)時(shí)bayes分類器概率分布曲線
根據(jù)樣本得到的fisher分界線
最小風(fēng)險(xiǎn)時(shí)bayes分類器概率分布曲線
結(jié)果分析;
由兩個(gè)圖可以看出,由fisher分類法得到的錯(cuò)誤率比bayes的錯(cuò)誤率低很多,但是當(dāng)樣本的數(shù)據(jù)分布不均時(shí),使用fisher分類法得到的錯(cuò)誤率會(huì)比bayes分類法得到的錯(cuò)誤率高。所以可以根據(jù)合適的樣本數(shù)據(jù)選擇兩種方法進(jìn)行比較,選出比較合適的方法。
年級(jí)
2012級(jí)
學(xué)號(hào)
2012213855
2012213875
專業(yè)
智能科學(xué)與技術(shù)
姓名
徐燦
馬卿
實(shí)驗(yàn)時(shí)間
2014.11.8
實(shí)驗(yàn)地點(diǎn)
9#206
實(shí)驗(yàn)
名稱
用身高/體重?cái)?shù)據(jù)進(jìn)行性別分類的實(shí)驗(yàn)(三)
實(shí)驗(yàn)
類型
設(shè)計(jì)型
綜合型
創(chuàng)新型
√
實(shí)
驗(yàn)
目
的
或
要
求
基本要求:
用*_FAMALE_*.TXT、*_MALE_*.TXT的數(shù)據(jù)作為本次實(shí)驗(yàn)使用的樣本集,利用C 均值和分級(jí)聚類方法對(duì)樣本集進(jìn)行聚類分析,對(duì)結(jié)果進(jìn)行分析,從而加深對(duì)所學(xué)內(nèi)容的理解和感性認(rèn)識(shí)。
具體做法:
1. 把實(shí)驗(yàn)數(shù)據(jù)文件中任意兩個(gè)*_FAMALE_*.TXT 和*_MALE_*.TXT 兩個(gè)文件合并成一個(gè)(實(shí)驗(yàn)報(bào)告中應(yīng)指明具體是采用那個(gè)數(shù)據(jù)文件進(jìn)行的實(shí)驗(yàn)),同時(shí)采用身高和體重?cái)?shù)據(jù)作為特征,設(shè)類別數(shù)為2,利用C 均值聚類方法對(duì)數(shù)據(jù)進(jìn)行聚類,并將聚類結(jié)果表示在二維平面上。嘗試不同初始值對(duì)此數(shù)據(jù)集是否會(huì)造成不同的結(jié)果。
2. (選做)對(duì)1 中的數(shù)據(jù)利用C 均值聚類方法分別進(jìn)行三類、四類、五類聚類,畫出聚類指標(biāo)與類別數(shù)之間的關(guān)系曲線,探討是否可以確定出合理的類別數(shù)目。
3. (選做)利用某兩個(gè)*_FAMALE_*.TXT 和*_MALE_*.TXT的文件數(shù)據(jù),與把全部數(shù)據(jù)文件相應(yīng)合并在一起,重復(fù)上述各實(shí)驗(yàn),考察結(jié)果是否有變化,對(duì)觀察到的現(xiàn)象進(jìn)行分析,寫出體會(huì)。
需要用到的數(shù)據(jù)文件:
PR_Exp3_Data_FAMALE_1.txt PR_Exp3_Data_MALE_2.txt
PR_Exp3_Data_FAMALE_3.txt PR_Exp3_Data_MALE_4.txt
PR_Exp3_Data_FAMALE_5.txt PR_Exp3_Data_MALE_5.txt
實(shí)
驗(yàn)
原
理
clc;
clear all;
[FH FW]=textread(‘FEMALE.txt’,’%f %f’); %讀取合并的數(shù)據(jù)
[MH MW]=textread(‘MALE.txt’,’%f %f’);
FA=[FH FW];FA=FA’;
MA=[MH MW];MA=MA’;
for k=1:134 %數(shù)據(jù)里面男生人數(shù)
NT(:,k)=FA(:,k)
end
for k=135:542 %數(shù)據(jù)里面女生人數(shù)
NT(:,k)=MA(:,k-134);
end
z1=NT(:,1);z2=NT(:,135);
for k=1:542 %數(shù)據(jù)里面總?cè)藬?shù)
a=z1,b=z2
G1=zeros(2,100);G2=zeros(2,100);
for i=1:542
d1=sqrt((NT(1,i)-z1(1,1))^2+(NT(2,i)-z1(2,1))^2);
d2=sqrt((NT(1,i)-z2(1,1))^2+(NT(2,i)-z2(2,1))^2);
if d1
下載提示(請(qǐng)認(rèn)真閱讀)
- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
文檔包含非法信息?點(diǎn)此舉報(bào)后獲取現(xiàn)金獎(jiǎng)勵(lì)!
下載文檔到電腦,查找使用更方便
9.9
積分
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
-
模式識(shí)別
實(shí)驗(yàn)
報(bào)告
- 溫馨提示:
1: 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
裝配圖網(wǎng)所有資源均是用戶自行上傳分享,僅供網(wǎng)友學(xué)習(xí)交流,未經(jīng)上傳用戶書面授權(quán),請(qǐng)勿作他用。
鏈接地址:http://italysoccerbets.com/p-9101635.html