《計算機系統(tǒng)結(jié)構(gòu)》往年考題答案

上傳人：奔*** 文檔編號：47886277 上傳時間：2021-12-25 格式：DOCX 頁數(shù)：17 大小：107.48KB

收藏版權(quán)申訴舉報下載

第1頁 / 共17頁

第2頁 / 共17頁

第3頁 / 共17頁

下載文檔到電腦，查找使用更方便

12 積分

下載資源

還剩頁未讀，繼續(xù)閱讀

資源描述：

《《計算機系統(tǒng)結(jié)構(gòu)》往年考題答案》由會員分享，可在線閱讀，更多相關(guān)《《計算機系統(tǒng)結(jié)構(gòu)》往年考題答案（17頁珍藏版）》請在裝配圖網(wǎng)上搜索。

1、計算機系統(tǒng)結(jié)構(gòu)往年考題參考答案僅供參考！一、簡答題L指令流水計算機中，采用獨立的指令緩存與數(shù)據(jù)緩存對系統(tǒng)性能有什么好處?！敬稹拷鉀Q訪存和村又指的結(jié)構(gòu)沖突，加速流水線：數(shù)據(jù)和指令的訪問有所不問，設(shè)置單獨的Cache有利于提高命中率，減少平均訪存時間。2什么是指令動態(tài)調(diào)度？使用寄存器重命名能夠解決哪些數(shù)據(jù)沖突？【答】指令動態(tài)調(diào)度是指在程序執(zhí)行過程中，依靠專門的碩件隊代碼進行調(diào)度。使用寄存器重命名能夠解決名相關(guān)(反相關(guān)、輸出相關(guān)).3 從數(shù)據(jù)和指令的角度，分別說明引起時間與空間局部性的原因?！敬稹繑?shù)據(jù)：對于剛被訪問過的數(shù)據(jù)，很有可能再次訪問它或者它附近的數(shù)據(jù)。指令：順序執(zhí) 行的可能性較大。4 .

2、直接用虛擬地址索引緩存會存在什么問題？【答】多個虛擬地址可能指向同一物理地址。5多處理機為什么耍維護緩存一致性？【答】每個處理機都有一份自己的Cache,但是這些Cache都映射同一個物理主存，當一個處理機修改己Cache的數(shù)據(jù)時，其他處理機中該部分的數(shù)據(jù)就不是最新的，造成不一致性。二.填空題1 16個處理器組成的網(wǎng)絡(luò)，使用洸牌函數(shù)相聯(lián)，那么與10號相聯(lián)的是【答】10= (1010) 2,循環(huán)左移一位得(0101) 2=5o2 有16個處理器，編號為0,1,，15,先經(jīng)過+3*Pl2+3,再經(jīng)過混洗變換后，11號處理器連向一號處理器?！敬稹縃經(jīng)過PM2*3得到(H + 2)modI6=3,

3、 3再經(jīng)過混洗變換得6。3使用混洙交換單級網(wǎng)絡(luò)將一個PE中的數(shù)據(jù)播送到所有16個PE中，需耍一次交換，需要一混洗。假設(shè)每步只能進行混洗或交換中的一種變換?！敬稹?次交換，3次混洗04 16個處理器組成的網(wǎng)絡(luò)，采用PM2切PM22鏈接，網(wǎng)絡(luò)直徑為，結(jié)點度為【答】有結(jié)論：2”個處理器組成的網(wǎng)絡(luò)，采用PM2兇，PM2如2鏈接，實現(xiàn)各處理單元之間上下左右互聯(lián)。網(wǎng)絡(luò)直徑為3,結(jié)點度為4 (?)o5可以在向量與標量工作模式中切換的處理器，處理向量時效率是處理標量的9倍。已知運行一段程序時有1/4的時間在運行向量指令，向量指令的比例為【答】設(shè)向量指令占比I則一-一二-.解得x =x+9(i-x)

4、446 .向量處理器在串行模式執(zhí)行以下指令需耍拍，使用鏈接技術(shù)需要.拍。v3 - A (load. 6 拍)v2 - v0 + vl (add. 6 拍)v4 - v2 * v3 (muL 7 拍)【答】串行模式下需要a +6 + 1) +仆+ 6 + 1) + (1 + 7 + 1)=25拍：使用鏈接技術(shù)需要1+6+1 + 1 + 7 + 1=17拍。7 處理器P1和P2執(zhí)行A, B, C三種指令的周期如下PlP2AI2B23C44一段程序中A占60%, B占30%, C占10%,分別求P1和P2運行該程序時的CPL【答】P1運行該程序的CPI為0. 6x1 + 03x2 + 0, 1x4

5、 = 1, 6 . P?運行該程序的CPI為0. 6x2 +03x3 + 0, 1x4 = 2. 5 o13&己知一處理器指令緩存不命中率為2%,數(shù)據(jù)緩存不命中率為4%,不命中代價為100周期。命中時，CPI為2,那么執(zhí)行一段含有Load/Save指令各15%的程序時，其CPI為。【答】每條指令出現(xiàn)不命中的概率是0,02+是x0. 04=0-032.故其CPI為0.032為00 + 2 = 5. 2 o9五段流水線CPU,各段延遲時間分別為2 - 2ns25ns, 2 - 2ns23ns23ns連續(xù)執(zhí)行10條指令，需要的時間為一，該CPU最高頻率為MHzo【答】各段不等長的流水線計算公式參

6、見教材 58 頁(時空圖如如 38),需要的時間為 max 222 5222323 x (10-1) + (2-2 + 2- 5 + 2- 2 + 2 3+2 - 3) = 34ns,最大周期為2 5ns,即頻率為400MHz10采用預(yù)留算法實現(xiàn)的非線性流水線優(yōu)化調(diào)度，其啟動循環(huán)為(1,3),則該流水線周期P為一調(diào)度后的禁止集F(niodP)為 0【答】周期尸= 1 + 3=4, F(modP) = 2o11 有一指令系統(tǒng)，共有7條指令。有兩種類型，一種為寄存器一寄存器型，一種為寄存器一存儲器型。指令字長為8位或16位，不同類型指令字長不同。耍求變址范圍一 127到128。則該指令系統(tǒng)

7、最多可以編址一個通用寄存器，這時，最多可以編址一個變址寄存器?！敬稹靠紤]寄存器一寄存器型指令字長為8位，有3條指令，除去2位操作碼，剩下各3位編址8個通用寄存器。寄存器一存儲器型指令字長為16位，有4條指令，除去8位立即數(shù)，3位寄存器，4位操作碼，剩下1位用來編址2個變址寄存器。(所給答案可能不是最優(yōu)的，但是掌握這種指令的各個部分的長度如何計算的方法即可)12在100次內(nèi)存訪問中，一級cache缺失10次，二級cache缺失5次。則一級cache的全局命中率為,二級cache的全局命中率為 0【答】90%； 95%。13分別在以下條件時計算塊地址0110的索引(index),緩存有8

8、塊，主存有16塊：a)二路組相聯(lián)一：b)直接映射0【答】二路組相聯(lián)共8/2二4紐索引為2位。直接映射索引為3位。答案分別是10、H0o14緩存共有4塊，每塊Ibytc,采用LRU策略。訪問字序列0, L 4, 1.0, 4在下列情況下的命中率分別是：a)直接映射：b)二路組相聯(lián)O【答】宜接映射0141040缺失(0)缺失缺失(0)缺失1缺失命中23命中率為1/6。二路組相聯(lián)0141040A缺失(0)命中0B缺失命中1A缺失命中1B命中率為1/2。三、判斷題：以下對MIPS架構(gòu)CPU的各改進方案，哪些修改了系統(tǒng)結(jié)構(gòu)(Archi(cclurc),哪些只修改了實現(xiàn)(Implementati

9、on) ?填寫A或者h將32位指令改為64位指令加入指令Cache(3)增加流水線的段數(shù)(4)減去某些定向(forwarding)相關(guān)邏輯的實現(xiàn)(5)取消氣泡增加16個額外的通用寄存器(7)增加對某指令集的支持ft? (DA(2)1I(4)1(5)1(6)A(7) A四、解答題。1 設(shè)計了一種優(yōu)化方案。優(yōu)化后的時鐘周期比未優(yōu)化的快15%；未優(yōu)化的取/存指令占總數(shù)的30%：優(yōu)化后的取/存指令比未優(yōu)化的少1/3,其它無變化：未優(yōu)化的所有指令均用1個時鐘周期：優(yōu)化的取/存指令用2個時鐘周期，其它指令用1個時鐘周期。(I)求優(yōu)化方案的平均CPI：2)通過計算加速比，判斷哪個方案速度更快？【解

10、】不妨設(shè)優(yōu)化前共10條指令，取/存指令有3條。優(yōu)化后的取/存指令減少了 1條，即還有2條取/存指令，其他7條不變，則總指令數(shù)變?yōu)?條。77優(yōu)化方案的半均CPI為fx2 + fxl = 1 - 22。(2)假設(shè)我們考慮這10條指令運行的總時間。以未優(yōu)化的1個時鐘周期作為單位1,優(yōu)化前的運行時間為10,優(yōu)化后的總時間為(7 + 2x2)x6 85 = 935.說明優(yōu)化后的更快。但是如果考慮平均每條指令的運行時間，那么優(yōu)化前的更快(因為優(yōu)化后平均每條指令的運行時間大于1)。2在有32個處理機的并行機上運行一段程序，獲得加速比26,己知該程序只有兩種運行方式：在所有32個處理機上同時運行，

11、或者只能由一個處理機執(zhí)行。請問程序中只能由一個處理機執(zhí)行的部分占多大比例？【解】設(shè)程序中只能由一個處理機執(zhí)行的部分占X,根據(jù)加速比定義有=26 n X = 0. 0073某指令系統(tǒng)，有三地址指令4條，單地址指令255條，零地址指令16條。其指令字長12位，地址碼3位。請問擴展編碼是否可行？如果單地址指令是254條呢？【解】(作業(yè)題三地址指令共需耍9位地址碼，所以剩下3位編碼操作碼，用4個碼點編碼三地址指令，剩余4個用于擴展。單地址指令操作碼有9位，可提供4X2=256個碼點，用其中255 個編碼單地址指令，剩下1個用于擴展。這時零地址指令只有8個碼點可用，所以擴展編碼不可行。如果

12、單地址指令是254條，那么還剩下2個用丁擴展零地址指令，零地址指令口身的最低3位各可以編碼8條指令，共計16條。因此可以實現(xiàn)擴展編碼。4指令字長16位，有雙地址指令、單地址指令、零地址指令。地址都是6位。雙地址指令15條。單地址與零地址條數(shù)相同。(1)單地址與零地址指令最多能有多少條？(2)給這三種指令分配操作碼。【解】(1)雙地址指令地址碼占12位，故操作碼有4位，共16個碼點，剩下1個碼點作擴展。單地址指令的操作碼最長10位，零地址指令最長16位。對于單地址指令來說，最多有26-1 = 63 條，零地址指令也必須是63條。(2) 雙地址指令：0000-1110：單地址指令：I1H 0

13、00000-1H1 II1110：零地址指令:I1H 1IHI1 000000-1IH 11H1I I111I0.分別對按寫分配和不按寫分配兩種策略,命中、缺失、命中、命中，命中率為60%。缺失，命中率為20%05 全相聯(lián)Cache采用寫直達策略。初始Cache為空。計算以下操作執(zhí)行后的命中率。Write MemElOOWrite MemElOORead Mein200Write Mem200Write MeinElOO【解】(PPT上的題)按寫分配：結(jié)果分別是缺失、不按寫分配：結(jié)果分別是缺失、缺失、缺失.命中.6, Cache采用組相連映像及變換。主存1MB, Cache 32KB.

14、塊大小64B, Cache分為8組。(I)寫出主存地址和緩存地址的格式(寫出各域及位數(shù))；若Cache的訪問周期為20ns,命中率0. 95,耍使加速比大于10,主存的訪問周期應(yīng)大于多少？【解】(1)Cache共有32KB/64B=5I2塊,分為8路,共有512/8=64組。主存地址：標識8位，索引6位，塊內(nèi)地址6位。.緩存地址：？ 0設(shè)主存訪問周期知，則加速比產(chǎn) 1皿皿。7 Cache有4塊，每塊4字，采用直接映像法。初始時Cache為空。訪問的字地址序列為：0 72 96 87Q12 2。求cache命中率?！窘狻吭L問過程如下：07!291681701220Miss 0-3Miss 16-

15、19HitMiss 03Hit1Miss 47Hit2Miss8-113Miss 12-15Hit命中率為40%o&一段程序有1000條指令，每條指令平均訪問存儲器L 5次，一級Cache訪問需要1ns.二級Cache訪問需要10ns,主存訪問需要100nso這段程序運行完后共訪問二級Cache 90次，訪問主存 27次。(1)求一級Cache和二級Cache命中率；(2)求存儲器等效訪問時間：(3)求每條指令因為訪問存儲器造成的半均延遲?！窘狻?1)程序一共訪存1000x15 = 1500次，一級Cache缺失了 90次，故on一級Cache (全局和局部)命中率為I二0,91: 1000二

16、級Cache的局部命中率為1-*0. 7；77二級Cache的全局命中率為1=0, 973.1000平均訪存時間 1+0.09x(10+03x100) = 46nso每條指令因為訪問存儲器造成的平均延遲為1 5x4 6二6 9nso9某系統(tǒng)Cache為4路組相聯(lián)，Cache大小為16K字節(jié)，塊大小為64字節(jié)。按寫分配。對于如下代碼：intM4096JJ;for(i = 0J 10; i+) for (j = 0; j mb) ni且緩存采用a) LRUb) OPT時的命中率。【解】都是0,因為一個元素大小和緩存塊大小相等，而每次訪問一個元素時也只會載入一個塊大小的數(shù)據(jù)到Cache,故每

17、次訪問都必然會缺失。11.有以下指令(假設(shè)第一個操作數(shù)為寫回的寄存器)N1 ： load r0 aN2: add rl rON3: load r2 bN4: inu r3 r4N5： and r4 r5N6： add r2 r5(1)請列出所有可能的數(shù)據(jù)沖突與結(jié)構(gòu)沖突。(2)假設(shè)該處理器一個周期僅能進行一次訪存操作，畫出其執(zhí)行上述指令的時空圖?！窘狻?1)數(shù) 據(jù)沖突：N1 與 N2:rORAWN4 與 N5: r4 WARN3 與 N6: r2 WAW結(jié)構(gòu)沖突：讀取內(nèi)存與取指沖突。(2)假設(shè)數(shù)據(jù)沖突需耍插一個氣泡。I23456789101;12!31IFIDEXEMEMWB2IFIDstall

18、EXEIEMWB3IFIDEXEMEMWB4IFIDEXEMEMWB5stallIFIDEXEMEMWB6IFIDEXEMEMWB說明：本答案中幾乎所有給出的時空圖與教材和課件上的形式不一樣，建議考試中嚴格遵循教材和課件的標準(如教材圖3 8) I一一12某CPU指令的運行分為取指譯碼、執(zhí)行.寫結(jié)果四個階段，每段延遲均為5ns。運行程序如下：K!M0VRLS4;R1G 向量長度 4K2 Loop: MOV R2,A(R1); R2 A 向量的一個元素K3ADD RO. R2:RO - (R0) + (R2)K4DNE RhLoop;Rl一(RI)-h 若(RI) !=0,則轉(zhuǎn)向 LoopK5M

19、OV SUM RO; SUM W2n)2ADDADDyw2IF1W1LSWRIIF2m2MULMULMULWR2mW1ANDWRIIF2DD2ADDADDWR2(3)采用順序發(fā)射亂序完成調(diào)度方法的流水線時空圖。N1M2H3N4N5各條指令完成的時間圖時鐘周期456789流水線1nln3n5流水線2n4n2n6執(zhí)行這個程序共用18ns。采用順序發(fā)射亂序完成調(diào)度方法的流水線時空圖。1123457 8nW1LSW1inn2搟ADDQDWR2IF1W1LSW11F20)2MULMULMOLWK2 1 IF3ID1ANDWEIfff2nw砂ADDWRI 117下面一段程序是計算浮點向量運算Y=a*X +

20、 Y的，其中X和Y都是100維向量。采用循環(huán) 展開的方式使得執(zhí)行過程沒有stalk那么最少需要展開兒次？寫出展開的程序。LOOP: L D MUL.D L D ADD.D S D DSUBI DSUBI BNEZF0 O(R1)FOJO, F2F4 0 (R2)FOJO, F4F0 0(R2)RLRh#8R2R2#8RLLOOP注意：本題原來的題干有錯，大家只要掌握循環(huán)展開的方法即可，一種可能的答案如下 0本題在PPT匕也有，可以看一下PPT上的題目和答案?！窘狻繉⒀h(huán)展開兩次，進行指令調(diào)度，即可以消除延遲，代碼如下：LOOP： L DFO, 0 CRDL - DFIO, -8 (RDMU

21、L.DFO, FO, F2MUL.DFIO, FIO, F2L - DF4, 0 (R2)L - DF14, -8 (R2)ADD.DFO, FO, F4ADD.DFIO, FIO, FI4DSUBIRH Rb #16SQ0 CR2) , FODSUBIR2 R2, #16BNEZRH LOOPS - D8 CR2) , FIO假設(shè)：LOOP: LDFO.O(Rl)(stall)MUL.DFOJO, F2L DF4J (R2)(stall)ADD.DFO. FO, F4(stall)(stall)S DFO - 0 (R2)DSUBIRLRh#8DSUBIR2R2#8BNEZRLLOOP(st

22、all)1&分支預(yù)測。(1)畫出2位飽和計數(shù)器的狀態(tài)圖。(2)已知如下指令序列地址目標地址是否跳轉(zhuǎn)bl否*01bl否bl是b2否b2是己知初始BHT歷史為00, BHT項全為01,求執(zhí)行完上述程序后的BHT。(3)簡要說明為何引入BTB會使得CPI下降?！窘狻恳娊滩?34頁圖5Oo(2)BHT一般就用PC的后幾位作為表格的索引，查出里面的預(yù)測位。這里的預(yù)測當長度為2時就是上題中的飽和計數(shù)器，用 00. 01. 10、H 分別表示 strongly not takenweakly not taken weakly taken strongly takeno 可參考某中文b! oghttp：/b

23、log, csdn. net/edonlii/article/details/8754724o 執(zhí)行完上述程序后的 BHT 為索引值(計數(shù)器)0101100!(3)在經(jīng)典的5段流水線中，ID段宋尾才能獲得分支口標地址。而采用BTB可以提前在IF段就知道這些信息，分支開銷就可以減少為0。19一個含有8個輸入端的系統(tǒng)采用三層101001010*01010010000bI號不可能鏈接到4、7號處理器。20在多處理機系統(tǒng)中，采用寫回法的寫作廢(write invalidate)總線監(jiān)聽協(xié)議，參見教材310頁圖106的狀態(tài)機。(1)給出L S狀態(tài)的定義，并說明什么時候可以確定發(fā)生了 Cache不一

24、致的情況。(2)假設(shè)有兩個地址A和B (映射到不同的Cache塊中)，兩個處理機R和P2,初始時Cache全為空，根據(jù)特定的訪問序列，補全下表(無消息用丫代替，CPU事件RdM = Read Miss RdH =Read Hib WrM = Write Miss WrH = Write Hit；總線消息 WrMs = Write Miss RdMs = Read Miss)操作AB消息/操作PlP2PlP2PlP2Pj： R ASIIIRdM/RdMsRdMs/-P2： W A 10P2： R APl： W A20Pl： WB 10P2： WB20【解】(1)M表示該塊已經(jīng)被修改過，并11未寫入存儲器?！颈硎驹搲K內(nèi)容無效。S表示該塊婆么處于共享狀態(tài)，即多個處理器中都有其副本且都與存儲器相同，或者該塊只在一個處理器中有副本且與存儲器相同。操作AB消息/操作PiP2PlP2PlP2Pl； R AsIIIRdM/RdMsRdMs/-P2： W A 10IMIIWrMs/-WrM/WrMsP2： RAIMIIRdHAPl： W A20MIIIWrM/WrMsWrMs/寫回PI： WB 10MIMIWrM/WrMsWrMs/-Pz： WB20MIIMWrMs/寫回WrM/WrMs

展開閱讀全文

溫馨提示:
1: 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

備案號:蜀ICP備2024067431號-1 川公網(wǎng)安備51140202000466號

本站為文檔C2C交易模式，即用戶上傳的文檔直接被用戶下載，本站只是中間服務(wù)平臺，本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私，請立即通知裝配圖網(wǎng)，我們立即給予刪除！

《計算機系統(tǒng)結(jié)構(gòu)》往年考題答案

最新文檔

相關(guān)資源

相關(guān)搜索