ITSM-AV-01可用性計(jì)劃
編號:ITSM-4-AV-01版本號:V1.0受控狀態(tài):受控密級:內(nèi)部公開XXXXXXt限公司XXXXX給滿數(shù)字化分析模型項(xiàng)目2019年度可用性計(jì)劃版權(quán)聲明和保密須知本文件中出現(xiàn)的任何文字?jǐn)⑹?、文檔格式、插圖、照片、方法、過程等內(nèi)容,除另有特別注明,版權(quán)均屬XXXXXX有限公司所有,受到有關(guān)產(chǎn)權(quán)及版權(quán)法保護(hù)。任何單位和個(gè)人未經(jīng)XXXXXX有限公司的書面授權(quán)許可,不得復(fù)制或引用本文件的任何片斷,無論通過電子形式或非電子形式。Copyright?2019XXXXXX有限公司版權(quán)所有文檔信息文檔編號:ITSM-4-AV-01文檔分類:內(nèi)部公開編寫人:技術(shù)部門審批人:版本記錄版本號版本日期修改審批人修改履歷V1.02019.9.12技術(shù)部門創(chuàng)建文檔目錄1概述41.1 文檔目標(biāo)42可用性的測量43 IT服務(wù)可用性需求分析43.1 業(yè)務(wù)需求53.2 維護(hù)指標(biāo)63.3 運(yùn)行指標(biāo)64 IT服務(wù)可用性目標(biāo)74.1 計(jì)劃不可用時(shí)間74.2 可用性監(jiān)控指標(biāo)84.3 可用性監(jiān)控指標(biāo)度量標(biāo)準(zhǔn)84.4 監(jiān)控方式及報(bào)告周期84.5 2019年度可用性監(jiān)測計(jì)劃表91概述1.1文檔目標(biāo)為了在2019年更好的確保智能倉儲(chǔ)物流平臺(tái)滿足客戶要求,特制定本計(jì)劃,旨在明確IT服務(wù)可用性的目標(biāo),管理并改進(jìn)IT服務(wù)可用性,在預(yù)算范圍內(nèi)使運(yùn)維團(tuán)隊(duì)提供的服務(wù)能夠最大化地滿足組織的需求。2可用性的測量1)IT基礎(chǔ)架構(gòu)的復(fù)雜程度:該服務(wù)包括了應(yīng)用系統(tǒng)、網(wǎng)絡(luò)、弱電和數(shù)據(jù)庫及服務(wù)器等硬件設(shè)施,復(fù)雜度為中等。2)IT服務(wù)組件的可靠性:在項(xiàng)目中運(yùn)行的設(shè)備由廠家負(fù)責(zé)維保,我公司提供備份已備替換。軟件系統(tǒng)及數(shù)據(jù)庫經(jīng)過公司內(nèi)部測試,目前穩(wěn)定性可在96%以上。3)對故障作出快速有效反應(yīng)的能力:長期安排一位工程師現(xiàn)場駐點(diǎn),提供遠(yuǎn)程網(wǎng)絡(luò)、電話等方式在線服務(wù),如現(xiàn)場故障不能及時(shí)解決,2個(gè)小時(shí)內(nèi)派工程師達(dá)到現(xiàn)場,7X24小時(shí)支持服務(wù)。4)IT部門或供應(yīng)商提供的維護(hù)的質(zhì)量:交由公司的商務(wù)部對對供應(yīng)商的資質(zhì)能力進(jìn)行檢查,定期巡檢和登記備案。設(shè)備安裝上線之前已進(jìn)行了交付驗(yàn)收測試。3 IT服務(wù)可用性需求分析建立和維護(hù)與組織業(yè)務(wù)需求相一致的IT服務(wù)可用性計(jì)劃,必須明確組織業(yè)務(wù)和客戶的需求,在此基礎(chǔ)上制定的IT服務(wù)可用性計(jì)劃才能最大化地支持組織業(yè)務(wù)的發(fā)展運(yùn)作和用戶的工作,符合組織的利益。3.1 業(yè)務(wù)需求智能倉儲(chǔ)物流平臺(tái)管理系統(tǒng)中硬件網(wǎng)絡(luò)設(shè)備和服務(wù)器、網(wǎng)絡(luò)線路是用戶單位的關(guān)鍵IT系統(tǒng),定義為關(guān)鍵業(yè)務(wù),其業(yè)務(wù)需求如下:指標(biāo)定義承諾標(biāo)準(zhǔn)非重大故障系統(tǒng)恢復(fù)時(shí)間除操作系統(tǒng)不能啟動(dòng)、硬件損壞機(jī)器不能啟動(dòng)、重要系統(tǒng)數(shù)據(jù)丟失外的其他故障<1個(gè)工作日重大故障系統(tǒng)恢復(fù)時(shí)間操作系統(tǒng)不能啟動(dòng)、硬件損壞機(jī)器不能啟動(dòng)、重要系統(tǒng)數(shù)據(jù)丟失<24小時(shí)系統(tǒng)平均無故障工作時(shí)間系統(tǒng)單臺(tái)設(shè)備兩次故障(不含系統(tǒng)維護(hù))間的平均時(shí)間。月平均無故障工作時(shí)間段700小時(shí)根據(jù)以上可用性需求分析的結(jié)果,對IT服務(wù)的可用性需求進(jìn)行分類,如下:可用性分類可用性級別每年服務(wù)中斷時(shí)間容錯(cuò)性94.999%5分鐘彈性(冗余)95.99%53分鐘局可用性97.9%8.8小時(shí)一>可用性93-97.5%87.6-43.8小時(shí)在本年度的IT服務(wù)組件可用性識別考慮的因素包括:(1) 應(yīng)用系統(tǒng)、中間件和操作系統(tǒng)方面,包括單點(diǎn)故障、不當(dāng)配置選項(xiàng)、設(shè)計(jì)缺陷、低效的開發(fā)方法、代碼編寫錯(cuò)誤等(2) 硬件和網(wǎng)絡(luò)方面,包括單點(diǎn)故障、過時(shí)的固件、不當(dāng)?shù)奈臋n維護(hù)、廠商支持水平不夠、缺乏抗靜電防范措施、缺乏后備資源、線纜連接標(biāo)識混亂等(3) 配套設(shè)施方面,包括空調(diào)能力不足、電源中斷、電源不穩(wěn)定、火災(zāi)與洪水、物理安全疏漏等(4) 出口設(shè)施方面,包括單一供電線路和單一電信線路(5) 人員方面,包括低劣的質(zhì)量控制規(guī)程、缺乏紀(jì)律約束、缺乏專業(yè)技能等3.2 維護(hù)指標(biāo)表3-1系統(tǒng)維護(hù)指標(biāo)表指標(biāo)名稱指標(biāo)定義及計(jì)算方法指標(biāo)值系統(tǒng)可用率指某個(gè)增值業(yè)務(wù)平臺(tái)業(yè)務(wù)中斷時(shí)長與統(tǒng)計(jì)總時(shí)長之比系業(yè)務(wù)中斯時(shí)間(分鐘)統(tǒng)可用率=統(tǒng)計(jì)息時(shí)長(例中)X100%>99%服務(wù)滿意度a二£一14(4為各季度滿意度得分值)>90故障處理及時(shí)率口M00%>95工單處理及時(shí)率按時(shí)完成的工單數(shù)L工電蟋Xi。>953.3 運(yùn)行指標(biāo)表3-2系統(tǒng)運(yùn)行指標(biāo)表設(shè)備名稱指標(biāo)名稱峰值告警閾值平均告警閾值服務(wù)器CPUIJ用率90%50%磁盤利用率90%65%內(nèi)存利用率90%65%數(shù)據(jù)庫表空間利用率85%70%網(wǎng)絡(luò)設(shè)備運(yùn)行流量90%50%引擎板(主控)運(yùn)行流量90%50%CPU處理器荷載90%50%4 IT服務(wù)可用性目標(biāo)服務(wù)內(nèi)容描述可用性目標(biāo)備注無線控制器AP信號98%引擎板主控板99%16口萬兆交換板網(wǎng)絡(luò)交換95%48口千兆交換板網(wǎng)絡(luò)交換95%WA2620-FIT無線局域網(wǎng)室內(nèi)型雙頻接入點(diǎn)99%SFP-GE-SX-MM850D光模塊-SFP-GE-多模模塊99%LSWM1AC300300W交流系統(tǒng)電源模塊99%SWP-IMC7-IMPH3CiMC-智能管理平臺(tái)標(biāo)準(zhǔn)版99%4.1 計(jì)劃不可用時(shí)間2019年IT服務(wù)提供的可用時(shí)間段為:5X8小時(shí),7X24小時(shí)技術(shù)支持。服務(wù)提供次要時(shí)段,如較容易承受停機(jī)故障的時(shí)間:工作日的24:004:00之間。服務(wù)提供的關(guān)鍵時(shí)段:計(jì)劃內(nèi)的系統(tǒng)的升級需要停止服務(wù),再進(jìn)行程序更新,更新完成后再把服務(wù)啟動(dòng);因此每次升級導(dǎo)致物聯(lián)網(wǎng)平臺(tái)系統(tǒng)有半小時(shí)左右不可用。出于對業(yè)務(wù)影響最小化的考慮,此操作會(huì)提前三天左右通知并安排在下班后或者周末進(jìn)行。每年計(jì)劃有4小時(shí)左右要對設(shè)備進(jìn)行一次表結(jié)構(gòu)維護(hù)操作,屆時(shí)系統(tǒng)將不可用。4.2 可用性監(jiān)控指標(biāo)系統(tǒng)/服務(wù)組件指標(biāo)描述存儲(chǔ)系統(tǒng)平均響應(yīng)時(shí)間某一階段內(nèi)的平均響應(yīng)時(shí)間是否可以登錄網(wǎng)絡(luò)端口的可連通性互聯(lián)網(wǎng)連通性測試到指定網(wǎng)站的連通性4.3 可用性監(jiān)控指標(biāo)度量標(biāo)準(zhǔn)指標(biāo)度量標(biāo)準(zhǔn)注釋連續(xù)工作時(shí)間設(shè)備功能正常,不出功能性故障人為操作失誤造成的故障同樣視為設(shè)備故障;不影響實(shí)質(zhì)性服務(wù)功能的故障不考慮在本指標(biāo)的度量范圍內(nèi)故障頻率在一段時(shí)間內(nèi)發(fā)生故障的頻率恢復(fù)時(shí)間從發(fā)生故障到恢復(fù)服務(wù)提供所經(jīng)歷的時(shí)間響應(yīng)時(shí)間發(fā)出指令到相關(guān)設(shè)備做出回應(yīng)的時(shí)間對一條數(shù)據(jù)通路中的所有設(shè)備,應(yīng)分別計(jì)算各自的響應(yīng)時(shí)間和總響應(yīng)時(shí)間網(wǎng)絡(luò)可連通性通過IP是否能夠連通到設(shè)備是否可登陸通過正常步驟是否能夠成功登陸4.4 監(jiān)控方式及報(bào)告周期系統(tǒng)/服務(wù)組件報(bào)告周期監(jiān)控方式負(fù)責(zé)人無線控制器每月軟件及人工監(jiān)控實(shí)施工程師引擎板每月軟件及人工監(jiān)控實(shí)施工程師16口萬兆交換板每月軟件及人工監(jiān)控實(shí)施工程師48口千兆交換板每月軟件及人工監(jiān)控實(shí)施工程師WA2620-FIT每月軟件及人工監(jiān)控實(shí)施工程師SFP-GE-SX-MM850D每月軟件及人工監(jiān)控實(shí)施工程師LSWM1AC300每月軟件及人工監(jiān)控實(shí)施工程師SWP-IMC7-IMP每月軟件及人工監(jiān)控實(shí)施工程師按照月度進(jìn)行可用性監(jiān)控?cái)?shù)據(jù)匯總,包括網(wǎng)絡(luò),IT基礎(chǔ)架構(gòu)系統(tǒng),應(yīng)用系統(tǒng)的可用性情況。根據(jù)上述分析和總結(jié),2019年度可用性計(jì)劃時(shí)間表如下:4.5 2019年度可用性監(jiān)測計(jì)劃表分類子類項(xiàng)目子項(xiàng)2019年行動(dòng)計(jì)劃責(zé)任人監(jiān)測內(nèi)容及時(shí)間頻率第一季度第二季度第三季度第四季度業(yè)務(wù)軟件平臺(tái)管理軟件降低軟件出錯(cuò)率程序bug每月,由系統(tǒng)集成部進(jìn)行遠(yuǎn)程監(jiān)測,內(nèi)部系統(tǒng)升級之后進(jìn)行推送全年實(shí)施工程師響應(yīng)、解決問題速度每周,系統(tǒng)登錄、頁面訪問、數(shù)據(jù)查詢等全年實(shí)施工程師網(wǎng)絡(luò)環(huán)境監(jiān)控客戶網(wǎng)絡(luò)排查每天早上9點(diǎn)遠(yuǎn)程監(jiān)測全年實(shí)施工程師網(wǎng)絡(luò)流量監(jiān)控各時(shí)段網(wǎng)絡(luò)流量查看每天早上9點(diǎn)遠(yuǎn)程監(jiān)測全年實(shí)施工程師數(shù)據(jù)分析每天下午5點(diǎn)遠(yuǎn)程監(jiān)測全年實(shí)施工程師操作系統(tǒng)Windows監(jiān)控API網(wǎng)關(guān)保養(yǎng)每月初遠(yuǎn)程監(jiān)測,現(xiàn)場駐場工程師配合全年實(shí)施工程師cpu、內(nèi)存等硬件巡檢每天早上9點(diǎn)遠(yuǎn)程監(jiān)測,現(xiàn)場駐場工程師配合全年實(shí)施工程師安全性每周五遠(yuǎn)程監(jiān)測全年實(shí)施工程師性能分析每月初遠(yuǎn)程監(jiān)測,現(xiàn)場駐場工程師配合全年實(shí)施工程師DBSQLSERVER監(jiān)控歸檔日志每周五遠(yuǎn)程監(jiān)測,現(xiàn)場駐場工程師配合全年實(shí)施工程師數(shù)據(jù)文件、表空間巡檢每周五遠(yuǎn)程監(jiān)測,現(xiàn)場駐場工程師配合全年實(shí)施工程師數(shù)據(jù)庫性能分析每周五遠(yuǎn)程監(jiān)測,現(xiàn)場駐場工程師配合全年實(shí)施工程師集群狀態(tài)巡檢每周五遠(yuǎn)程監(jiān)測,現(xiàn)場駐場工程師配合全年實(shí)施工程師集群健康巡檢每周五遠(yuǎn)程監(jiān)測,現(xiàn)場駐場工程師配合全年實(shí)施工程師存儲(chǔ)設(shè)備磁盤陣列監(jiān)控存儲(chǔ)控制器巡檢每周,現(xiàn)場駐場工程師配合全年實(shí)施工程師存儲(chǔ)磁盤巡檢每周,現(xiàn)場駐場工程師配合全年實(shí)施工程師硬件設(shè)備網(wǎng)絡(luò)交換機(jī)監(jiān)控設(shè)備狀態(tài)巡檢每周1,現(xiàn)場駐場工程師配合全年實(shí)施工程師配置備份每周1,現(xiàn)場駐場工程師配合全年實(shí)施工程師服務(wù)器設(shè)備指示燈現(xiàn)場巡檢每周1,現(xiàn)場駐場工程師配合全年實(shí)施工程師CP應(yīng)行率系統(tǒng)優(yōu)化和維護(hù)每周1,現(xiàn)場駐場工程師配合全年實(shí)施工程師磁盤冗余系統(tǒng)維護(hù)每周1,現(xiàn)場駐場工程師配合全年實(shí)施工程師內(nèi)存占用率系統(tǒng)維護(hù)每周1,現(xiàn)場駐場工程師配合全年實(shí)施工程師