首頁 > 解決方案 > H3C網(wǎng)絡(luò)工程方案
很多醫(yī)院在面臨醫(yī)療業(yè)務(wù)增長壓力的時(shí)候都會(huì)陷入一個(gè)怪圈:各業(yè)務(wù)科室反映醫(yī)生工作站開醫(yī)囑變得慢了,影像中心反映調(diào)取片子的速度慢了,檢驗(yàn)科室反映讀取報(bào)告慢了……面對(duì)這些來自業(yè)務(wù)科室的壓力,很多醫(yī)院信息中心會(huì)通過購買服務(wù)器的方式來提高系統(tǒng)的響應(yīng)服務(wù)速度,有的購買Web服務(wù)器,有的購買應(yīng)用服務(wù)器,有的購買數(shù)據(jù)庫服務(wù)器……直到把醫(yī)院有限的機(jī)房全部填滿。
事實(shí)上,有一個(gè)很重要的工作被忽略——沒有對(duì)業(yè)務(wù)系統(tǒng)進(jìn)行詳細(xì)的故障數(shù)據(jù)分析,缺乏業(yè)務(wù)系統(tǒng)健康狀態(tài)的數(shù)據(jù)分析。現(xiàn)在的醫(yī)療業(yè)務(wù)系統(tǒng)普遍采用三層架構(gòu),即Web服務(wù)器、應(yīng)用服務(wù)器和數(shù)據(jù)庫服務(wù)器,從數(shù)量上看每層可能都有數(shù)臺(tái)以上的服務(wù)器,很多醫(yī)院看這種性能問題普遍都是從數(shù)量上看,但是走進(jìn)每臺(tái)服務(wù)器我們會(huì)發(fā)現(xiàn),影響和制約業(yè)務(wù)系統(tǒng)運(yùn)行的還有軟件因素,即比物理資源更重要的軟件資源,如數(shù)據(jù)庫的連接信息、讀寫I/O狀態(tài),數(shù)據(jù)庫明細(xì)和表空間狀態(tài),應(yīng)用服務(wù)器的會(huì)話性能、事務(wù)狀態(tài)、線程池等,這些軟件資源很多時(shí)候會(huì)成為系統(tǒng)運(yùn)行的瓶頸。
此外,一直以來,醫(yī)院都是將網(wǎng)絡(luò)和系統(tǒng)應(yīng)用分開管理,在很多醫(yī)院一般是由兩個(gè)團(tuán)隊(duì)分別負(fù)責(zé)運(yùn)維。對(duì)服務(wù)器應(yīng)用軟件資源的管理,醫(yī)院大多采取獨(dú)立的系統(tǒng)管理;對(duì)網(wǎng)絡(luò)、安全、服務(wù)器等硬件資源的管理,醫(yī)院多采用獨(dú)立的網(wǎng)管系統(tǒng)。兩套班子,兩套系統(tǒng),沒有統(tǒng)一融合的管理工具,數(shù)據(jù)中心的運(yùn)維成本很高。
因此,醫(yī)院迫切需要建立一套可視化的應(yīng)用監(jiān)視手段,可集成數(shù)據(jù)中心系統(tǒng)管理,通過自動(dòng)化的運(yùn)維工具,提高運(yùn)維效率,降低管理復(fù)雜度,保障整個(gè)醫(yī)療應(yīng)用系統(tǒng)的穩(wěn)定、高效、不間斷運(yùn)轉(zhuǎn)。
在對(duì)醫(yī)院進(jìn)行應(yīng)用服務(wù)監(jiān)測管理的時(shí)候,面臨如何管理、管理什么、關(guān)聯(lián)管理和管理控制等問題:
1、 管理不能以犧牲性能為代價(jià),尤其如HIS、PACS、EMR等醫(yī)院核心業(yè)務(wù)系統(tǒng),不能增加醫(yī)院業(yè)務(wù)系統(tǒng)的業(yè)務(wù)負(fù)擔(dān);
2、 全面覆蓋限制服務(wù)能力的關(guān)鍵點(diǎn),要對(duì)影響服務(wù)的各種資源進(jìn)行詳細(xì)監(jiān)控,不僅有硬件資源,還要有豐富的軟件資源;
3、 醫(yī)院業(yè)務(wù)從傳統(tǒng)相互獨(dú)立的應(yīng)用模式向強(qiáng)關(guān)聯(lián)性發(fā)展,因此醫(yī)院業(yè)務(wù)服務(wù)健康監(jiān)測,要能夠識(shí)別應(yīng)用資源的依賴關(guān)系和相互依存性,跟蹤相關(guān)業(yè)務(wù)的性能,提高監(jiān)控效率;
4、 監(jiān)測不是目的,通過服務(wù)監(jiān)測可及時(shí)發(fā)現(xiàn)問題,并建立良好的應(yīng)用服務(wù)質(zhì)量管理體系;
H3C APM醫(yī)院應(yīng)用服務(wù)健康監(jiān)測解決方案,從根本上解決了服務(wù)器應(yīng)用資源管理問題,可以幫助醫(yī)院獲得更好的資源可視性和可控性,減少工作量,提高運(yùn)維效率。
一、 管理方式
APM采用無代理(Agentless)模式,通過不同命令、腳本或模擬客戶端的方式要求應(yīng)用資源反饋相應(yīng)指標(biāo)數(shù)據(jù),然后根據(jù)指標(biāo)數(shù)據(jù)對(duì)應(yīng)用資源的性能、負(fù)載進(jìn)行評(píng)估,從而評(píng)估應(yīng)用系統(tǒng)的性能。比如對(duì)Windows服務(wù)器的監(jiān)控可以采用SNMP協(xié)議和WMI(Windows管理規(guī)范)協(xié)議;對(duì)數(shù)據(jù)庫的監(jiān)控可以采用ODBC連接、SQL結(jié)構(gòu)化查詢語言等命令模擬客戶端登陸服務(wù)器以獲取相關(guān)數(shù)據(jù)。這種管理方式對(duì)于關(guān)鍵的醫(yī)療應(yīng)用資源占用不大,增加應(yīng)用系統(tǒng)穩(wěn)定性。
二、 管理內(nèi)容
APM覆蓋了包括以下的市場主流應(yīng)用資源。
? 服務(wù)器操作系統(tǒng):Windows、Linux、Sun Solaris、FreeBSD、IBM AIX、HP- UX、Tru64 Unix、Mac OS等;
? 數(shù)據(jù)庫:Oracle(8.x/9i/10g/RAC/11g)、MySQL(3.23.x/4.x/5.x)、Microsoft SQL Server(2005/2008)、IBM DB2(8.x/9.x)、Sybase等;
? Web服務(wù)器:Apache、Windows IIS、PHP等;
? 應(yīng)用服務(wù)器:Microsoft .Net、GlassFish、JBoss、Oracle AS、SilverStream、Tomcat服務(wù)器、WebLogic、WebSphere等;
? 中間件:WebLogic、WebSphere等;
? 郵件服務(wù)器:Microsoft Exchange 2003/2007、其他SMTP、POP3型郵件服務(wù)器。
除此之外,APM還可以提供自定義監(jiān)控的能力,對(duì)醫(yī)院諸多獨(dú)特的的應(yīng)用系統(tǒng)進(jìn)行監(jiān)測。
在監(jiān)控指標(biāo)上,APM有所側(cè)重,如對(duì)主機(jī)系統(tǒng)、數(shù)據(jù)庫服務(wù)器、應(yīng)用中間件,要分別關(guān)注其內(nèi)部各種關(guān)鍵參數(shù),以便準(zhǔn)確把握系統(tǒng)運(yùn)行狀態(tài),及時(shí)地發(fā)現(xiàn)故障苗頭。對(duì)內(nèi)部Web HTTP服務(wù)的監(jiān)控是由于醫(yī)院內(nèi)部有很多重要的Web應(yīng)用,通過對(duì)HTTP和HTTP序列的監(jiān)控,可以確保所有這些網(wǎng)頁7*24小時(shí)正常運(yùn)行,并能夠在網(wǎng)頁響應(yīng)變慢之前及時(shí)得到通知,這就盡可能地避免了醫(yī)生、醫(yī)務(wù)人員由于網(wǎng)頁打不開或者登陸不上去而抱怨。
三、 業(yè)務(wù)關(guān)聯(lián)管理
APM提供智能的關(guān)聯(lián)分析。對(duì)醫(yī)院IT管理員來而言,他們往往認(rèn)為數(shù)據(jù)中心中各資源的性能明細(xì)等這些冷冰冰的數(shù)據(jù)與他具體負(fù)責(zé)的業(yè)務(wù)沒有關(guān)聯(lián),尤其當(dāng)系統(tǒng)龐大之后,海量的數(shù)據(jù)更是讓人感覺云山霧繞。在這種情況下,可以考慮基于業(yè)務(wù)維度的監(jiān)控,通過分組數(shù)據(jù)中心中的應(yīng)用、服務(wù)器及系統(tǒng)等不同資源,為異構(gòu)的IT基礎(chǔ)架構(gòu)創(chuàng)建一個(gè)具有邏輯意義的業(yè)務(wù)視圖,實(shí)時(shí)監(jiān)控此邏輯視圖中的性能變化。
圖1 基于業(yè)務(wù)維度的監(jiān)控
如圖1所示,某臨床信息系統(tǒng)包含門診醫(yī)生工作站、住院醫(yī)生工作站、護(hù)士工作站、電子病歷、臨床檢驗(yàn)系統(tǒng)、醫(yī)學(xué)影像系統(tǒng)、營養(yǎng)配餐管理、臨床用藥咨詢、手術(shù)室麻醉系統(tǒng)、重癥監(jiān)護(hù)信息系統(tǒng)、輸血管理系統(tǒng)等子系統(tǒng),而每個(gè)子系統(tǒng)都由操作系統(tǒng)、數(shù)據(jù)庫、Web服務(wù)器、存儲(chǔ)等服務(wù)器應(yīng)用組成,因此可以建立對(duì)應(yīng)的邏輯視圖,如圖2所示。
圖2 基于業(yè)務(wù)維度監(jiān)控的邏輯視圖
邏輯視圖可向下層層鉆取直至原子服務(wù),每一種應(yīng)用資源的性能變化即反應(yīng)了其對(duì)應(yīng)的子集,同時(shí)也反應(yīng)整個(gè)臨床信息系統(tǒng)應(yīng)用的性能。通過這種方式,用戶只需監(jiān)控對(duì)應(yīng)的邏輯視圖,簡單明了、清晰簡潔,顯著提高醫(yī)院數(shù)據(jù)中心應(yīng)用資源運(yùn)維管理的效率。
四、 管理控制
APM提供一體化融合的方式,能夠同步了解網(wǎng)絡(luò)和應(yīng)用的情況。
1. 網(wǎng)絡(luò)與應(yīng)用的拓?fù)浣Y(jié)合
通過網(wǎng)絡(luò)與應(yīng)用拓?fù)涞慕Y(jié)合,醫(yī)院可以按照業(yè)務(wù)的維度建立統(tǒng)一視圖,拓?fù)鋱D中融合網(wǎng)絡(luò)性能、告警數(shù)據(jù),也可直接查看各種應(yīng)用的運(yùn)行信息,直觀形象地展示了當(dāng)前醫(yī)院數(shù)據(jù)中心業(yè)務(wù)相關(guān)的網(wǎng)絡(luò)和應(yīng)用情況(如圖3所示)。
圖3 網(wǎng)絡(luò)與應(yīng)用的拓?fù)淙诤?/p>
2. 故障根源分析
醫(yī)院數(shù)據(jù)中心中一般存在大量的告警信息,但這些信息往往不需過分關(guān)注和處理。查看分析這些告警信息不僅耗費(fèi)管理員大量的時(shí)間和精力,并且會(huì)將關(guān)鍵告警信息淹沒其中,從而影響管理員對(duì)數(shù)據(jù)中心故障的正確判斷和及時(shí)處理。很多醫(yī)院用戶都有這樣的感受,數(shù)據(jù)中心中的某臺(tái)核心設(shè)備端口斷電之后,從接入設(shè)備、匯聚設(shè)備到后端應(yīng)用服務(wù)器都會(huì)產(chǎn)生故障,管理系統(tǒng)霎時(shí)間會(huì)收到海量的嚴(yán)重告警信息,在短時(shí)間內(nèi)要求能夠快速定位到故障的源頭幾乎是一項(xiàng)不可能的任務(wù)。
故障的根源分析,要求系統(tǒng)能夠根據(jù)一定的算法規(guī)則,分析告警間的邏輯原因,自動(dòng)屏蔽、排除無關(guān)的表象告警,最終幫助管理員找出導(dǎo)致故障的根源告警。通過常見的短信、Email等告警轉(zhuǎn)發(fā)手段,使用戶不需要坐在電腦前,就可以獲得關(guān)鍵的根源告警信息,從而能夠及時(shí)地解決問題(如圖4所示)。
圖4 服務(wù)器應(yīng)用的故障根源分析
3. 綜合SLA分析
基礎(chǔ)網(wǎng)絡(luò)及服務(wù)器等資源的建設(shè)主要還是用于支撐上層業(yè)務(wù)和服務(wù),SLA(Service Level Agreement,服務(wù)協(xié)議等級(jí))就是用來衡量數(shù)據(jù)中心的服務(wù)水平。數(shù)據(jù)中心綜合SLA分析融入了告警、性能、流量、應(yīng)用等數(shù)據(jù),通過指標(biāo)的創(chuàng)建與服務(wù)的建立,來完成整個(gè)服務(wù)的度量監(jiān)控和管理。以醫(yī)院HIS應(yīng)用為例,管理員將涉及的網(wǎng)絡(luò)、PC服務(wù)器操作系統(tǒng)、數(shù)據(jù)庫、郵件服務(wù)器及其相關(guān)的鏈路、配置、流量等組合成服務(wù)項(xiàng),通過圖表數(shù)據(jù)實(shí)時(shí)監(jiān)控服務(wù)的健康狀況,并對(duì)醫(yī)院各科室輸出SLA服務(wù)報(bào)表。一旦業(yè)務(wù)出現(xiàn)問題,相關(guān)模塊的數(shù)據(jù)能夠幫助管理員定位問題(如圖5所示)。
圖5 綜合SLA分析
這樣的管理辦法和思路給醫(yī)院數(shù)據(jù)中心運(yùn)維人員帶來的好處是不言而喻的,一方面豐富的SLA圖形報(bào)表使得業(yè)務(wù)的服務(wù)質(zhì)量清晰可見;另一方面,關(guān)鍵質(zhì)量指標(biāo)的數(shù)據(jù)使得定位問題不再無跡可循。
五、 結(jié)束語
當(dāng)前,醫(yī)院IT管理的復(fù)雜度及精細(xì)化要求越來越高。醫(yī)院數(shù)據(jù)中心的各種業(yè)務(wù)應(yīng)用的健康狀態(tài)將是管理的重中之重,因此需要做好數(shù)據(jù)中心的應(yīng)用可視化管理,使得各種業(yè)務(wù)的實(shí)時(shí)狀態(tài)等得到有效監(jiān)控,業(yè)務(wù)應(yīng)用出現(xiàn)故障時(shí)能第一時(shí)間通知到管理員,管理員通過各種業(yè)務(wù)可用性報(bào)表能對(duì)業(yè)務(wù)的總體情況清晰的把握。與此同時(shí)數(shù)據(jù)中心對(duì)應(yīng)用管理的要求也會(huì)向一體化、自動(dòng)化和系統(tǒng)化的方向發(fā)展,管理員將在一套系統(tǒng)內(nèi),既能了解網(wǎng)絡(luò)情況,又能了解應(yīng)用的情況,還能監(jiān)控各種應(yīng)用的網(wǎng)絡(luò)流量情況,并能通過自動(dòng)配置工具對(duì)數(shù)據(jù)中心進(jìn)行業(yè)務(wù)動(dòng)態(tài)調(diào)整,形成對(duì)數(shù)據(jù)中心應(yīng)用的全方位、智能化的管理。