摘要:服務器反應遲緩讓每個人都抓狂--最終用戶們焦急地等微軟PowerPoint文件打開,高級主管們希望能立馬收到電子郵件,身為數(shù)據(jù)中心管理人員,你必須聽取和解決他們抱怨的這些問題。
在如今越來越虛擬化的環(huán)境下,服務器性能問題比以往任何時候都要來得常見、嚴重。咨詢公司Glass House Technologies的虛擬化服務主管Erwin Vollering說:"在物理環(huán)境下,每臺服務器都有其各自的SCSI控制器、磁盤、內(nèi)存和處理器等部件。而現(xiàn)在,你在一個物理主機上的共享環(huán)境中運行10至15臺服務器,這些服務器同時處理同樣的任務,使用同樣的資源,一旦物理主機出現(xiàn)故障,統(tǒng)統(tǒng)崩潰。" 那么,你如何著手診斷這些問題,以便解決問題、繼續(xù)恢復運行?
服務器反應遲緩的診斷:
1.確保引起問題的是服務器 Extra Hop公司的首席執(zhí)行官兼創(chuàng)始人Jesse Rothstein表示,許多似乎來自服務器層面的性能問題常常是由網(wǎng)絡(luò)、數(shù)據(jù)庫和存儲系統(tǒng)等層面的問題引起的。Rothstein說:"最終,你需要通盤考慮和分析這些問題,不過實際做起來很棘手。" Fluke Networks公司的全球產(chǎn)品營銷經(jīng)理Dan Klimke說:"要是出現(xiàn)了延遲問題,我們需要看一下這個延遲最先出現(xiàn)在服務器,還是出現(xiàn)在網(wǎng)絡(luò)或客戶端層面。跟蹤分析癥狀需要耗費很多時間。" IT部門經(jīng)常把多臺服務器連接起來,為最終用戶提供資源(如應用程序)。Klimke說:"你可能有一臺基于Web的前端服務器與應用服務器進行對話,而該應用服務器與數(shù)據(jù)庫服務器進行對話,所有這些服務器通過某種網(wǎng)絡(luò)連接起來。所以在排除故障時,第一步就是確保問題確實來自某臺服務器,而不是來自網(wǎng)絡(luò)。" 2.搞定繁瑣累贅的應用程序 某個應用程序引起服務器反應遲緩或干脆停機,這完全有可能。Klimke說:"應用程序可能過于'繁瑣累贅'(chatty)--也就是說,這類應用程序?qū)懭霑r不是使用含有大量數(shù)據(jù)的大型幀、發(fā)送數(shù)量比較少的幀,而是使用最小的幀,因而到頭來只好來回頻繁地發(fā)送大量數(shù)據(jù),才能完成較大的幀所能完成的任務;相比之下,使用大型幀速度快得多、效率高得多。" 比如說,來自應用程序的某個命令可能發(fā)送到服務器,導致服務器出現(xiàn)問題。Klimke說:"看一下進入到服務器的實際數(shù)據(jù)流量,就能查出數(shù)據(jù)包進入到哪個環(huán)節(jié),服務器停機之前什么命令發(fā)送到了服務器。這勢必需要查看網(wǎng)絡(luò)連接上的實際數(shù)據(jù)流量,還需要能解讀就在服務器停機之前發(fā)送過去的命令和幀。" 3.清理骯臟的網(wǎng)絡(luò) Rothstein表示,骯臟的網(wǎng)絡(luò)是指數(shù)據(jù)包出現(xiàn)丟失、重新排序或碎片的網(wǎng)絡(luò),它會拖累服務器的性能,因而引起服務器性能下降、服務器負載加大。 他解釋:"大多數(shù)人沒有認識到,像TCP堆棧這些網(wǎng)絡(luò)協(xié)議堆棧既有快速路徑,又有慢速路徑。快速路徑很高效,針對它所要傳送的數(shù)據(jù)包進行了優(yōu)化,可以按順序傳送下一個數(shù)據(jù)包。但是如果你無序傳送數(shù)據(jù)包,或者無意中將數(shù)據(jù)包由第四層往下傳送到第三層,服務器和操作系統(tǒng)就會耗費大量的資源,用于重新組裝那些IP碎片,或者重新排序或重新組裝TCP片段。" 虛擬化可能會使這個問題復雜化。Rothstein說:"你的虛擬機管理程序是個調(diào)度程序……跨所有運行中的不同虛擬機和訪客操作系統(tǒng)共享處理器時間;如果從一個虛擬機切換到另一個虛擬機,難免會出現(xiàn)延遲。要是配置有誤,網(wǎng)絡(luò)數(shù)據(jù)包就會出現(xiàn)延遲,以至于被底層網(wǎng)絡(luò)堆棧丟棄;一旦你達到引爆點,性能衰減不僅僅顯而易見,還會帶來災難性后果。" 4.使用監(jiān)控工具 Rothstein表示,無論是執(zhí)行SNMP輪詢來記錄服務器健康指標的自動化第三方工具,還是比較簡單的免費開源工具,你都要充分利用監(jiān)控工具。 Vollering表示,如果你在使用虛擬化服務器,監(jiān)控工具顯得尤為重要。他表示,VMware、微軟和思杰這三大虛擬化技術(shù)提供商都提供優(yōu)秀的監(jiān)控工具。他說:"這些工具可以告訴你什么方面在給你的環(huán)境施加壓力,無論是處理器使用率、內(nèi)存使用率還是磁盤使用率。" Vollering表示,即使那些工具可供使用、部署到位,但是許多公司還是往往要么不知道自己可以使用它們,要么不知道如何使用。此外,這些工具會帶來洪水般的信息和警報。他說:"你可能得花一整天的時間來查閱各種圖表。" 那么,怎樣才能最有效地利用這些工具呢?Vollering說:"仔細閱讀使用手冊,針對自己的環(huán)境合理配置工具。那樣一來,要是出現(xiàn)了警報,你就知道需要探究警報,而不是由于工具仍采用默認的閾值進行配置而面臨洪水般的警報。"
服務器反應遲緩的最佳解決方式:
1.檢查服務器的物理資源 CDW公司的內(nèi)部解決方案架構(gòu)師Kelly Sather表示,一旦你查明了某個性能問題來自服務器層面,就要仔細檢查這臺問題服務器的物理資源。他說:“最好的情況是,只要添加另一個處理器或添加更多內(nèi)存這么簡單。” Fluke Networks公司的全球產(chǎn)品營銷經(jīng)理Dan Klimke補充說:"務必要看一下你的處理器利用率是不是因許多進程而過高。我們發(fā)現(xiàn),許多問題的出現(xiàn)完全歸因于磁盤塞滿了。" 2.校正和調(diào)整負載 多個虛擬服務器帶來的負載可能遠遠超出物理服務器的處理能力范圍。咨詢公司Glass House Technologies的虛擬化服務主管Erwin Vollering說:"你要知道自己的局限性。如果你在處理月度財務合并數(shù)字的同時拍攝快照,你的存儲系統(tǒng)就無力同時處理所有那些事務。" 3.實時遷移虛擬機 CDW公司的內(nèi)部解決方案架構(gòu)師KellySather表示,隨著工作負載加大、虛擬機數(shù)量激增,你可能會發(fā)現(xiàn)需要把一個引起問題的虛擬機遷移到另一個主機上,或者把"正常的"虛擬機卸載到另一個主機上,以便為需要資源的虛擬機騰出資源。VMware的vMotion和微軟的Hyper-V(以及其他技術(shù))都讓你可以將虛擬機實時遷移到其他主機上,根本不需要連接到最終用戶。
來源:機房360
石家莊服務器托管 石家莊服務器租用 石家莊機柜租用 石家莊機房 |