按照計算機故障性質(zhì)可以將網(wǎng)絡(luò )故障分為硬件故障和軟件故障兩大類(lèi)。在計算機發(fā)生故障時(shí)通常應該首先查看硬件,當排除了硬件故障后,再查看軟件問(wèn)題。
故障診斷作為一項比較復雜的工作,并沒(méi)有一個(gè)通用的法則可以遵循。但是,許多網(wǎng)絡(luò )管理員在長(cháng)期與故障打交道的過(guò)程中,積累了豐富的經(jīng)驗,并提出了故障診斷的一般步驟,這個(gè)步驟如下。
• 分析故障現象。
• 定位故障范圍。
• 隔離故障。
• 排除故障。
下面是具體分析故障排錯的步驟。
(1)認清癥狀。仔細記錄從其他人或系統中學(xué)來(lái)的解決問(wèn)題的方法,并把它放在手頭。
(2)驗證用戶(hù)權限。例如,確保用戶(hù)正確輸入了他的口令。
(3)限定問(wèn)題的范圍。它是全局性的嗎?即網(wǎng)上的所有用戶(hù)總是會(huì )碰到這個(gè)問(wèn)題嗎?或者問(wèn)題只發(fā)生在網(wǎng)絡(luò )上某一地理區域,某一特定的工作組,某一特定的時(shí)間段。
(4)重現故障,并且要保證能夠可靠地重新產(chǎn)生這個(gè)錯誤。
(5)驗證網(wǎng)絡(luò )物理連接(例如網(wǎng)絡(luò )連線(xiàn)、網(wǎng)絡(luò )接口卡的插槽、供電電源)的完整性。從受到影響的節點(diǎn)開(kāi)始,向主干網(wǎng)延伸。
(6)驗證網(wǎng)絡(luò )的軟件連接問(wèn)題(例如地址、協(xié)議綁定、軟件安裝等)。
(7)考慮近的網(wǎng)絡(luò )變更和可能因此導致的網(wǎng)絡(luò )問(wèn)題。
(8)實(shí)施解決方案。
(9)檢驗解決方案。
根據自己的觀(guān)察,可以從上面列表中的一步跳到另一步,減少所執行的檢查步驟。例如,如果檢測到一個(gè)網(wǎng)絡(luò )接口卡在工作站系統板上的安裝不正確,就可以直接跳到步驟(8)(在本例中,就是重新安裝網(wǎng)絡(luò )接口卡),而不用分析網(wǎng)絡(luò )的近變化情況??傊?,在排錯時(shí)需要利用常識。