?

網絡測試與故障查找

2009-09-27 06:10李清霞
中國教育技術裝備 2009年21期
關鍵詞:故障排查

李清霞

摘要 隨著Internet技術和網絡業務的飛速發展,用戶對網絡的應用需求空前增長,為了持續保障網絡高效的運行狀態,需要經常對網絡的重要指標進行提取與分析,不斷改善和提高網絡的性能。網絡測試的目標是及時發現網絡瓶頸和潛在隱患,為優化網絡配置和有效地進行網絡性能管理提供可靠的數據支撐,對網絡的服務質量指標進行量化、比較和驗證。著重探討網絡測試的對象、方法以及如何利用網絡測試技術查找局域網故障。

關鍵詞 網絡性能;網絡測試技術;故障排查

中圖分類號:TP393.06 文獻標識碼:B 文章編號:1671-489X(2009)21-0102-03

Network Testing and Troubleshooting//Li Qingxia

Abstract With the rapid development of Internet technology and network services, there is an unprecedented increase in the demand of the application of the network by its users. In order to constantly protect the efficient operation of the network, it needs frequent extraction and analysis of the important indicators of network to continuously perfect and improve its performance. The purpose of network testing is to detect its bottlenecks and potential problems, in order to optimize the network configuration and effective network performance management data to provide a reliable support and to quantify the quality of service indicators, to compare them and to verify them. This article focuses on the subject of network testing, as well as its methods and how to use its technology to locate the failures of local area network.

Key words network performance; network testing technology; troubleshooting

Authors address Guangdong University of Technology, Guangzhou, 510095, China

1 網絡測試的對象

1.1 網絡連接性網絡連接性也稱可用性、連通性或者可達性,指網絡連接設備與介質之間的物理或邏輯連接狀況。網絡連接的優劣直接影響網絡鏈路的性能和網絡的運行狀態,而且大多數的網絡鏈路故障都與網絡連接性有關。因此,網絡連接性是網絡測試的主要對象之一。

1.2 網絡延遲網絡延遲是指數據包經過一個或多個網段所經歷的時間,即數據包從發送至收到應答所需的時間段。網絡延遲由固定延遲和可變延遲2部分組成,固定延遲基本不變,由傳播延遲和傳輸延遲構成;可變延遲由中間路由器處理延遲和排隊等待延遲2部分構成。若網絡延遲過大,則網絡運行速度緩慢、通信阻塞甚至出現癱瘓現象[1,2]。

1.3 網絡丟包率網絡丟包率是指在一定范圍內數據包丟失部分與所傳數據包總數的比值。諸多因素會導致數據包在網絡上傳輸時被丟棄,例如數據包的大小不規范或數據發送時鏈路的擁塞狀況等。網絡丟包率高將直接影響網絡應用的正常使用,雖然網絡傳輸沒有中斷,但由于丟包率過高,還是不能完成用戶數據訪問[1,3]。

1.4 網絡帶寬網絡帶寬是指在單位時間內網絡節點傳輸的實際數據量,一般分為瓶頸帶寬和可用帶寬。瓶頸帶寬是傳輸通路中沒有其他背景流量時,網絡能夠提供的最大的吞吐量??捎脦捠窃诰W絡路徑存在背景流量的情況下,能夠提供的最大吞吐量。瓶頸帶寬反映路徑的靜態特征,可用帶寬反映在某時間段鏈路的實際通信能力。網絡對帶寬要求很高,例如當帶寬資源只剩下節點傳輸速率的1/3時,丟包率就會升高,同時也會引起網絡延遲問題。

1.5 網絡流量網絡流量分為包吞吐量和字節吞吐量2種,包吞吐量的定義是數據包的數量除以時間間隔,字節吞吐量的定義是數據包中總字節數除以時間間隔。隨著網絡流量的不斷增長以及網絡應用的日趨紛繁復雜化,網絡帶寬不斷減少,而盲目增加設備帶寬使網絡建設成本增高,又不能根本解決問題。只有對網絡流量進行捕捉、分析、監視和控制,才能找到網絡性能的瓶頸,優化網絡配置,滿足不同的網絡應用需求[1,3,4]。

2 網絡測試的方法

2.1 主動測試主動測試是在選定的測試點上利用測試工具,有目的地主動產生測試流量注入網絡,并根據測試數據流的傳送情況來分析網絡的性能。主動測試的優點是對測試過程的可控性比較高,靈活、機動,易于進行端到端的性能測試;缺點是注入的測試流量會改變網絡本身的運行情況,使得測試的結果與實際情況存在一定的偏差,而且測試流量還會增加網絡負擔。主動測試的應用十分廣泛,目前大多數測試系統都涉及主動測試[1,3,5]。

要對一個網絡進行主動測試,需要創建一個測試系統,包括4個部分:測試節點(探針)、中心服務器、中心數據庫和分析服務器。由中心服務器對測試節點進行控制,由測試節點執行測試任務,測試數據由中心數據庫保存,數據分析則由分析服務器完成。

2.2 被動測試被動測試是指在鏈路或設備(如路由器、交換機等)上利用測試設備對網絡進行監測,而不需要產生多余流量的測試方法。被動測試的優點在于理論上它不產生多余流量,不會增加網絡負擔;其缺點在于基本上是對單個設備的監測,很難對網絡端到端的性能進行分析,并且實時采集的數據量可能過大,另外還存在用戶數據泄漏等安全性和隱私問題。被動測試非常適合網絡流量測試。

2.3 主動測試與被動測試相結合主動測試與被動測試各有其優、缺點,而且對于不同的性能參數來說,主動測試和被動測試也都有其各自的用途。因此,將主動測試與被動測試相結合將會給網絡測試帶來新的發展[3,4]。

3 網絡測試的工具

3.1 線纜測試儀1)NS-468網線測試儀,用于測試RJ11、RJ45線纜,采用自動掃描的方式測試網絡電纜是否接通,跳線是否正確。2)Lantek6線纜測試儀,可測試帶寬達350 MHz,超過6類/ISO E級標準的線纜,嵌入式TDR功能并實現銅纜與光纖故障定位。3)FLUK DSP-4000線纜分析儀,快速準確地測試頻率可達350 MHz的高性能超5類、6類及光纖鏈路;支持近端串繞和回波損耗等測試標準;能識別和定位被測鏈路中的開路、短路和連接異常等問題;可監測以太網的流量及脈沖噪聲[3,5]。

3.2 網絡分析儀

1)Etherscope網絡通:分析網絡流量;搜索設備、網絡、VLAN、接入點、移動用戶;測量互聯網性能;搜索VLAN,查看端口狀態、連接的主機和流量趨勢;搜索網絡并通過IP子網、NetBIOS域名和IPX網絡分類查看設備;查看交換機詳細信息和端口流量統計信息。

2)OptiView網絡綜合協議分析儀。①可完成電纜測試、網絡流量測試、網絡設備搜尋等功能;可對信息包進行捕捉、解碼以及濾波;可直接對交換機或路由器進行設置;可作為網絡的數據采集儀器和遠程遙控測試儀。②實時遠程監測和故障診斷可以延伸至整個網絡。通過Java遠程用戶接口,可以直接從PC機上監測遠程的網絡,甚至解決那些非常棘手的間歇性故障。③能夠生成有關IP地址列表、NetBIOS設備列表、以太網利用率、碰撞和錯誤的測試報告;可遠程設置分析儀并通過網絡啟動分析儀開始測試;可迅速生成測試報告且連續地監測網段的變化和問題[2,4,5]。

3.3 測試軟件

1)QCHECK軟件,主要功能是向TCP、UDP、IPX、SPX網絡發送數據流,從而測試網絡的吞吐率、回應時間等。測試項目有TCP響應時間、TCP傳輸率、UDP串流傳輸率,還有CPU占用率及丟包率等。

2)網絡帶寬測試與監控軟件BWMeter 3.0:測量和顯示網絡的所有流量;自定義網絡帶寬可視化風格;能顯示所有的端口和網絡適配器;能顯示所有的網絡跟蹤;可統計每天、每周、每月、每年的網絡帶寬情況;具有自動報警功能;可生成基于端口和網卡的統計報表。

3)Sniffer Pro 4.6抓包軟件,主要用于分析網絡的流量,找出網絡中潛在的問題。例如網絡的某一段運行遲滯,報文發送緩慢,但又不知道問題出在什么地方,就可以用Sniffer來作出精確的問題判斷。軟件主要功能有:顯示網絡中所有機器的信息和交換機、路由器等網絡設備;顯示客戶機發送和接收的數據包數量,據此查看網絡中的數據流量大小;顯示請求響應時間,查看客戶機訪問網站的詳細情況;網絡工作不正常時,會自動記錄到警報日志中。

4)NetIQ Chariot v5.4軟件,可對網絡設備進行強度測試和對網絡應用軟件進行性能的評估,可以對網絡進行優化或對網絡變化產生的影響做出預測。軟件主要功能有:通過模擬各種真實的網絡應用流量來測試網絡和網絡設備;通過模仿各種應用程序所發出的網絡數據交換,對各種網絡進行評估;通過附帶的各種測試腳本,可以測試網絡的數據流量、響應時間以及數據吞吐量;能夠在中央控制室對遠程網絡進行點到點、點到多點、多點到多點甚至是組播的性能測試;能提供多達1萬個并發連接,在一個千兆鏈路上產生高達950兆左右的流量,模擬真實環境對設備及網絡進行全面的測量;可以很好地對網絡或網絡設備進行各種應力或極限測試[2,4,5]。

4 網絡測試輔助故障查找

網絡故障多種多樣,必須根據具體的故障現象,合理選擇軟硬件工具來輔助查找故障,盡快解決問題。以下討論如何利用網絡測試技術查找網絡故障。

4.1 故障查找流程圖(圖1)

4.2 案例剖析某子公司局域網的遠程用戶經常間歇性地不能訪問集團公司的OA遠程服務器,故障表現為登錄失敗。依照圖1故障查找流程,具體的診斷步驟如下。

1)正確描述故障現象。根據多次和反復的現場觀察,例如反復檢查用戶本機的IP設置等,證實該故障表現是屬于訪問失敗類型、時有時無的非永久性網絡故障。故障的性質既可能是操作系統也可能是物理故障,甚至是軟硬件故障兼而有之。

2)大致判斷故障區域。遠程服務器訪問失敗的故障區域,一般情況下覆蓋內網(局域網)屬下的有關子網和網絡的干路,同時也包括外網接入系統,故障牽涉的范圍比較廣。因此,排查的區域應該考慮用戶所在的子網、用戶的主機、相關的傳輸介質、在各層對應的交換機和路由器、被訪問的遠程服務器、寬帶共享接入系統等。

3)選擇工具隔離測試。根據故障所在區域和牽涉的有關對象,配備好網絡綜合分析測試儀、網絡通和線纜測試儀等測試工具,然后實施區域隔離,即在路由器的所有端口上只保留故障子網的接入,其他端口的子網接入全部臨時斷開。隔離完成之后在遠程OA服務器一側接入網絡通,故障子網所在的接入層交換機一側接入網絡綜合協議分析儀,測試整段數據鏈路的傳輸狀況[5,6]。

4)按OSI結構分層排查。測試結果是整段鏈路雖有數據包通過但流量時大時小甚至完全阻斷,顯然,該遠程網絡節點的數據傳輸不正常。如何深入排查呢?按照先近端(公司本部)、后遠端(集團公司)的排查原則,基于OSI七層結構從物理層向上依次查起。采用網絡綜合分析測試儀和線纜測試儀對各層的交換機和傳輸介質進行分段測試,得出各層交換機的性能和故障用戶所在工作區的線纜狀況是正常的,但發現接入層到匯聚層之間的干路線纜傳輸衰減比較嚴重,并有時通時斷的現象;再用網絡綜合分析測試儀檢查該鏈路的數據傳輸速率,卻只有7.5 Mbps[2,3,5]。

5)根據測試確認故障部位。通過綜合分析線纜測試的數據結果,判斷該段干路線纜可能會有問題。實地跟蹤檢查該線段沿途經過的路線及其健康狀況,發現在4樓轉彎暗角位置,線纜不知何時受過嚴重碰撞,已處于臨界斷裂狀態,故障部位找到。修復之后再重新測試整段鏈路的傳輸特性,各項指標均達到要求。

在實戰中,往往一次的測試可能只找到一個故障點,并不能最終解決問題,因為許多故障現象很可能是由N個故障點形成的,因此故障的排查是一個重復進行的過程。例如本案中線纜問題處理好之后,故障現象卻依然存在,說明還有其他故障點尚未找出來,必須重復上述排查步驟。繼續用網絡綜合分析測試儀檢查路由器的性能狀態和路由器的IP設置,沒有問題;再到遠端(集團公司)逐一排查線纜、路由器和OA服務器等有關軟硬件因素,也沒有問題。排查陷入僵局,唯有再重復一次?;氐阶庸竟收献泳W的接入層任選另一臺工作站,并配置遠程用戶的IP參數,正確輸入遠程用戶指定的賬號和密碼后,登錄訪問一切正常!證實故障點顯然在原有遠程用戶所在的主機[2,6]。

重新認真地檢查該主機的各項IP設置并沒有任何問題,只是發現它添加了無限制的共享打印服務;再逐一打開同一子網其他工作站的IP設置,發現都安裝了網絡打印機,而且DNS設置均指向遠程用戶所在的主機。卸除共享打印服務之后,故障自行消失。

6)故障產生的原因分析。第一個故障點產生的原因是線纜受損后似斷非斷,形成物理上間歇性的接觸不良,影響數據傳輸的穩定性和帶寬。其病源是綜合布線施工不規范,因為網絡干路屬于綜合布線垂直子系統,按規定必須敷設在大樓暗藏的豎井內而不能明敷,否則有線路故障時會影響其干路屬下的整片用戶群。第二個故障點產生的原因是在遠程工作站中添加共享打印服務,等于將自己的工作屬性改為打印服務器。由于子網內部打印任務比較繁忙,而工作站本身的系統資源又很有限,不能滿足多任務的工作方式,所以勢必造成自己訪問遠程OA服務器時不穩定,諸如上述間歇性訪問失敗的故障現象。故障病源是遠程用戶擅自將本機添加為打印服務器,類似這種人為的因素而導致網絡運行不穩定,是防不勝防的[2,6]。

5 小結

對于網絡故障的排查和分析,可以借助專用的網絡測試工具和設備,無論采用的是硬件還是軟件的方案,都對網絡故障查找有一定的幫助。在網絡測試中,依據故障現象來決定采取何種測試解決方案,需要長期的經驗積累及對相關測試工具的熟悉和了解。

參考文獻

[1]趙慶斌,馬素霞.網絡測試深入解析[M].北京:清華大學出版社,2003

[2]夏俊杰,周雪崢.網絡故障診斷與測試[M].北京:人民郵電出版社,2002

[3]曹慶華.網絡測試與故障診斷實驗教程[M].北京:清華大學出版社,2006

[4]王群,李馥娟.局域網優化與測試DIY[M].北京:人民郵電出版社,2001

[5]劉曉輝,王淑江.網絡管理必備工具軟件精解[M].北京:人民郵電出版社,2006

[6]楊軍.局域網典型故障排除實戰[M].北京:電子工業出版社,2007

猜你喜歡
故障排查
北京市海淀區新型自動氣象站故障排查分析
智能電表故障排查及其處理方法
電力通訊線路設備檢測方法及故障排查
淺議電子線路故障排查基本“三法”
沙溪口水電廠直流系統接地故障排查
區管FA16日常維護與典型案例分析
SDH告警產生原理分析與故障排查
電力類高職電氣二次回路技術課程常用故障排查方法的探討
電容器跳閘故障原因排查及防范
酒精噴燈常見故障的排查與維修
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合