एक LAN के भीतर TCP रिट्रांसमिशन का कारण खोजना


25

हैलो सर्वर के दोष का दोष

मुझे लगभग 100 कंप्यूटर, 2 विंडोज डोमेन सर्वर और 12 वीओआईपी फोन के लैन के साथ एक परेशान समस्या है। लगभग एक साल पहले, हर हफ्ते या तो उनकी स्थापना के बाद से, हम एक वीओआईपी फोन को खुद को रीसेट करते हुए देखते हैं - कभी-कभी कॉल के बीच में। इसके साथ ही अक्सर कंप्यूटर पर कनेक्शन के अस्थायी नुकसान के संकेत होते हैं: नेटवर्क सर्वर तक पहुंचने के दौरान एक्सप्लोरर में जमा होता है, डेटाबेस सर्वर से कनेक्शन के नुकसान के कारण हमारे प्रशासन सॉफ़्टवेयर में त्रुटियां होती हैं।

मैं वीओआईपी पीबीएक्स और नेटवर्क के बाकी हिस्सों के बीच संबंध पर कुछ Wireshark की निगरानी कर रहा हूं। जब हम फोन रिस्टार्ट करते हैं, उस समय Wireshark रिट्रांस्ड टीसीपी पैकेट का एक झुरमुट उठाता है। Wireshark लॉग एक दिन में 5 पैकेटों से लेकर सैकड़ों तक रिट्रांसमिशन के 2 क्लस्टर दिखाता है। प्रत्येक क्लस्टर में वे मुख्य रूप से पीबीएक्स और वीओआईपी फोन के कुछ सेट के बीच हैं, लेकिन हमेशा एक ही सेट नहीं। अक्सर एक ही समय में एक ही स्विच से जुड़े फोन पर रिट्रांसमिशन होते हैं, लेकिन कभी-कभी नेटवर्क के विपरीत छोरों पर फोन पर एक साथ रिट्रांसमिशन होते हैं। आमतौर पर टीसीपी ट्रैफिक को पारित करने में कुछ संयोग से होने वाले बदलाव होते हैं, उदाहरण के लिए क्लाइंट मशीनों और फ़ाइल सर्वर के बीच।

जब नेटवर्क भारी भरकम होता है, तो रिट्रांसमिशन और फोन रिसेट में स्पाइक्स अच्छी तरह से संबंध नहीं बनाते हैं। वे दिन के दौरान थोड़ा अधिक होने लगते हैं, लेकिन ज्यादातर शाम के समय, जब ट्रैफिक कम हो रहा होता है। वे अक्सर देर रात में होते हैं जब अधिकांश कंप्यूटर बंद हो जाते हैं और यातायात सबसे कम होना चाहिए।

क्या आपके पास कोई विचार है जो इस तरह की समस्याओं के कारण का निदान करने में मदद कर सकता है? एक चीज जो मैंने अभी तक कोशिश नहीं की है, लेकिन होनी चाहिए, सभी स्विच के फर्मवेयर को अपडेट कर रहा है।


1
क्या मॉडल स्विच? प्रॉसेसर, मेमरी, आदि आँकड़े कैसे दिखते हैं? क्या आप एक प्रसारण डोमेन पर हैं? आप नेटवर्क पर अधिकतम थ्रूपुट के कितने करीब हैं?
ज्येफ्रे

क्या आप वीओआईपी प्रोटोकॉल का उपयोग कर रहे हैं? इसके अलावा, यूडीपी या टीसीपी का उपयोग करना?
क्रिस एस

सभी स्विच 3Com हैं: बेसलाइन 2924 - PWR प्लस (3CBLSG24PWR) x 2, 4200 (3C17304A) x 3, 4200 (3C17304) x 2, 2824-SPP प्लस (3C16487), 2250 प्लस (3C16476CS)। मुझे नहीं लगता कि वे प्रोसेसर या मेमोरी पर आंकड़े देते हैं, लेकिन मुझे अन्यथा सीखने की बहुत खुशी होगी। हाँ हम एक प्रसारण डोमेन पर हैं। मैं थ्रूपुट के बारे में नहीं जानता, मैं इसे मापने में देखूंगा।
असली

जवाबों:


17

टीसीपी रिट्रांसमिशन आमतौर पर नेटवर्क कंजेशन के कारण होते हैं। जिस समय समस्या होती है, बड़ी संख्या में प्रसारण पैकेट देखें। यदि आपके कैप्चर में प्रसारण ट्रैफ़िक का प्रतिशत कैप्चर किए गए कुल ट्रैफ़िक के लगभग 3% से ऊपर है, तो आपके पास निश्चित रूप से भीड़भाड़ है। नेटवर्क पर भौतिक परत (ARP) और नेटवर्क लेयर (नाम रिज़ॉल्यूशन) दोनों के लिए देखें। यदि आपको प्रसारण ट्रैफ़िक की उच्च मात्रा मिलती है, तो आप इसे कैप्चर डेटा से स्रोत पर ट्रेस कर सकते हैं।


9
इसके अलावा, टीसीपी रिट्रांसमिशन आपकी समस्या का कारण नहीं हैं, वे समस्या का एक लक्षण हैं।
जोवेवर्टी

मुझे यह उल्लेख करना चाहिए था कि यूडीपी प्रसारणों पर मेरी नज़र थी और वे प्रतिशोध के साथ संबंध नहीं रखते थे। यूडीपी प्रसारण में स्पांसरसाइज के साथ कुछ रीक्रिशन ट्रांसमिशन इवेंट्स का संयोजन होता है, लेकिन अधिकांश ऐसा नहीं करते हैं। मुझे एक और रूप मिला है और पाया है कि यूडीपी प्रसारण किसी भी 10 मिनट के समय सेगमेंट में 1.5% ट्रैफ़िक (लगभग 350 पैकेट) से अधिक नहीं है, और उस स्तर तक पहुंचना दुर्लभ है। हालाँकि मैंने ईथरनेट प्रसारण को नहीं देखा था। मैं अपने सभी वायरशार्क लॉग को फ़िल्टर करने के लिए अब एक स्क्रिप्ट चला रहा हूं। UDP प्रसारण और ईथरनेट प्रसारण के लिए अंगूठे का 3% नियम व्यक्तिगत या संयुक्त है?
असली

1
3% वास्तव में अंगूठे का नियम नहीं है। यह वही है जो मुझे बताया गया है और जो मैंने अपने परिवेश में देखा है। मैंने 10 से 20% तक की संख्या सुनी है, लेकिन मैंने पाया है कि एक बार जब यह 3 से 5% से अधिक हो जाता है तो यह आमतौर पर समस्याएं पैदा करता है। आपको सभी प्रसारण ट्रैफ़िक देखने की आवश्यकता है: ईथरनेट, नेटवर्क और मल्टीकास्ट प्रसारण, क्योंकि वे सभी भीड़ का कारण बन सकते हैं। मूल रूप से सभी स्विच पोर्ट पर प्रसारित होने वाला कोई भी ट्रैफ़िक ट्रैफ़िक होता है जिसे विश्लेषण और कम या समाप्त करने की आवश्यकता होती है।
जोवेवेट्टी

मुझे अभी भी एक लंबी अवधि में एक अच्छे संबंध के लिए जाँच करने के लिए एक बहुत अच्छा ग्राफ नहीं मिला है, लेकिन ईथरनेट प्रसारण काफी आशाजनक दिख रहे हैं। एक लॉग जहां रिट्रांसमिशन था, वह 3% प्रसारण के ऊपर था, दूसरा लगभग 6%। मुझे कम से कम एक समस्या मिली है: एक पुराना सर्वर ग्रैटुइटस एआरपी पैकेट की एक निरंतर धारा को बाहर कर रहा है।
असली

1
मुझे अत्यधिक एआरपी प्रविष्टियाँ arpeth.addr==ff:ff:ff:ff:ff:ff
मिलीं

2

आपके स्विच के ट्रैफ़िक आंकड़ों को इकट्ठा करने से आपको ऐसी अवधियाँ दिखाई दे सकती हैं, जहाँ आप क्षमता से अधिक या निकट चल रहे हैं। यह प्रतिक्रिया के समय सीमा के भीतर वापस नहीं आता है (जब अक्सर 3 सेकंड)। यह भीड़-भाड़ को तब तक बढ़ाता है जब तक कि भीड़भाड़ शमन तंत्र में किक नहीं करता।

स्ट्रीमिंग मीडिया का उपयोग करने वाले लोगों के लिए देखें जो कि बैंडवाथ को जल्दी से सोख सकते हैं।

आप ट्रैफ़िक को आकार देकर फ़ोन के लिए समस्या को कम करने में सक्षम हो सकते हैं। यह समस्या को अन्य उपयोगकर्ताओं के लिए ले जाएगा।


2

एक फैले हुए पेड़ के लूप या मेरे लिए एक प्रसारण तूफान की तरह लगता है, खासकर अगर रिट्रांसमिशन और मुद्दों को एक ही स्विच (जो भिन्न होता है) के लिए स्थानीयकृत किया जाता है। जब ऐसा होता है, तो आपके L2 डिवाइस पर पोर्ट स्टेट्स क्या हैं? शायद एक बुरा स्विच या खराब रूट ब्रिज प्राथमिकताएं? दिलचस्प समस्या है।


मुझे फैले पेड़ों पर पढ़ने के लिए प्रेरित करने के लिए धन्यवाद, जिसके बारे में मैं अनभिज्ञ हूँ। हालांकि मुझे नहीं लगता कि यह एक फैले हुए पेड़ का लूप हो सकता है, क्योंकि हमारे नेटवर्क में कोई अनावश्यक लिंक नहीं है (संभवतः अपने आप में एक समस्या है)। "आपके L2 डिवाइस पर पोर्ट स्टेट्स" द्वारा, क्या मैं सही हूं कि आप का मतलब है कि फैले ट्री एल्गोरिदम के परिणामस्वरूप स्विच को किस पोर्ट ने सक्षम किया है? हमने मैन्युअल रूप से रूट ब्रिज को कॉन्फ़िगर नहीं किया है, क्या ऐसा करना अच्छा होगा?
'14

एसटीपी से परिचित होना एक अच्छा विचार है, लेकिन यदि आप सुनिश्चित हैं कि आपके पास कोई अनावश्यक लिंक नहीं हैं, तो एसटीपी समस्या नहीं होगी।
जोवेवेट्टी

हाँ, यदि आपके पास निरर्थक लिंक नहीं हैं, तो यह समस्या नहीं होगी। पोर्ट स्टेट्स के अनुसार, हां, मेरा मतलब है कि जो फॉरवर्ड / ब्लॉक / लर्निंग हैं।
मैकजेफ

2

आपने शायद इसे हल कर दिया है क्योंकि यह बहुत लंबा हो गया है, लेकिन अनिवार्य रूप से आपको उन पोर्ट पर "पोर्ट फास्ट" को सक्षम करने की आवश्यकता है जिनके पास एंडपॉइंट (वॉयस फोन, वर्कस्टेशन, सर्वर) हैं। एक फोन पीडीयू भेज सकता है, अगर उस आदमी को रिबूट होता है, तो यह एसटीपी कन्वर्जेन्स का कारण बनेगा, जिससे एफडीबी टेबल फ्लश हो सकती है और सभी डिवाइस 4/5 स्टेप एसटीपी मस्ती से गुजर सकते हैं। "पोर्ट फास्ट" में एंडपॉइंट के साथ पोर्ट लगाकर वे प्रतीक्षा को छोड़ देते हैं और फ़ॉरवर्डिंग मोड पर जाते हैं।


1

उम्मीद है कि आपके फोन अन्य कंप्यूटरों से अलग सबनेट और वीएलएएन पर हैं?


नहीं, वे एक ही आईपी सबनेट पर हैं, और मुझे पूरा यकीन है कि वही वीएलएएन भी है। क्या यह एक गंभीर समस्या है? यह निश्चित रूप से लगता है कि यह एक अच्छा विचार होगा। मैं देख सकता हूं कि यह फोन और बाकी सब के लिए प्रसारण डोमेन को अलग कर देगा। क्या इसके कोई अन्य फायदे होंगे?
असली

हां, मैं फोन को एक समर्पित वीएलएएन पर जरूर रखूंगा।
ग्रेग आस्क्यू

1

यह एक दोषपूर्ण स्विच जैसे उपकरण का दोषपूर्ण टुकड़ा भी हो सकता है। क्या एक विशेष स्विच या नेटवर्क के एक हिस्से पर फोन / कंप्यूटर के लिए रिट्रांसमिशन सहसंबंधित है?

बस अपना जवाब थोड़ा विस्तार देने के लिए। सभी स्विच समान नहीं बनाए गए हैं, भले ही उनके पास एक ही चश्मा हो। कुछ दूसरों की तुलना में बहुत अधिक भार का सामना करने में सक्षम होते हैं क्योंकि उनके अंदर तेज प्रोसेसर होते हैं। यह हो सकता है कि आपके स्विच ग्रेड तक नहीं हैं।

मैं अपने सबसे अधिक परेशानी वाले वीओआइपी फोन में से कुछ को अपने फिजिकल स्विच में डालकर शुरू करता हूं और देखता हूं कि क्या जारी है। अगर यह दूर हो जाता है तो आप इसे जल्द ही हल करने की राह पर हैं।


काश उन्होंने ऐसा किया। वहाँ दो स्विच से जुड़े उपकरणों के साथ सबसे अधिक समस्या है, जो नेटवर्क के विपरीत छोर पर हैं। हालाँकि, नेटवर्क के अन्य हिस्सों में भी फोन के लिए महत्वपूर्ण प्रतिकार मौजूद हैं।
असली
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.