क्यों हम बैंडविड्थ माप Cacti ग्राफ पर उच्च उतार-चढ़ाव प्राप्त करते हैं?


14

हम अपने नेटवर्क पर ईथरेनलाइन और रूटिंग के अतिरेक परीक्षण पर थे। इस हस्तक्षेप के दौरान हमने कुछ माप किए। हमारा निगरानी उपकरण ग्राफ के लिए कैक्टि है। निगरानी किए गए उपकरण VSS पर 4500-X है। प्रत्येक लिंक एक अलग भौतिक चेसिस पर है।

स्कीमा:

इथरचनेल 1

टेस्ट कालक्रम:
[t0] टी 1/1/14 पोर्ट पर लिंक शारीरिक रूप से हटा दिया गया था। Te2 / 1/14 सक्रिय है। Po1 चालू है।
[t0 + 15] Te1 / 1/14 पोर्ट पर लिंक सेवा में वापस आ गया और जाँच की कि ईथर 1 में पोर्ट वापस आ गया है
[t0 + 20] te1 / 1/14 पोर्ट पर लिंक को भौतिक रूप से हटा दिया गया था। Te2 / 1/14 सक्रिय है। Po1 चालू है।
[t0 + 35] Te1 / 1/14 पोर्ट पर लिंक सेवा में लौटा और जाँच की गई कि पोर्ट ईथरथल पीओ 1 में वापस आ गया है

हमारे परीक्षणों में, हमने कैक्टि (नीचे ग्राफ) के माध्यम से ट्रैफ़िक ईथरैनल पीओ 1 की निगरानी की और प्रवाह के मूल्य में महत्वपूर्ण बदलाव देखा जब हमने टी 1/1/14 लिंक (लिंक टी 2/1/14 संपत्ति) को रिवर्स के दौरान स्थिर किया। । हमने int Po1 पर भी काउंटरों की जाँच की और इन्हें काफी स्थिर बनाए रखा गया।

ग्राफ़

10G के दो इंटरफ़ेस एलएसीपी कॉन्फ़िगर किए गए एथरचैनल्स पर बंडल किए गए हैं। इथरांचेल के अंदर उनके 2 vlans हैं। एक मल्टीकास्ट ट्रैफ़िक के लिए और दूसरा इंटरनेट / ऑल ट्रैफ़िक के लिए।

क्या आप इस व्यवहार का एक संभावित कारण जानते हैं?


आपने प्रत्येक परीक्षा में कितना समय लिया?
लाफ

प्रत्येक पोर्ट डिसकनेक्शन 15min लेते हैं जैसा कि आप कालक्रम पर देख सकते हैं।
cgasp

आपका पोर्ट-चैनल कॉन्फ़िगर और लोड-बैलेंस टाइप दोनों तरफ क्या है? आप हमें अपने टेस्ट सूट और पैरामीटर्स के बारे में क्या बता सकते हैं जो उस ट्रैफ़िक को उत्पन्न करते हैं - एक प्रवाह, एकाधिक प्रवाह, प्रोटोकॉल, आदि
सामान्य नेटवर्क

10G के दो इंटरफ़ेस एलएसीपी कॉन्फ़िगर किए गए एथरचैनल्स पर बंडल किए गए हैं। इथरांचेल के अंदर उनके 2 vlans हैं। एक मल्टीकास्ट ट्रैफ़िक के लिए और दूसरा इंटरनेट / ऑल ट्रैफ़िक के लिए। प्रश्न अपडेट किया गया।
cgasp

परीक्षण राउटिंग प्रोटोकॉल और एथेरांचलाइन पर एक सामान्यवादी अतिरेक परीक्षण पर था। अगर एक लिंक नीचे जाता है तो क्या होता है। सभी परीक्षण उम्मीद के मुताबिक चलते हैं लेकिन हमें आश्चर्य है कि बैंडविटड की माप पर यह व्यवहार क्यों।
cgasp

जवाबों:


11

यती की टिप्पणी को विस्तार देने के लिए।

अगर मैं सही पढ़ रहा हूं तो आपका चुनाव अंतराल वास्तव में छोटा है, हर 10 सेकंड में। वहाँ कुछ कारण आप उस परिणाम मिल सकता है।

उपकरण पक्ष:

  • काउंटरों की खराब पसंद, यदि आप 32-बिट काउंटरों का उपयोग कर रहे हैं, तो वे हर ~ 3.4 सेकंड में लुढ़क सकते हैं यदि आप 10g मॉडल दर पर चल रहे हैं
  • काउंटर अपडेटिंग, कई बड़े डिवाइस केवल काउंटरों को एक मिनट में दो या तीन बार अपडेट करते हैं, और उन्हें कभी भी सिंक में होने पर भरोसा नहीं किया जा सकता है। हर 30 सेकंड में जितना कम होगा मैं मतदान को परेशान करूंगा, और फिर भी मैं किसी भी अलर्ट को ट्रिगर करने या कार्रवाई करने से पहले हमेशा कम से कम दो अंक चाहता हूं
  • सीपीयू प्रसंस्करण के लिए भेजे गए पैकेट के रूप में एक गोचा हो सकता है (नेटफ्लो शायद) को सीधे दूर गिना जा सकता है बनाम जिन्हें आरई बैचिंग नहीं किया जा रहा है (इसे जुनिपर एमएक्स पर देखा गया है)

ध्रुवीय पक्ष:

  • क्या मतदाता अंतराल पर सटीक रूप से मतदान कर रहा है, और यदि यह वास्तविक मतदान समय के साथ अपने परिणाम को इंजेक्शन नहीं दे रहा है (उदाहरण के लिए, yz सेकंड में x बिट्स) तो एक समझदार दर की गणना की जा सकती है
  • क्या होता है जब काउंटर रीसेट करते हैं, या SNMP GET का जवाब नहीं दिया जाता है, विभिन्न टूल अलग-अलग तरीकों से इनका जवाब देते हैं

1
यहां तक ​​कि अगर आप प्रत्येक एन को बहुत सटीक रूप से मतदान करते हैं, तो बॉक्स सटीक अंतराल पर एचडब्ल्यू काउंटरों को प्रदूषित नहीं कर सकता है, जिससे यह प्रतीत होता है कि टी 1, टी 2 में कोई ट्रैफ़िक वृद्धि नहीं दिखती है और टी 2, टी 3 लाइनरेट पर देखते हैं। अब आप जो सबसे सटीक परिणाम प्राप्त कर सकते हैं वह शायद math.stackexchange के दायरे में है, लेकिन मेरा मानना ​​है कि आप जो कर सकते हैं वह 2 * the_slowest_update_interval है, यदि बॉक्स हर 10 में अपडेट होता है, तो आप हर 20 में डेटा माप सकते हैं। लेकिन शायद कुछ आँकड़ों के जादू से आप इसे 10 के करीब बना सकते हैं (यहाँ समस्या यह है कि अद्यतन अंतराल सही समय पर नहीं है)
ytti

1
इसके अलावा, आप 10 सेकंड के मतदान अंतराल पर कैक्टि मामलों के साथ किस पोलर का उपयोग कर रहे हैं। मुझे उन कम मतदान अंतरालों पर डिफ़ॉल्ट पोलर के साथ बुरे अनुभव हुए हैं। स्पाइन या डिफॉल्ट पोलर का उपयोग करने पर कोई उल्लेख नहीं किया जाता है।
ब्रेट लाइकिंस

6

आपकी समस्या ऐसी है, जैसे आपका राउटर सैंपलिंग और आपका खुद का पोलिंग एक ही पल में हिट नहीं हो रहा है। यही है, भले ही मतदान अंतराल स्थिर है, मतदान अंतराल में अलग-अलग मात्रा में नमूने होते हैं, जो आपके गणित को ध्यान में नहीं रखते हैं।
विचार करें कि आपने t1, t2, t3 को चुना है, लेकिन t1, t2 अंतराल पर राउटर ने कुछ भी नमूना नहीं लिया है, इसलिए t1, t3 के बीच सभी ट्रैफ़िक t2, t3 परागित मान पर समाप्त हो गए हैं। इसकी दर को t2, t2 पर 0 और t2, t3 पर linerate पर होना चाहिए

अब मैं एक समाधान का सुझाव देने जा रहा हूं, लेकिन कृपया इसे किसी ऐसे व्यक्ति के साथ सत्यापित करें जिसे गणित की सरसरी समझ है।

पहला इंटरफ़ेस जिसमें आप रुचि रखते हैं (यदि ge-1/1/1 है):

snmpbulkwalk SWITCH ifDescr | grep ge-1/1/1

फिर आप इसका ifIndex नंबर देखेंगे, तो मान लें कि यह '42' है।

फिर कुछ ऐसा करें:

while true; do
  snmpbulkwalk SWITCH ifHCInOctets.42 >> DATA
  date >> DATA
  sleep 1
done

अब यह निर्धारित करने के लिए परिणामों का विश्लेषण करें कि काउंटर वास्तव में कितनी बार औसत रूप से अपडेट किए जा रहे हैं। (यदि आवश्यक हो तो विश्लेषण के लिए स्क्रिप्ट का उत्पादन कर सकता हूं)

फिर वह हिस्सा आता है जहां हमें गणित की आवश्यकता होगी, लेकिन मैं एक भोली समाधान सुझाऊंगा।

यदि आपका अपडेट अंतराल 10s है, तो हर 5s पर पोल बॉक्स, यानी जितनी बार अपडेट किया जाता है, उससे दोगुना। तब आपके नमूने होंगे

t0, t5, t10, t15, t20, t25, t30

अब यह आपका कच्चा डेटा होगा, जिसका आप उपयोग नहीं करेंगे, लेकिन आप वास्तविक नमूने इस तरह से प्राप्त करेंगे

s1 = (t0+t5+t10)/3
s2 = (t10+t15+t20)/3
s3 = (t20+t25+t30)/3

यहाँ तर्क यह है, कि हम आपके स्विच पर गलत मतदान अंतराल के प्रभाव को कम करने के लिए सीमाओं पर रिसाव करना चाहते हैं।

फिर आप s1, s2, s3 की साजिश रचेंगे और आपके पास अब जो आप देख रहे हैं, उसकी तुलना में बहुत अधिक चिकनी / सटीक परिणाम होना चाहिए।

हालांकि मुझे यकीन है कि यह उपन्यास समस्या नहीं है और मुझे यकीन है कि औपचारिक समाधान है कि कैसे इष्टतम सटीकता को पुनर्प्राप्त किया जाए, दुर्भाग्य से उस समाधान का उत्पादन करना मेरे कौशल सेट से बाहर है। कुछ math.stackexchange लोगों से निपटने के लिए बेहतर होगा।


3

चूंकि आप उसी दर से मतदान कर रहे हैं जब काउंटर अपडेट किए जाते हैं तो आप सिंक से बाहर होने की संभावना है।

विन्यास करके

snmp-server hc poll <<hundredths of a second>>

आप अंतराल को कम कर सकते हैं जिसमें एसएनएमपी काउंटर 1 सेकंड की तरह अपडेट किए जाते हैं। जब आप हर 10 सेकंड पर मतदान कर रहे हों, तो थ्रूपुट के लिए यह अधिक सटीक मूल्य का परिणाम होना चाहिए।

FYI करें, यह एक छिपी हुई कमांड है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.