मेरे हाइपर वीएम की बेतरतीब ढंग से कनेक्टिविटी क्यों खराब हो रही है?


10

मुझे हर दो हफ्ते में एक बार अजीब तरह की कनेक्टिविटी की समस्या हो रही है।

पहला मेरा कॉन्फ़िगरेशन: मैं दो भौतिक मेजबानों (नोड 01 और नोड02) के साथ एक हाइपर वी फेलओवर क्लस्टर चला रहा हूं। होस्ट्स दोनों Windows Server 2008 R2 HyperV सर्वर (फ्री वाला) SP1 के साथ चल रहे हैं। उन मेजबानों पर मैं दो वीएम के प्रत्येक विंडोज सर्वर 2008 R2 वेब संस्करण को SP1 के साथ चला रहा हूं। मेरा स्टोरेज सर्वर विंडोज स्टोरेज सर्वर 2008 है जो iSCSI के माध्यम से जुड़ा हुआ है। दोनों होस्ट के साथ-साथ भंडारण सर्वर इंटेल की वेबसाइट से सीधे डाउनलोड किए गए नवीनतम नेटवर्क ड्राइवरों को चला रहे हैं।

यहाँ समस्या है: 99.99% समय, सब कुछ पूरी तरह से काम करता है। प्रत्येक दो-तीन सप्ताह में लगभग एक बार, VMs दोनों एक साथ नेटवर्क कनेक्टिविटी खो देंगे, इनकमिंग और आउटगोइंग दोनों। जब ऐसा होता है,

  1. मैं आरएमडी में आरडीपी नहीं कर सकता।
  2. मैं मेजबान में आरडीपी कर सकता हूं।
  3. मैं नोड पर राइट-क्लिक करके और 'वर्चुअल मशीन से कनेक्ट' का चयन करके फेलओवर क्लस्टर मैनेजर से वीएम से कनेक्ट कर सकता हूं
  4. एक बार जब मैं ऊपर # 3 में वर्णित के रूप में वीएम से जुड़ता हूं, तो मैं लैन पर किसी भी वेबसाइट या मशीनों से नहीं मिल सकता। VM के अंदर वर्चुअल नेटवर्क कनेक्शन को डिसेबल और री-इनेबल करने से समस्या ठीक नहीं होती है।
  5. अगर मैं वीएम को एक अलग नोड में ले जाता हूं, जो समस्या को ठीक करता है (अगले दो सप्ताह के लिए)।
  6. अगर मैं होस्ट को रिबूट करता हूं और उस पर VM को वापस ले जाता हूं, तो समस्या को ठीक करता है (अगले दो सप्ताह के लिए)।
  7. जब ऐसा होता है, तो विफल क्लस्टर VM को स्वचालित रूप से विफल नहीं करता है।
  8. किसी भी होस्ट या वीएम पर कोई असामान्य इवेंट लॉग एंट्री नहीं है।

यह ऊपर वर्णित के समान लक्षणों के साथ लगभग 5 बार हुआ है। मुझे नेटवर्क ड्राइवर या नेटवर्क हार्डवेयर समस्या पर संदेह है, लेकिन चूंकि मैं पहले से ही नवीनतम ड्राइवर चला रहा हूं, मुझे यकीन नहीं है कि इसके बारे में क्या करना है।

यह एक असली सिर-खरोंच है ... किसी भी विचार?

अपडेट करें

मुझे यहां एक बहुत ही समान मामला मिला: वायरल मशीन हाइपर वी क्लस्टर पर नेटवर्क कनेक्टिविटी खो देती है

अपडेट 7/29/2011

हॉटफ़िक्स स्थापित करने और नेटवर्क ड्राइवरों को अपडेट करने के बाद, मैं अभी भी उसी समस्या का सामना कर रहा हूं। हार्डवेयर विवरण मांगने वाली टिप्पणी के जवाब में, सर्वर एक इंटेल SR1670HV है, जो 1U चेसिस है जिसमें दो स्वतंत्र S5500HV मदरबोर्ड हैं। संचार मदरबोर्ड के एकीकृत एनआईसी के माध्यम से है जो इंटेल 82574L हैं। नेटवर्क ड्राइवर संस्करण 16.2.49.0 है।


क्या आप अपने हार्डवेयर (nics की संख्या) के बारे में धारावाहिक जोड़ सकते हैं
जिम बी

आपके पास सर्वर में एनआईसी का कौन सा ब्रांड / मॉडल है?
क्रिस एस

हार्डवेयर और एनआईसी के बारे में जानकारी ऊपर दी गई है।
माइक

आप किस ब्रांड / मॉडल स्विच से जुड़ रहे हैं?
ErnieTheGeek

मुझे MS hyperV सर्वर पर CentOS छवियों के साथ एक simular समस्या थी। क्या आपने प्रत्येक मशीन या एक साझा एनआईसी के लिए एनआईसी को समर्पित किया है? एक बार जब हम समर्पित एनआईसी में स्विच करने से इस समस्या को दूर चला गया ... कि हालांकि एक सच्चे ठीक नहीं है ...
n8whnp

जवाबों:


7

हम इस तरह की समस्या रखते थे जहां मैं हूं। मुझे सटीक विवरण याद नहीं है, लेकिन अंतिम समाधान एक आभासी नेटवर्क एडाप्टर को गतिशील रूप से असाइन किए गए एक परस्पर विरोधी मैक पते के साथ करना था। उन नीचे पिनिंग वे गतिशील नहीं थे बहुत मदद की। आप सामान्य रूप से ऐसा नहीं करना चाहते क्योंकि इससे वर्चुअल मशीन को अलग होस्ट में ले जाना कठिन हो सकता है, लेकिन इसने हमें इस उदाहरण में मदद की।

दूसरा हिस्सा यह है कि भौतिक नैक्स्ट ब्रॉडकॉम द्वारा बनाए गए थे और हमने वहां एक कॉन्फ़िगरेशन त्रुटि भी की थी, जहां एक पिछले व्यवस्थापक ने ब्रॉडकास्ट उपयोगिता का उपयोग करने के लिए दो बैंडविड्थ को एक साथ बेहतर बैंडविड्थ / थ्रूपुट के लिए होस्ट करने के लिए गलत तरीके से उपयोग करने की कोशिश की थी। हमने उस सेटअप को हटा दिया और nics में से एक को कॉन्फ़िगर किया, ताकि होस्ट मशीन पर इसका कोई आईपी न हो, लेकिन अभी भी वर्चुअल मेहमानों के लिए उपयोग किया जा सकता है। फिर हम प्रत्येक वर्चुअल मशीन को केवल एक निक या दूसरे का उपयोग करने के लिए सेट करते हैं, जो ऐतिहासिक ट्रैफ़िक के आधार पर लोड को संतुलित करता है। निश्चित रूप से इसका मतलब है कि यदि कोई एडॉप्टर या कनेक्शन नीचे जाता है तो कोई भी विफलता नहीं है, और हमने यह देखने के लिए अच्छी तरह से पालन नहीं किया है कि क्या यातायात समय के साथ संतुलित रहा है, लेकिन यह तब से रॉक ठोस स्थिर रहा है।


5

मुझे पता है कि यह एक पुराना प्रश्न है, लेकिन मैंने एक ही मुद्दे का सामना किया और इसे हल करने में इतना समय बर्बाद किया कि मुझे लगा कि मैं उस समाधान को साझा करूंगा जो मेरे लिए काम करता है। मुझे अपनी समस्या का हल यहां मिला:

http://invendows.wordpress.com/2008/03/06/network-issue-with-hyper-v/

मेरी स्थिति में समाधान VMs पर TCP ऑफ़लोडिंग को अक्षम करना था। मैं संबंधित खंड को लिंक से उद्धृत करूंगा:

टीसीपी ऑफ़लोडिंग को अक्षम करने के लिए मुझे ब्रॉडकॉम 8507 नेक्स्ट्रीम II एनआईसी से जुड़े प्रत्येक वीएम में एक नया रजिस्ट्री मूल्य बनाना और सेट करना पड़ा।

टीसीपी ऑफ़लोडिंग को अक्षम करने के लिए मैंने निम्नलिखित रजिस्ट्री परिवर्तन का उपयोग किया:

कुंजी: HKLM \ SYSTEM \ CurrentControlSet \ Services \ Tcpip \ Parameters

मान (DWORD): DisableTaskOffload = 1

प्रत्येक वीएम पर टीसीपी ऑफलोड को अक्षम करने के बाद इस तरह से सभी परेशानी खत्म हो गई थी और मैं कई वीएम को ब्रॉडकॉम 5708 नेक्स्ट्रीम II एनआईसी के एक एनआईसी पोर्ट से कनेक्ट करने में सक्षम था।

मेरे सर्वर में Broadcom NetExtremeएनआईसी है, इसलिए यह मेरे लिए लगता है कि इस मुद्दे का कारण निश्चित रूप से ड्राइवर से संबंधित था, लेकिन सेटिंग DisableTaskOffload= 1 ने मेरे लिए पूरी तरह से समस्या का समाधान किया। आशा है कि यह जानकारी किसी और को खोज के घंटे बचाता है!


1
+1, इस टिप के लिए धन्यवाद, मैं बिना किसी समस्या के कुछ दिनों से चल रहा हूं।
m0dest0

1
कोई बात नहीं, m0dest0। यह सुनकर खुशी हुई कि इसने आपकी मदद की। :)
ब्रूसहिल

3

मैं एक बहुत ही सरल हाइपर- V वातावरण में कुछ इसी तरह से चला हूं, और इस लेख को Microsoft पर चला रहा हूं। यदि आपकी वेब सर्वर भारी उपयोग की जाती है, तो आपकी स्थिति के साथ फिट होने के लिए लगता है।

http://support.microsoft.com/kb/974909 - एक हाइपर- V वर्चुअल मशीन का नेटवर्क कनेक्शन Windows Server 2008 R2- आधारित कंप्यूटर पर भारी आउटगोइंग नेटवर्क ट्रैफ़िक के अंतर्गत खो जाता है


आपके द्वारा संदर्भित KB आलेख पूर्व-SP1 था, लेकिन मैंने एक समान पोस्ट-SP1 एक किया था जो आशाजनक दिखता है: support.microsoft.com/kb/2263829
माइक

1
मैंने इसे उत्तर के रूप में हटा दिया क्योंकि मैंने हॉटफ़िक्स स्थापित किया था लेकिन समस्या अभी भी हो रही है। इसलिए, यह प्रश्न अनुत्तरित है ...
माइक

2

हमारे पास यही समस्या थी, हालांकि हमारे मामले में यह हर 24-48 घंटे था। मैं दोगुना जांच करूंगा कि आपका एंटीवायरस / फ़ायरवॉल उत्पाद हाइपर-वी के साथ सर्वर 2008 का समर्थन करता है, यदि नहीं, तो एक अलग (या अस्थायी रूप से हटाने योग्य यदि संभव हो तो) अपने एंटी-वायरस / फ़ायरवॉल उत्पाद को परीक्षण के रूप में देखें कि क्या समस्या दूर है। ।

Microsoft को कॉल करने और बाद में कई डंप / लॉग फ़ाइल अपलोड करने के बाद, उन्होंने निर्धारित किया कि हमारे मामले में TrendMicro OfficeScan अपराधी था। हम एक ऐसे संस्करण का उपयोग कर रहे थे जो हाइपर-वी पर स्पष्ट रूप से समर्थित नहीं था, एक बार जब हम नवीनतम रिलीज़ में अपग्रेड हो गए, तो समस्या दूर हो गई।


2

यह एक हार्डवेयर मुद्दा निकला - मैंने एक नेटगियर GSM7224v2 प्रबंधित स्विच में समस्या को अलग कर दिया, इसे डी-लिंक डीजीएस -820 डी के साथ बदल दिया, और सब कुछ तब से ठीक काम कर रहा है।

एक "सबक सीखा," के रूप में इस मामले में मैंने संभवतः अपने नैदानिक ​​प्रयास का 99% खर्च किया, जो कि हार्डवेयर समस्या के लिए सॉफ़्टवेयर सेटिंग्स का समस्या निवारण था। मैंने भी Microsoft समर्थन $ 259 का भुगतान किया (और उनके साथ फोन पर बहुत समय बिताया) मुझे सॉफ्टवेयर सेटिंग्स पर चारों ओर प्रहार करके यह पता लगाने में मदद करने के लिए। मुझे लगता है कि कहानी का नैतिक रूप से आपके हार्डवेयर पर उतना ही संदेह करना है जितना आपके सॉफ़्टवेयर में।


1

VM अतिथि के लिए नेटवर्क एडॉप्टर गुणों पर, क्या आपने जंबो पैकेट्स और लार्ज सेंड ऑफलोड को अक्षम कर दिया है? इन सेटिंग्स के साथ अपने अनुभव के आधार पर, मैं निश्चित रूप से इसकी कोशिश करूंगा।


हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.