मेरे एक्सईएन सर्वर के लिए हमारी iSCSI सैन क्लस्टर खुले iSCSI साथ openSUSE 11.1 है। सैन मॉड्यूल एक वर्चुअल आईपी के पीछे एक आईपी फेलओवर समूह में हैं, जो सर्जक कनेक्ट करते हैं।
इस घटना में कि प्राथमिक SAN सर्वर नीचे चला जाता है, द्वितीयक लक्ष्य के रूप में सेवा करने की भूमिका को चुनता है। यह सभी LeftHand SAN / iQ सॉफ्टवेयर द्वारा नियंत्रित किया जाता है और अधिकांश स्थितियों में अच्छी तरह से काम करता है।
मेरे पास समस्या यह है कि कभी-कभी मेरे कुछ एक्सएमओयू के पास अपने रूट फाइलसिस्टम को एक आईपी विफलता के बाद केवल पढ़ने के लिए जाना होगा। यह सुसंगत नहीं है, और हर बार एक असफल होने पर एक अलग सबसेट के लिए होता है। वे सभी एक ही खुले 11.1 सॉफ्टवेयर छवि को चला रहे हैं।
प्रत्येक DOMU के लिए रूट फाइलसिस्टम को DOM0 में ओपन-इस्की द्वारा माउंट किया जाता है और फिर एक्सएमयू को एक्सपोज करने के लिए मानक ब्लॉक डिवाइस ड्राइवर का उपयोग करता है।
सटीक लक्षण यह है कि रनिंग के रूप में रूट touch /test"रीड ओनली फाइलसिस्टम" त्रुटि देता है। हालाँकि, आउटपुट mountइसे शो-रीड-माउंटेड के रूप में दिखाता है। बेशक, डॉमू पर अन्य सभी I / O भी इस समय विफल हो रहे हैं, इसलिए मशीन मुश्किल से नीचे आती है। बस इसे xmISCSI सत्र को फिर से जोड़ने के बिना DOM0 से फिर से शुरू करने से सब कुछ फिर से काम हो जाता है।
DOM0 की ओर असफल-ओवर के दौरान syslog संदेश कुछ इस तरह हैं:
kernel: connection1:0: iscsi: detected conn error (1011)
iscsid: Kernel reported iSCSI connection 1:0 error (1011) state (3)
iscsid: connection1:0 is operational after recovery (1 attempts)
मुझे इस समस्या को दूर करने के लिए एक कठिन समय मिल रहा है, क्या यह डोमु कर्नेल में कुछ है? या DOM0 या Xen स्तर पर? मुझे लगता है कि कहीं न कहीं कुछ पैरामीटर की संभावना है जो कि किसी प्रकार के टाइमआउट को बढ़ाने के लिए ट्विकिंग की आवश्यकता है, लेकिन मुझे यकीन नहीं है कि कहाँ देखना है।
मुझे नहीं लगता कि यह केवल ओपन-इस्की के साथ एक मुद्दा है क्योंकि कनेक्टेड ब्लॉक डिवाइस अभी भी DOM0 से पठनीय और उपलब्ध है।