मेरे एक्सईएन सर्वर के लिए हमारी iSCSI सैन क्लस्टर खुले iSCSI साथ openSUSE 11.1 है। सैन मॉड्यूल एक वर्चुअल आईपी के पीछे एक आईपी फेलओवर समूह में हैं, जो सर्जक कनेक्ट करते हैं।
इस घटना में कि प्राथमिक SAN सर्वर नीचे चला जाता है, द्वितीयक लक्ष्य के रूप में सेवा करने की भूमिका को चुनता है। यह सभी LeftHand SAN / iQ सॉफ्टवेयर द्वारा नियंत्रित किया जाता है और अधिकांश स्थितियों में अच्छी तरह से काम करता है।
मेरे पास समस्या यह है कि कभी-कभी मेरे कुछ एक्सएमओयू के पास अपने रूट फाइलसिस्टम को एक आईपी विफलता के बाद केवल पढ़ने के लिए जाना होगा। यह सुसंगत नहीं है, और हर बार एक असफल होने पर एक अलग सबसेट के लिए होता है। वे सभी एक ही खुले 11.1 सॉफ्टवेयर छवि को चला रहे हैं।
प्रत्येक DOMU के लिए रूट फाइलसिस्टम को DOM0 में ओपन-इस्की द्वारा माउंट किया जाता है और फिर एक्सएमयू को एक्सपोज करने के लिए मानक ब्लॉक डिवाइस ड्राइवर का उपयोग करता है।
सटीक लक्षण यह है कि रनिंग के रूप में रूट touch /test
"रीड ओनली फाइलसिस्टम" त्रुटि देता है। हालाँकि, आउटपुट mount
इसे शो-रीड-माउंटेड के रूप में दिखाता है। बेशक, डॉमू पर अन्य सभी I / O भी इस समय विफल हो रहे हैं, इसलिए मशीन मुश्किल से नीचे आती है। बस इसे xm
ISCSI सत्र को फिर से जोड़ने के बिना DOM0 से फिर से शुरू करने से सब कुछ फिर से काम हो जाता है।
DOM0 की ओर असफल-ओवर के दौरान syslog संदेश कुछ इस तरह हैं:
kernel: connection1:0: iscsi: detected conn error (1011)
iscsid: Kernel reported iSCSI connection 1:0 error (1011) state (3)
iscsid: connection1:0 is operational after recovery (1 attempts)
मुझे इस समस्या को दूर करने के लिए एक कठिन समय मिल रहा है, क्या यह डोमु कर्नेल में कुछ है? या DOM0 या Xen स्तर पर? मुझे लगता है कि कहीं न कहीं कुछ पैरामीटर की संभावना है जो कि किसी प्रकार के टाइमआउट को बढ़ाने के लिए ट्विकिंग की आवश्यकता है, लेकिन मुझे यकीन नहीं है कि कहाँ देखना है।
मुझे नहीं लगता कि यह केवल ओपन-इस्की के साथ एक मुद्दा है क्योंकि कनेक्टेड ब्लॉक डिवाइस अभी भी DOM0 से पठनीय और उपलब्ध है।