मैं 50 निरंतर व्याख्यात्मक चर का उपयोग करके एक द्विआधारी परिणाम की भविष्यवाणी करने की कोशिश कर रहा हूं (अधिकांश चर की सीमा है से binary )। मेरे डेटा सेट में लगभग 24,000 पंक्तियाँ हैं। जब मैं R में दौड़ता हूं , मुझे मिलता है:glm
Warning messages:
1: glm.fit: algorithm did not converge
2: glm.fit: fitted probabilities numerically 0 or 1 occurred
मैंने अन्य प्रतिक्रियाओं को पढ़ा है जो सही पृथक्करण का सुझाव देते हैं, हो सकता है, लेकिन मुझे विश्वास है कि मेरे डेटा में मामला नहीं है (हालांकि अर्ध-पूर्ण अलगाव मौजूद हो सकता है? मैं यह देखने के लिए कैसे परीक्षण कर सकता हूं कि क्या है?) । यदि मैं कुछ चर निकालता हूं, तो "अभिसरण नहीं" त्रुटि दूर हो सकती है। लेकिन ऐसा हमेशा नहीं होता है।
मैंने एक bayesglm
फ़ंक्शन में समान चर का उपयोग करने की कोशिश की और समान त्रुटियां प्राप्त कीं।
आप यह पता लगाने के लिए कि यहाँ क्या चल रहा है, क्या कदम उठाएंगे? आप यह कैसे पता लगा सकते हैं कि कौन से चर समस्याओं का कारण बन रहे हैं?
bayesglm
एक पूर्व को जोड़कर अलगाव से बचने की कोशिश की जाती है, लेकिन 24,000 पंक्तियों के साथ, संभवतया पूर्व संभावना से दलदल हो रहा है। सिकोड़ने की कोशिश करें prior.scale
, संभवतः एक बड़ी राशि द्वारा। स्वतंत्रता की पूर्व डिग्री को बढ़ाने पर भी विचार करें, जो अलगाव से जुड़े बड़े मूल्यों को नियंत्रित करने में मदद करेगा।
bayesglm