LogisticRegressionCV में गैर-अभिसरण कैसे ठीक करें


13

मैं डेटा के एक सेट पर क्रॉसवालाइडेशन के साथ लॉजिस्टिक रिग्रेशन करने के लिए स्किकिट-लर्न का उपयोग कर रहा हूं (लगभग 14 पैरामीटर> 7000 सामान्य टिप्पणियों के साथ)। मेरे पास एक लक्षित क्लासिफायर है, जिसका मूल्य 1 या 0 है।

मेरे पास समस्या यह है कि इस्तेमाल किए गए सॉल्वर की परवाह किए बिना, मैं अभिसरण चेतावनी प्राप्त करता रहता हूं ...

model1 = linear_model.LogisticRegressionCV(cv=10,verbose=1,n_jobs=-1,scoring='roc_auc',solver='newton-cg',penalty='l2')

/home/b/anaconda/lib/python2.7/site-packages/scipy/optimize/linesearch.py:285: LineSearchWarning: The line search algorithm did not converge
  warn('The line search algorithm did not converge', LineSearchWarning)
/home/b/anaconda/lib/python2.7/site-packages/sklearn/utils/optimize.py:193: UserWarning: Line Search failed


model2 = linear_model.LogisticRegressionCV(cv=10,verbose=1,n_jobs=-1,scoring='roc_auc',solver='sag',penalty='l2')

max_iter reached after 2 seconds
max_iter reached after 2 seconds
max_iter reached after 2 seconds
max_iter reached after 2 seconds
max_iter reached after 2 seconds
max_iter reached after 2 seconds
max_iter reached after 2 second

model3 = linear_model.LogisticRegressionCV(cv=10,verbose=1,n_jobs=-1,scoring='roc_auc',solver='lbfgs',penalty='l2')

/home/b/anaconda/lib/python2.7/site-packages/sklearn/linear_model/logistic.py:701: UserWarning: lbfgs failed to converge. Increase the number of iterations.
  warnings.warn("lbfgs failed to converge. Increase the number "

model4 = linear_model.LogisticRegressionCV(cv=10,verbose=1,n_jobs=-1,scoring='roc_auc',solver='liblinear',penalty='l2')

    cg reaches trust region boundary
iter 18 act 1.382e+06 pre 1.213e+06 delta 1.860e+01 f 7.500e+06 |g| 1.696e+06 CG   8
iter  2 act 1.891e+06 pre 1.553e+06 delta 1.060e-01 f 1.397e+07 |g| 1.208e+08 CG   4
iter  4 act 2.757e+04 pre 2.618e+04 delta 1.063e-01 f 1.177e+07 |g| 2.354e+07 CG   4
iter 18 act 1.659e+04 pre 1.597e+04 delta 1.506e+01 f 7.205e+06 |g| 4.078e+06 CG   4
cg reaches trust region boundary
iter  7 act 1.117e+05 pre 1.090e+05 delta 4.146e-01 f 1.161e+07 |g| 9.522e+05 CG   4
iter 31 act 1.748e+03 pre 1.813e+03 delta 2.423e+01 f 6.228e+05 |g| 5.657e+03 CG  14

चेतावनियों को रोकने के लिए मुझे क्या करने की आवश्यकता है?


मुझे आश्चर्य है कि यह सही या निकट अलगाव का मामला है ।
साइकोरैक्स का कहना है कि मोनिका

जवाबों:


13

आप max_iterपैरामीटर बढ़ाने के लिए कार्यक्रम के सुझाव को लागू करके शुरू कर सकते हैं ; लेकिन ध्यान रखें कि यह भी संभव है कि आपका डेटा केवल एक लॉजिस्टिक मॉडल द्वारा फिट नहीं किया जा सकता है।


2
मुझे 4000 से अधिकतम_ट्रंप को टक्कर देना था, लेकिन इसने चाल चली। धन्यवाद!
user3188040

@ user3188040 आपको चलने में कितना समय लगा?
डेव लियू

मैं scikit में कुल नवाब हूं। मैं 4000 तक कैसे "टक्कर" अधिकतम_ट्रैट (मैक्स_टर?) कर सकता हूं।
रॉन जेन्सेन - हम सभी

LogisticRegression ऑब्जेक्ट बनाते समय आप max_iter value बदल सकते हैं। MODEL1 = linear_model.LogisticRegressionCV (max_iter = 4000)
psychonomics
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.