model-evaluation पर टैग किए गए जवाब

मॉडल का मूल्यांकन करने पर, नमूना या आउट-ऑफ-सैंपल।

7
वर्गीकरण मॉडल का आकलन करने के लिए सटीकता सबसे अच्छा उपाय क्यों नहीं है?
यह एक सामान्य प्रश्न है जिसे यहां परोक्ष रूप से कई बार पूछा गया था, लेकिन इसमें एक भी आधिकारिक उत्तर का अभाव है। संदर्भ के लिए इसका विस्तृत उत्तर देना बहुत अच्छा होगा। सटीकता , सभी वर्गीकरणों के बीच सही वर्गीकरण का अनुपात बहुत सरल और बहुत "सहज" उपाय …

7
बड़ी संख्या में सुविधाओं के लिए सर्वश्रेष्ठ पीसीए एल्गोरिथ्म (> 10K)?
मैंने पहले स्टैकऑवरफ्लो पर यह पूछा था, लेकिन ऐसा लगता है कि यह यहां अधिक उपयुक्त हो सकता है, यह देखते हुए कि इसे एसओ पर कोई जवाब नहीं मिला। यह आँकड़ों और प्रोग्रामिंग के बीच चौराहे की तरह है। पीसीए (प्रिंसिपल कंपोनेंट एनालिसिस) करने के लिए मुझे कुछ कोड …

5
रैंडम फ़ॉरेस्ट एल्गोरिथ्म का अनुकूलित कार्यान्वयन
मैंने देखा है कि ALGLIB, Waffles और कुछ R संकुल जैसे यादृच्छिक वन के कुछ कार्यान्वयन हैं randomForest। क्या कोई मुझे बता सकता है कि क्या ये पुस्तकालय अत्यधिक अनुकूलित हैं? क्या वे मूल रूप से सांख्यिकीय सीखने के तत्वों में विस्तृत यादृच्छिक जंगलों के बराबर हैं या बहुत सारे …

3
क्लस्टरिंग विधि का चयन कैसे करें? एक क्लस्टर समाधान (विधि पसंद को वारंट करने के लिए) को कैसे मान्य किया जाए?
क्लस्टर विश्लेषण के साथ एक सबसे बड़ा मुद्दा यह है कि हम अलग-अलग निष्कर्ष निकालने के लिए हो सकते हैं, जब विभिन्न क्लस्टरिंग विधियों का उपयोग किया जाता है (पदानुक्रमित क्लस्टरिंग में विभिन्न लिंकेज विधियों सहित)। मैं इस पर आपकी राय जानना चाहूंगा - आप किस विधि का चयन करेंगे, …

1
क्रॉस-सत्यापन का दुरुपयोग (सबसे अच्छा हाइपरपरमीटर मान के लिए प्रदर्शन प्रदर्शन)
हाल ही में मैं एक पेपर पर आया हूं जो एक विशिष्ट डेटासेट पर k-NN क्लासिफायर का उपयोग करने का प्रस्ताव करता है। लेखकों ने विभिन्न k मानों के लिए k-fold क्रॉस सत्यापन करने के लिए उपलब्ध सभी डेटा नमूनों का उपयोग किया और सबसे अच्छा हाइपरमीटर व्यास कॉन्फ़िगरेशन के …

3
लॉजिस्टिक रिग्रेशन का मूल्यांकन और होस्मेर-लेमेशो गुडनेस ऑफ फिट की व्याख्या
जैसा कि हम सभी जानते हैं कि लॉजिस्टिक रिग्रेशन मॉडल का मूल्यांकन करने के 2 तरीके हैं और वे बहुत अलग चीजों का परीक्षण कर रहे हैं प्रिडिक्टिव पावर: एक सांख्यिकीय प्राप्त करें जो मापता है कि आप स्वतंत्र चर के आधार पर निर्भर चर की कितनी अच्छी भविष्यवाणी कर …

3
अत्यधिक असंतुलित डेटा के लिए वर्गीकरण / मूल्यांकन मेट्रिक्स
मैं एक धोखाधड़ी का पता लगाने (क्रेडिट-स्कोरिंग जैसी) समस्या से निपटता हूं। जैसे कि धोखाधड़ी और गैर-धोखाधड़ी टिप्पणियों के बीच अत्यधिक असंतुलित संबंध है। http://blog.revolutionanalytics.com/2016/03/com_class_eval_metrics_r.html विभिन्न वर्गीकरण मीट्रिक का एक बड़ा अवलोकन प्रदान करता है। Precision and Recallया kappaदोनों एक अच्छा विकल्प लगते हैं: ऐसे क्लासिफायर के परिणामों को सही …


1
मूल्यांकन के रूप में AUC के बजाय सामान्यीकृत Gini स्कोर का उपयोग क्यों करें?
कागल की प्रतियोगिता पोर्टो सेगुरो के सेफ ड्राइवर प्रेडिक्शन नॉर्मलाइज्ड गिनी स्कोर का मूल्यांकन मैट्रिक के रूप में करता है और इससे मुझे इस पसंद के कारणों के बारे में पता चला। मूल्यांकन के लिए एयूसी जैसे सबसे सामान्य मैट्रिक्स के बजाय सामान्यीकृत गिन्नी स्कोर का उपयोग करने के क्या …

1
दो मॉडल की तुलना जब आरओसी वक्र एक दूसरे को पार करते हैं
दो या दो से अधिक वर्गीकरण मॉडल की तुलना करने के लिए उपयोग किया जाने वाला एक सामान्य उपाय आरओसी वक्र (एयूसी) के तहत क्षेत्र का उपयोग अपने प्रदर्शन का अप्रत्यक्ष रूप से आकलन करने के लिए है। इस मामले में एक बड़े AUC के साथ एक मॉडल आमतौर पर …

2
फी, मैथ्यू और पियर्सन सहसंबंध गुणांक के बीच संबंध
क्या Phi और मैथ्यू सहसंबंध गुणांक समान अवधारणा हैं? वे कैसे संबंधित या दो बाइनरी चर के लिए पियर्सन सहसंबंध गुणांक के बराबर हैं? मुझे लगता है कि बाइनरी मान 0 और 1 हैं। दो बर्नौली यादृच्छिक चर और बीच पियर्सन का संबंध है:यएक्सएक्सxyyy ρ=E[(x−E[x])(y−E[y])]Var[x]Var[y]−−−−−−−−−−√=E[xy]−E[x]E[y]Var[x]Var[y]−−−−−−−−−−√=n11n−n1∙n∙1n0∙n1∙n∙0n∙1−−−−−−−−−−√ρ=E[(x−E[x])(y−E[y])]Var[x]Var[y]=E[xy]−E[x]E[y]Var[x]Var[y]=n11n−n1∙n∙1n0∙n1∙n∙0n∙1 \rho = \frac{\mathbb{E} [(x - …

3
शास्त्रीय आंकड़ों में इस्तेमाल होने वाला होल्डआउट तरीका (प्रशिक्षण और परीक्षण में डेटा को विभाजित करना) क्यों नहीं है?
डेटा माइनिंग के लिए मेरी कक्षा के एक्सपोज़र में, मॉडल प्रदर्शन का आकलन करने के तरीके के रूप में होल्डआउट विधि पेश की गई थी। हालांकि, जब मैंने रैखिक मॉडल पर अपनी पहली कक्षा ली, तो इसे मॉडल सत्यापन या मूल्यांकन के साधन के रूप में पेश नहीं किया गया …

1
फिशर का सटीक परीक्षण और हाइपरजोमेट्रिक वितरण
मैं फिशर सटीक परीक्षण को बेहतर तरीके से समझना चाहता था, इसलिए मैंने निम्नलिखित खिलौना उदाहरण तैयार किया, जहां एफ और एम पुरुष और महिला से मेल खाते हैं, और n और y इस तरह से "सोडा की खपत" से मेल खाती है: > soda_gender f m n 0 5 …

2
स्किट-लर्न में और विचरण स्कोर के बीच अंतर क्या है ?
मैं अजगर स्किट-लर्न मैनुअल में रिग्रेशन मेट्रिक्स के बारे में पढ़ रहा था और भले ही उनमें से हर एक का अपना सूत्र हो, मैं सहजता से नहीं बता सकता कि और विचरण स्कोर में क्या अंतर है और इसलिए जब एक या दूसरे का मूल्यांकन करना हो मेरे मॉडल।R2R2R^2

5
क्यों एफ बीटा स्कोर बीटा को उसी तरह परिभाषित करता है?
यह F बीटा स्कोर है: Fβ=(1+β2)⋅precision⋅recall(β2⋅precision)+recallFβ=(1+β2)⋅precision⋅recall(β2⋅precision)+reसीएएलएलF_\beta = (1 + \beta^2) \cdot \frac{\mathrm{precision} \cdot \mathrm{recall}}{(\beta^2 \cdot \mathrm{precision}) + \mathrm{recall}} विकिपीडिया लेख में कहा गया है कि ।एफβएफβF_\beta "measures the effectiveness of retrieval with respect to a user who attaches β times as much importance to recall as precision" मुझे विचार नहीं …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.