मेरे पास फ्लेस बुक नहीं है, इसलिए यह सब IIRC है।
पल के लिए टिप्पणियों में @ जॉनमोहेलर के प्रश्न का उत्तर देना: मूल प्रश्न IMHO जैसा है वैसा ही अचूक है।
तो मान लीजिए कि मेरे पास 30 नमूने हैं, और मैं प्रत्येक नमूने पर c1 और c2 का परीक्षण करता हूं, और प्रत्येक नमूने पर प्रत्येक के लिए सटीकता रिकॉर्ड करता हूं।
ऐसा करने से, आप एक 2 x 2 आकस्मिक तालिका के साथ समाप्त होते हैं, जो कि क्लासिफायर 2 सही / गलत के खिलाफ क्लासिफायर 1 सही / गलत है। जो कि मैकनेमर के परीक्षण के लिए शुरुआती बिंदु है । तो यह एक युग्मित तुलना के लिए है, जो "स्वतंत्र" अनुपात की तुलना में अधिक शक्तिशाली है (जो पूरी तरह से स्वतंत्र नहीं हैं यदि वे एक ही परिमित नमूने से यादृच्छिक रूप से ड्राइंग करते हैं)।
मैं अभी मैकनीमार के "छोटे प्रिंट" को नहीं देख सकता, लेकिन 30 नमूने ज्यादा नहीं हैं। तो आप भी McNemar से फिशर के सटीक परीक्षण [या कुछ और] जो द्विपद संभावनाओं की गणना करता है पर स्विच करना पड़ सकता है।
अनुपात के मायने:
यह मायने नहीं रखता कि आप 10 में से एक या एक ही क्लासिफायर 10x का परीक्षण करते हैं या एक बार उन सभी 100 मामलों के साथ (2 x 2 तालिका केवल सभी परीक्षण मामलों को गिनता है)।
यदि मूल प्रश्न में प्रत्येक क्लासिफायर के लिए सटीकता के 10 अनुमान यादृच्छिक पकड़ या 10-गुना क्रॉस सत्यापन या 10x आउट-ऑफ-बूटस्ट्रैप द्वारा प्राप्त किए जाते हैं, तो यह धारणा आमतौर पर है कि प्रत्येक क्लासिफायर के लिए गणना की गई 10 सरोगेट मॉडल समकक्ष हैं (= एक ही सटीकता है), इसलिए परीक्षण के परिणाम * जमा किए जा सकते हैं। 10-गुना क्रॉस सत्यापन के लिए आप तब मान लेते हैं कि परीक्षण नमूना आकार परीक्षण नमूनों की कुल संख्या के बराबर है। अन्य विधियों के लिए मैं इतना निश्चित नहीं हूं: आप एक ही मामले को एक से अधिक बार परख सकते हैं। डेटा / समस्या / आवेदन के आधार पर, यह किसी नए मामले का परीक्षण करने के लिए उतनी जानकारी नहीं है।
* यदि सरोगेट मॉडल अस्थिर हैं, तो यह धारणा टूट जाती है। लेकिन आप इसे माप सकते हैं: पुनरावृत्त -fold क्रॉस सत्यापन करें। प्रत्येक पूर्ण रन प्रत्येक मामले के लिए एक भविष्यवाणी देता है। इसलिए यदि आप कई अलग-अलग सरोगेट मॉडल पर एक ही परीक्षण के मामले की भविष्यवाणियों की तुलना करते हैं, तो आप कुछ प्रशिक्षण डेटा के आदान-प्रदान के कारण भिन्नता को माप सकते हैं। यह विचरण परिमित कुल नमूना आकार के कारण विचरण के अतिरिक्त है।k
अपने पुनरावृत्त सीवी परिणाम को "सही वर्गीकरण मैट्रिक्स" में एक पंक्ति में एक केस और सरोगेट मॉडल में से प्रत्येक कॉलम के अनुरूप रखें। अब पंक्तियों के साथ विचरण (सभी खाली तत्वों को हटाने) केवल सरोगेट मॉडल में अस्थिरता के कारण है। स्तंभों में विचरण इस सरोगेट मॉडल के परीक्षण के लिए आपके द्वारा उपयोग किए जाने वाले मामलों की परिमित संख्या के कारण है। कहो, तुम हो से बाहर सही predicitions एक कॉलम में परीक्षण मामलों। सटीकता के लिए बिंदु का अनुमान , यह विचरण अधीन है ।
जाँच करें कि परिक्षण के कारण विचरण बड़ा है या छोटा, परिक्षण परीक्षण नमूना आकार के कारण विचरण की तुलना में छोटा है।knp^=knσ2(p^)=σ2(kn)=p(1−p)n