मैं एनोवा सीखना चाहता हूं। इससे पहले कि मैं सीखना शुरू करूं कि एल्गोरिथ्म कैसे काम करता है (क्या गणना की जानी है) और यह क्यों काम करता है, मैं सबसे पहले यह जानना चाहता हूं कि हम वास्तव में एनोवा के साथ क्या समस्या हल करते हैं, या हम क्या जवाब देने की कोशिश करते हैं। दूसरे शब्दों में: इनपुट क्या है और एल्गोरिदम का आउटपुट क्या है?
मैं समझता हूं कि हम इनपुट के रूप में क्या उपयोग करते हैं। हमारे पास संख्याओं का एक समूह है। प्रत्येक संख्या एक या अधिक श्रेणीबद्ध चर ("कारक" के रूप में भी जाना जाता है) के मूल्यों के साथ आती है। उदाहरण के लिए:
+------------+------------+-------+
| factor 1 | factor 2 | value |
+------------+------------+-------+
| "A" | "a" | 1.0 |
| "A" | "a" | 2.4 |
| "A" | "b" | 0.3 |
| "A" | "b" | 7.4 |
| "B" | "a" | 1.2 |
| "B" | "a" | 8.4 |
| "B" | "b" | 0.4 |
| "B" | "b" | 7.2 |
+------------+------------+-------+
क्या यह कहना सही है कि ANOVA शून्य परिकल्पना के पी-मूल्य की गणना करता है जो बताता है कि मूल्यों के माध्यम पर कारकों का कोई प्रभाव नहीं है? दूसरे शब्दों में, हम ऊपर दिए गए डेटा को एल्गोरिथ्म में देते हैं और परिणामस्वरूप हमें शून्य परिकल्पना का पी-मूल्य मिलता है?
यदि यह मामला है, तो पी-वैल्यू की गणना करने के लिए हम वास्तव में किस उपाय का उपयोग करते हैं। उदाहरण के लिए, हम यह कह सकते हैं कि, शून्य परिकल्पना M को केवल 1% मामलों में संयोग से देखा जा सकता है (या इससे भी अधिक)। M क्या है?
क्या हम अलग से एनोवा में कारकों की जांच नहीं करते हैं? क्या ANOVA कह सकता है कि factor_1 का प्रभाव है, लेकिन factor_2 नहीं? क्या एनोवा कह सकता है, कि दिए गए कारक मानों के लिए "A", "B" और "C" समान हैं, सांख्यिकीय रूप से अप्रभेद्य हैं (उदाहरण के लिए समान अर्थ है), लेकिन मूल्य "D" का प्रभाव है?