मैं इस प्रतिक्रिया को प्रस्तुत करूंगा क्योंकि मैं पूरी तरह से गैविन के साथ सहमत हूं, और यदि आप किसी भी प्रकार के मॉडल को फिट करने में रुचि रखते हैं, तो यह अध्ययन के तहत घटना का प्रतिबिंबित होना चाहिए। किसी भी और सभी प्रभावों की पहचान करने के तर्क के साथ समस्या क्या है (और गैविन क्या कहता है जब वह डेटा ड्रेजिंग कहता है) यह है कि आप अनंत संख्या में बातचीत, या चर के लिए द्विघात नियम, या आपके डेटा में परिवर्तन के लिए फिट हो सकते हैं, और आप अपने डेटा की कुछ भिन्नता के लिए अनिवार्य रूप से "महत्वपूर्ण" प्रभाव पाएंगे।
जैसा कि chl बताता है, इन उच्चतर क्रम इंटरैक्शन प्रभावों की वास्तव में कोई व्याख्या नहीं है, और अक्सर निचले क्रम के इंटरैक्शन का भी कोई मतलब नहीं है। यदि आप एक कारण मॉडल को विकसित करने में रुचि रखते हैं, तो आपको केवल उन शर्तों को शामिल करना चाहिए जो आपको विश्वास है कि आपके आश्रित चर ए प्राथमिकता के लिए प्रासंगिक हो सकते हैं आपके मॉडल को फिट करने के हो सकते हैं।
यदि आपको लगता है कि वे आपके मॉडल की भविष्य कहनेवाला शक्ति को बढ़ा सकते हैं, तो आपको अपने मॉडल को ओवर-फिटिंग करने से रोकने के लिए मॉडल चयन तकनीकों पर संसाधनों को देखना चाहिए।