पैरामीटर मान केवल डेटा पर निर्भर करते हैं
यह आपके प्रश्न का प्रमुख भाग है। यह वह जगह है जहाँ आप भ्रमित हैं।
हां, पैरामीटर मान डेटा पर निर्भर करते हैं। लेकिन डेटा तब तय होता है जब हम किसी मॉडल को फिट करते हैं। दूसरे शब्दों में, हम टिप्पणियों पर एक मॉडल सशर्त फिट होते हैं । यह अलग-अलग मॉडल की जटिलता की तुलना करने के लिए समझ में नहीं आता है जो अलग-अलग डेटासेट में फिट किए गए थे ।
और एक निश्चित डेटासेट के संदर्भ में, एक मॉडल
2+5x+x3
वास्तव में सबसे सरल संभव मॉडल के करीब है, अर्थात् फ्लैट शून्य मॉडल, की तुलना में
433+342x+323x3,
और यह आपकी टिप्पणियों के पैमाने की परवाह किए बिना रहता है।
संयोग से, अवरोधन (2 तथा 433आपके उदाहरण में) अक्सर दंडित नहीं किया जाता है, उदाहरण के लिए, अधिकांश लास्सो योगों में, क्योंकि हम आम तौर पर टिप्पणियों के समग्र औसत पर कब्जा करने के लिए स्वतंत्र रूप से भिन्न होने देते हैं। दूसरे शब्दों में, हम मॉडल को टिप्पणियों के औसत की ओर सिकोड़ते हैं, न कि एक पूर्ण शून्य मॉडल (जहां शून्य अक्सर मनमाना होगा)। इस अर्थ में, एक फ्लैट2 और एक फ्लैट 433 मॉडल को समान रूप से जटिल माना जाएगा।