क्या एक मॉडल डेटा के लिए फिट है या एक मॉडल के लिए डेटा फिट है?


20

क्या एक मॉडल को डेटा को फिट करने और मॉडल को डेटा को फिट करने के बीच एक वैचारिक या प्रक्रियात्मक अंतर है? पहली वर्डिंग का एक उदाहरण https://courses.washington.edu/matlab1/ModelFitting.html में देखा जा सकता है , और दूसरे का https://reference.wolfram.com/applications/eda/FittingDoToLinearModelsByLeast-SquaresTechniques.html में देखा जा सकता है। ।


7
+1 मैं दूसरे लिंक से प्रभावित नहीं हूं, लेकिन मैं मनोरंजन कर रहा हूं।
लैकॉनिक

कई मॉडल वर्तमान डेटा को फिट करते हैं, लेकिन डेटा आमतौर पर सबसे अच्छा एक मॉडल फिट बैठता है
अग्निअस वासिलियास्कस

जवाबों:


35

आपके द्वारा लिंक किए गए वोल्फ्राम स्रोत को छोड़कर किसी भी स्रोत या व्यक्ति के साथ बहुत अधिक बातचीत करने से उस प्रक्रिया का उल्लेख होता है जो डेटा को मॉडल बनाने के लिए उपयुक्त है । यह समझ में आता है, क्योंकि मॉडल गतिशील वस्तु है और डेटा स्थिर (उर्फ निश्चित और स्थिर) है।

इस पर एक बिंदु रखने के लिए, मुझे लैरी वासरमैन का दृष्टिकोण पसंद है। उनके कहने में, एक सांख्यिकीय मॉडल वितरण का एक संग्रह है। उदाहरण के लिए, सभी सामान्य वितरणों का संग्रह:

{Normal(μ,σ):μ,σR,σ>0}

या सभी पॉइसन वितरण का सेट:

{Poisson(λ):λR,λ>0}

डेटा के वितरण को फिट करना किसी भी एल्गोरिथ्म है जो डेटा के एक सेट के साथ एक सांख्यिकीय मॉडल को जोड़ता है (डेटा तय हो गया है), और मॉडल से वितरण का ठीक एक चुनता है जैसा कि "सर्वश्रेष्ठ" डेटा को दर्शाता है।

मॉडल वह चीज़ है जो बदलता है (सॉर्ट करता है): हम इसे संभावनाओं के एक पूरे संग्रह से एक सबसे अच्छे विकल्प में ढहा रहे हैं। डेटा सिर्फ डेटा है; इससे कुछ नहीं होता है।


16

रस्स मॉडलिंग के क्षेत्र में डेटा को मॉडल में फिट करना आम है। मॉडल को सही माना जाता है और यह डेटा खोजने के लिए विश्लेषक का काम है जो इसके अनुरूप है। विकिपीडिया लेख रैश पर कैसे और क्यों के बारे में अधिक विवरण होता है।

लेकिन मैं दूसरों से सहमत हूं कि सामान्य रूप से आंकड़ों में हम मॉडल को डेटा में फिट करते हैं क्योंकि हम मॉडल को बदल सकते हैं लेकिन यह डेटा को चुनने या संशोधित करने के लिए बुरा रूप है।


7

आमतौर पर, देखे गए डेटा को ठीक किया जाता है जबकि मॉडल को म्यूट किया जाता है (जैसे कि मापदंडों का अनुमान लगाया जाता है), इसलिए यह वह मॉडल है जो डेटा को फिट करने के लिए बनाया गया है, न कि दूसरे तरीके से । (आमतौर पर लोग इस मामले का मतलब है जब वे या तो अभिव्यक्ति कहते हैं।)

जब लोग कहते हैं कि वे एक मॉडल के लिए डेटा फिट करते हैं तो मैं खुद को यह पता लगाने की कोशिश कर रहा हूं कि उन्होंने डेटा के लिए क्या किया?

[अब यदि आप डेटा बदल रहे हैं , तो यकीनन यह 'एक मॉडल के लिए डेटा फिटिंग' होगा, लेकिन लोग इस मामले के लिए लगभग कभी नहीं कहते हैं।]


5
आउटलेर्स को हटाना भी (यकीनन) "एक मॉडल के लिए फिटिंग डेटा" होगा।
फेडेरिको पोलोनी

1
यदि वे इसके बारे में सोच रहे हैं, तो यह वाक्यांश "फिटिंग (एक मॉडल के लिए डेटा)" के रूप में हो सकता है। यही है, आप फिटिंग की एक प्रक्रिया कर रहे हैं, और फिटिंग की प्रक्रिया डेटा से शुरू होती है और इसे एक मॉडल में बदल देती है। मैं सहमत हूं कि "Y (पार्सिंग एक्स) बनाम वाई" पार्स के लिए एक कम सामान्य / सटीक व्याख्या है, लेकिन मैंने इसे एक तर्क के रूप में वहाँ रखा है क्योंकि कोई तार्किक रूप से यह क्यों कह सकता है।
आरएम

1
@FedericoPoloni आउटलेर को आमतौर पर उस मॉडल के अनिश्चित रूप से परिभाषित किया जाता है जिसे आप बाद में उपयोग करना चाहते हैं। इसलिए भले ही हम इसे फिटिंग डेटा कहना चाहें, लेकिन यह एक मॉडल नहीं, बल्कि कुछ और होगा।
बार्टोज़केपी

1
+1। - वहाँ एक कारण यह "डाटा" कहा जाता है यह है कि क्या है यह देखते हुए : शब्द की लैटिन मूल देखने latindictionary.wikidot.com/verb:dare
क्रिस्टोफ Hanck

2

आमतौर पर, हम मानते हैं कि हमारा डेटा "वास्तविक दुनिया" से मेल खाता है और कोई भी संशोधन करने का मतलब है कि हम "वास्तविक दुनिया" से दूर जा रहे हैं। उदाहरण के लिए, किसी को आउटलेयर को हटाने की देखभाल करने की आवश्यकता है, भले ही वह कम्प्यूटिंग नाइसर बनाता है, आउटलेर अभी भी हमारे डेटा का हिस्सा थे।

किसी मॉडल का परीक्षण करते समय या बूटस्ट्रैप या अन्य रेज़मैपलिंग तकनीकों का उपयोग कर एक अनुमानक के गुणों का आकलन करते हुए, हम एक अनुमानित मॉडल और हमारे मूल डेटा का उपयोग करके नए डेटा का अनुकरण कर सकते हैं । यह यह धारणा बनाता है कि मॉडल सही है, और हम अपने मूल डेटा को संशोधित नहीं कर रहे हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.