मैं इस पर एक दरार लूंगा, हालांकि मैं किसी भी तरह से एक सांख्यिकीविद् नहीं हूं, लेकिन बहुत सारे 'मॉडलिंग' कर रहा हूं - सांख्यिकीय और गैर-सांख्यिकीय।
पहले मूलभूत बातों से शुरू करते हैं:
क्या वास्तव में एक मॉडल है?
एक मॉडल वास्तविकता का एक प्रतिनिधित्व है जो अत्यधिक सरलीकृत है। एक घर के लिए एक मोम / लकड़ी 'मॉडल' के बारे में सोचो। आप इसे स्पर्श / महसूस / गंध कर सकते हैं। अब एक गणितीय मॉडल संख्याओं का उपयोग करके वास्तविकता का प्रतिनिधित्व है।
यह 'वास्तविकता' क्या है मैं आपको सुनता हूँ? ठीक है। तो इस सरल स्थिति के बारे में सोचें: आपके राज्य के राज्यपाल ने यह कहते हुए एक नीति लागू की है कि सिगरेट के एक पैकेट की कीमत अब अगले वर्ष के लिए $ 100 होगी। 'उद्देश्य' लोगों को सिगरेट खरीदने से रोकना है, जिससे धूम्रपान कम हो रहा है, जिससे धूम्रपान करने वाले स्वस्थ हो जाते हैं (क्योंकि वे छोड़ देंगे)।
1 साल बाद राज्यपाल ने आपसे पूछा - क्या यह एक सफलता थी? आप ऐसा कैसे कह सकते हैं? वैसे आप बिकने वाले पैकेटों की संख्या / दिन या प्रति वर्ष, सर्वेक्षण प्रतिक्रियाओं पर कब्जा करते हैं, कोई भी औसत दर्जे का डेटा जिस पर आप अपना हाथ रख सकते हैं वह समस्या के लिए प्रासंगिक है। आपने समस्या को 'मॉडल' करना शुरू कर दिया है। अब आप विश्लेषण करना चाहते हैं कि यह 'मॉडल' क्या कहता है । यहीं पर सांख्यिकीय मॉडलिंग काम आती है। आप यह देखने के लिए एक साधारण सहसंबंध / स्कैटर प्लॉट चला सकते हैं कि मॉडल 'कैसा दिखता है'। आप कार्य-कारण निर्धारित करने के लिए फैंसी प्राप्त कर सकते हैं, यदि बढ़ती कीमत ने धूम्रपान में कमी ला दी है या खेल में अन्य भ्रमित कारक थे (यानी, शायद यह पूरी तरह से कुछ और है और आपका मॉडल शायद इससे चूक गया है?)।
अब, इस मॉडल का निर्माण एक 'नियमों के सेट' (जैसे दिशा-निर्देश) द्वारा किया जाता है, अर्थात, क्या कानूनी है या क्या नहीं / इससे कोई मतलब नहीं है। आपको पता होना चाहिए कि आप क्या कर रहे हैं और इस मॉडल के परिणामों की व्याख्या कैसे करें। इस मॉडल का निर्माण / निष्पादन / व्याख्या करना सांख्यिकी के बुनियादी ज्ञान की आवश्यकता है। ऊपर दिए गए उदाहरण में आपको सहसंबंध / तितर बितर भूखंड, प्रतिगमन (यूनी और बहुभिन्नरूपी) और अन्य सामानों के बारे में जानने की आवश्यकता है। मेरा सुझाव है कि आप आंकड़ों को सहजता से समझने के लिए संपूर्ण मजेदार / ज्ञानवर्धक लेख पढ़ें: वैसे भी पी-वैल्यू क्या है, यह आंकड़ों के लिए एक विनम्र परिचय है और आपको सरल से उन्नत (यानी, रैखिक प्रतिगमन) के रास्ते 'मॉडलिंग' सिखाएगा। फिर आप अन्य सामान पर जा सकते हैं और पढ़ सकते हैं।
इसलिए, याद रखें कि एक मॉडल वास्तविकता का प्रतिनिधित्व है और यह कि "सभी मॉडल गलत हैं, लेकिन कुछ दूसरों की तुलना में अधिक उपयोगी हैं" । एक मॉडल वास्तविकता का एक सरलीकृत प्रतिनिधित्व है और आप संभवतः सब कुछ पर विचार नहीं कर सकते हैं, लेकिन आपको पता होना चाहिए कि एक अच्छे मॉडल के लिए क्या करना चाहिए और क्या नहीं, जो आपको सार्थक परिणाम दे सकता है।
यह यहाँ बंद नहीं करता है। आप वास्तविकता का अनुकरण करने के लिए मॉडल भी बना सकते हैं! इस तरह समय के साथ संख्याओं का एक गुच्छा बदल जाएगा (कहेंगे)। ये नंबर आपके डोमेन में कुछ सार्थक व्याख्या करने के लिए मैप करते हैं। आप अपने डेटा को माइन करने के लिए ये मॉडल भी बना सकते हैं कि यह देखने के लिए कि विभिन्न उपाय एक-दूसरे से कैसे संबंधित हैं (आंकड़ों का अनुप्रयोग शायद संदिग्ध है, लेकिन अब चिंता न करें)। उदाहरण: आप प्रति माह एक दुकान के लिए किराने की बिक्री को देखते हैं और महसूस करते हैं कि जब भी बीयर खरीदी जाती है तो डायपर का एक पैकेट होता है (आप एक मॉडल बनाते हैं जो डेटा सेट से चलता है और आपको यह एसोसिएशन दिखाता है)। यह अजीब हो सकता है लेकिन इसका मतलब यह हो सकता है कि ज्यादातर पिता इस सप्ताहांत पर खरीदते हैं जब बच्चा अपने बच्चों को बैठाता है? डायपर को बियर के पास रखें और आप अपनी बिक्री बढ़ा सकते हैं! आह! मॉडलिंग :)
ये सिर्फ उदाहरण हैं और किसी भी तरह से पेशेवर काम के लिए एक संदर्भ नहीं हैं। आप मूल रूप से मॉडल को समझने / अनुमान लगाने के लिए बनाते हैं कि वास्तविकता कैसे काम करेगी / करेगी और आउटपुट के आधार पर बेहतर निर्णय ले सकती है। सांख्यिकी या नहीं, आप शायद यह महसूस किए बिना अपने पूरे जीवन में मॉडलिंग कर रहे हैं। शुभकामनाएँ :)