क्या सभी मॉडल बेकार हैं? क्या कोई सटीक मॉडल संभव है - या उपयोगी?


45

यह सवाल मेरे दिमाग में एक महीने से ज्यादा से ज्यादा घूम रहा है। अम्स्टैट न्यूज़ के फरवरी 2015 के अंक में बर्कले के प्रोफेसर मार्क वैन डेर लान का एक लेख शामिल है जो लोगों को अक्षम मॉडल का उपयोग करने के लिए डांटता है। वह कहते हैं कि मॉडल का उपयोग करके, सांख्यिकी फिर विज्ञान के बजाय एक कला है। उनके अनुसार, कोई भी हमेशा "सटीक मॉडल" का उपयोग कर सकता है और ऐसा करने में हमारी विफलता "कठोरता की कमी में योगदान देती है ... मुझे डर है कि डेटा विज्ञान में हमारा प्रतिनिधित्व हाशिए पर होता जा रहा है।"

मैं मानता हूं कि हम हाशिए पर जाने के खतरे में हैं, लेकिन खतरा आमतौर पर उन लोगों से आता है जो दावा करते हैं (प्रोफेसर वैन डेर लान की तरह बहुत कुछ लग रहा है, ऐसा लगता है) कि वे कुछ अनुमानित पद्धति का उपयोग नहीं कर रहे हैं, लेकिन जिनके तरीके वास्तव में कम हैं ध्यान से लागू किए गए सांख्यिकीय मॉडल की तुलना में कठोर - यहां तक ​​कि गलत भी।

मुझे लगता है कि यह कहना उचित है कि प्रो वैन डर लाॅन उन लोगों के प्रति लापरवाह हैं, जो बॉक्स के बार-बार इस्तेमाल किए गए उद्धरण को दोहराते हैं, "सभी मॉडल गलत हैं, लेकिन कुछ उपयोगी हैं।" मूल रूप से, जैसा कि मैंने पढ़ा, वह कहता है कि सभी मॉडल गलत हैं, और सभी बेकार हैं। अब, मैं कौन हूं जो एक बर्कले प्रोफेसर से असहमत हूं? दूसरी ओर, वह कौन है जो हमारे क्षेत्र में वास्तविक दिग्गजों के विचारों को खारिज करता है?

विस्तृत रूप में, डॉ। वैन डेर लान ने कहा कि "यह बताना पूरी तरह से बकवास है कि सभी मॉडल गलत हैं, ... उदाहरण के लिए, एक सांख्यिकीय मॉडल जो कोई धारणा नहीं बनाता है, हमेशा सही होता है।" वह जारी रखता है: "लेकिन अक्सर, हम इससे बहुत बेहतर कर सकते हैं: हम यह जान सकते हैं कि डेटा स्वतंत्र समान प्रयोगों का परिणाम है ।" मैं यह नहीं देखता कि कोई कैसे जान सकता है कि बहुत संकीर्ण यादृच्छिक-नमूने या नियंत्रित प्रयोगात्मक सेटिंग्स को छोड़कर। लेखक लक्षित अधिकतम संभावना सीखने और न्यूनतम हानि-आधारित सीखने के लक्ष्य में अपने काम की ओर इशारा करता है, जो "मशीन लर्निंग / डेटा-अनुकूली आकलन में कला की स्थिति को एकीकृत करता है, कार्य-कारण अनुमान, सेंसर किए गए डेटा, दक्षता और अनुभवजन्य में सभी अविश्वसनीय प्रगति। प्रक्रिया सिद्धांत, जबकि अभी भी औपचारिक सांख्यिकीय निष्कर्ष प्रदान करते हैं। "n

कुछ कथन ऐसे भी हैं जिनसे मैं सहमत हूँ। वह कहते हैं कि हमें एक सांख्यिकीविद् के रूप में हमारे काम, हमारी भूमिका और हमारे वैज्ञानिक सहयोगियों को गंभीरता से लेने की आवश्यकता है। सुनो सुनो! यह निश्चित रूप से बुरी खबर है जब लोग नियमित रूप से एक लॉजिस्टिक रिग्रेशन मॉडल का उपयोग करते हैं, या जो कुछ भी, बिना सावधानीपूर्वक विचार करते हुए कि क्या यह वैज्ञानिक प्रश्न का उत्तर देने के लिए पर्याप्त है या यदि यह डेटा फिट बैठता है। और मुझे इस मंच पर पोस्ट किए गए सवालों में बहुत सारी गालियाँ दिखाई देती हैं। लेकिन मैं अनुभवहीन मॉडल, यहां तक ​​कि पैरामीट्रिक के प्रभावी और मूल्यवान उपयोग भी देखता हूं। और वह जो कहता है, उसके विपरीत, मैं शायद ही कभी "किसी अन्य लॉजिस्टिक प्रतिगमन मॉडल द्वारा मौत से ऊब गया हूं।" ऐसा मेरा भोलापन है, मुझे लगता है।

तो यहाँ मेरे सवाल हैं:

  1. एक मॉडल का उपयोग करके क्या सांख्यिकीय अनुमान लगाया जा सकता है जो बिल्कुल भी कोई धारणा नहीं बनाता है?
  2. क्या लक्षित अधिकतम संभावना के उपयोग में महत्वपूर्ण, वास्तविक डेटा के साथ एक केस स्टडी मौजूद है? क्या इन विधियों का व्यापक रूप से उपयोग और स्वीकार किया जाता है?
  3. क्या वास्तव में सभी बेकार मॉडल बेकार हैं?
  4. क्या यह जानना संभव है कि आपके पास तुच्छ मामलों के अलावा सटीक मॉडल है ?
  5. यदि यह बहुत अधिक राय-आधारित है और इसलिए ऑफ-टॉपिक है, तो इसकी चर्चा कहां की जा सकती है? क्योंकि डॉ। वैन डेर लान के लेख को निश्चित रूप से कुछ चर्चा की आवश्यकता है।

13
मैं कहता हूं कि बिना किसी धारणा के एक मॉडल लगभग हमेशा बेकार है, लेकिन वैन डेर लान निश्चित रूप से इसे स्वीकार किए बिना धारणा बना रहा है। हम वास्तव में कुछ चीजों के लिए कुछ नहीं जानते हैं, इसलिए हमें पता है कि डेटा n स्वतंत्र समान प्रयोगों का परिणाम है "वास्तव में एक धारणा है , या कम से कम आंशिक रूप से ऐसा है। हमारे पास यह मानने का अच्छा कारण हो सकता है कि वे समान और स्वतंत्र हैं, लेकिन व्यवहार में हम देखते हैं कि बहुत बार यह पता चलता है कि यह वास्तव में ऐसा नहीं था (और अगर हमें पता चलता है कि कभी-कभी, तो इसे अनदेखा किया जाना चाहिए, संभवतः बहुत अधिक बार )।
Glen_b

19
मान्यताओं के बिना एक मॉडल सिर्फ आपके डेटामैट्रिक्स की प्रतिकृति है। यह सच है, लेकिन प्रयास का एक बेकार दोहराव भी है। कोई यह भी तर्क दे सकता है कि ऐसा मॉडल एक मॉडल नहीं है: एक मॉडल की एक परिभाषा यह है कि यह वास्तविकता का सरलीकरण है। तो एक मॉडल जो सरल नहीं होता है वह परिभाषा है एक मॉडल नहीं। उस सरलीकरण का एक उद्देश्य है: यह हमें यह समझने में मदद करता है कि क्या चल रहा है; यह हमें एक मुख्य कहानी देता है। यदि आप यह समझने में ध्यान नहीं देते हैं कि चीजें क्यों होती हैं और केवल भविष्यवाणी करना चाहते हैं, तो मुख्य कहानी असंगत है। हालांकि, कुछ क्रिटिकल बॉल बनाने से ज्यादा कुछ करना चाहते हैं ...
मार्टन ब्यूस

8
मान्यताओं के बिना एक मॉडल एक मॉडल नहीं है। मॉडल मान्यताओं का एक संग्रह है। इसके अलावा, जैसा कि @Glen_b कहता है, iid धारणा मजबूत है, और मैं एक उदाहरण के बारे में नहीं सोच सकता कि यह "सच" कहां है। यहां तक ​​कि जब बार-बार सिक्का उछालते हैं, तो सहसंबंध होते हैं (डायकोनिस का काम देखें)। मैंने केवल लेख को स्किम्ड किया है लेकिन ऐसा लगता है कि यह बहुत कम देखा गया है।
P.Windridge

11
मंगल ग्रह पर उड़ान भरने के बारे में लेखक का पहला उदाहरण फर्जी है। न्यूटोनियन यांत्रिकी (जो अंतरिक्ष मिशनों के कई पहलुओं पर निर्भर है) एक गलत मॉडल है, लेकिन हम इस पर भरोसा करते हैं और यह उपयोगी है।
P.Windridge

6
हां, न्यूटनियन यांत्रिकी जॉर्ज बॉक्स के बिंदु का एक बड़ा उदाहरण है।
Glen_b

जवाबों:


15

उद्धृत लेख आशंकाओं पर आधारित प्रतीत होता है कि सांख्यिकीविद् "वैज्ञानिक टीम का आंतरिक हिस्सा नहीं होंगे, और वैज्ञानिक स्वाभाविक रूप से इस्तेमाल किए गए तरीकों के बारे में अपना संदेह रखेंगे" और यह कि "सहयोगी हमें तकनीशियनों के रूप में देखेंगे जो उन्हें प्राप्त करने में सक्षम हो सकते हैं" उनके वैज्ञानिक परिणाम प्रकाशित हुए। " @Rvl द्वारा पूछे गए प्रश्नों पर मेरी टिप्पणी एक गैर-सांख्यिकीविद जैविक वैज्ञानिक के दृष्टिकोण से आती है, जो पिछले कुछ वर्षों में बेंच रिसर्च से ट्रांसलेटेशनल / क्लिनिकल रिसर्च में ले जाने के रूप में तेजी से जटिल सांख्यिकीय मुद्दों से जूझने के लिए मजबूर किया गया है। प्रश्न 5 स्पष्ट रूप से इस पृष्ठ पर कई उत्तरों द्वारा उत्तर दिया गया है; मैं वहाँ से उल्टे क्रम में जाऊँगा।

4) यह वास्तव में कोई फर्क नहीं पड़ता कि क्या एक "सटीक मॉडल" मौजूद है, क्योंकि अगर ऐसा होता है तो भी मैं शायद अध्ययन करने में सक्षम नहीं होगा। इस मुद्दे पर चर्चा के संदर्भ में विचार करें: क्या हमें वास्तव में "सभी प्रासंगिक भविष्यवक्ताओं को शामिल करने की आवश्यकता है?" यहां तक ​​कि अगर हम "सभी प्रासंगिक भविष्यवक्ताओं" की पहचान कर सकते हैं, तब भी शामिल करने के लिए स्वतंत्रता की डिग्री प्रदान करने के लिए पर्याप्त डेटा एकत्र करने की समस्या होगी। उन सभी को मॉडल में मज़बूती से। नियंत्रित प्रायोगिक अध्ययन में यह काफी कठिन है, अकेले पूर्वव्यापी या जनसंख्या अध्ययन करें। शायद "बिग डेटा" के कुछ प्रकारों में यह समस्या कम है, लेकिन यह मेरे और मेरे सहयोगियों के लिए है। हमेशा "इसके बारे में होशियार रहने" की जरूरत होगी, जैसा कि @ अक्षल ने उस पेज पर इसका जवाब दिया ।

प्रो। वैन डेर लान की निष्पक्षता में, वह उद्धृत लेख में "सटीक" शब्द का उपयोग नहीं करता है, कम से कम संस्करण में वर्तमान में लिंक से लाइन पर उपलब्ध है । वह "यथार्थवादी" मॉडल के बारे में बात करता है। यह एक महत्वपूर्ण अंतर है।

तब फिर से, प्रो। वैन डेर लान ने शिकायत की कि "सांख्यिकी अब एक कला है, विज्ञान नहीं है," जो कि उनकी ओर से थोड़ा अनुचित है। सहयोगियों के साथ काम करने के प्रस्ताव के तरीके पर विचार करें:

... हमें आंकड़े, सांख्यिकीविद् के रूप में हमारी पहचान और हमारे वैज्ञानिक सहयोगियों को गंभीरता से लेने की जरूरत है। हमें यह जानने की आवश्यकता है कि डेटा कैसे उत्पन्न किया गया। एक बार जब हमने एक यथार्थवादी सांख्यिकीय मॉडल पेश किया है, तो हमें अपने सहयोगियों से निकालने की जरूरत है जो अनुमान लगाते हैं कि उनकी रुचि के वैज्ञानिक प्रश्न के उत्तर का सबसे अच्छा प्रतिनिधित्व करता है। यह बहुत काम की चीज है। यह मुश्किल है। इसके लिए सांख्यिकीय सिद्धांत की एक उचित समझ की आवश्यकता होती है। यह एक योग्य शैक्षणिक उद्यम है!

वास्तविक दुनिया की समस्याओं के लिए इन वैज्ञानिक सिद्धांतों के आवेदन के लिए किसी भी वैज्ञानिक उद्यम में काम के साथ "कला," के एक अच्छे सौदे की आवश्यकता होगी। मैंने कुछ बहुत सफल वैज्ञानिकों को जाना है, कई और जिन्होंने ओके किया, और कुछ असफलताएँ। मेरे अनुभव में अंतर वैज्ञानिक लक्ष्यों को शुद्ध करने की "कला" में प्रतीत होता है। परिणाम विज्ञान हो सकता है, लेकिन प्रक्रिया कुछ और है।

3) फिर, मुद्दे का हिस्सा शब्दावली है; एक "सटीक" मॉडल और "यथार्थवादी" मॉडल के बीच एक बड़ा अंतर है जो प्रो। वैन डेर लान चाहता है। उनका दावा है कि कई मानक सांख्यिकीय मॉडल "अविश्वसनीय" परिणामों का उत्पादन करने के लिए पर्याप्त रूप से अवास्तविक हैं। विशेष रूप से: "एक ईमानदार सांख्यिकीय मॉडल में परिभाषित अनुमान के अनुमानकों को पैरामीट्रिक मॉडल के आधार पर समझदारी से अनुमान नहीं लगाया जा सकता है।" वे परीक्षण के लिए मामले हैं, राय के नहीं।

उनका अपना काम स्पष्ट रूप से पहचानता है कि सटीक मॉडल हमेशा संभव नहीं होते हैं। लापता परिणाम चर के संदर्भ में लक्षित अधिकतम संभावना अनुमानकों (TMLE) पर इस पांडुलिपि पर विचार करें । यह यादृच्छिक पर लापता परिणामों की धारणा के आधार पर है, जो व्यवहार में कभी भी परीक्षण योग्य नहीं हो सकता है: "... हम मानते हैं कि लापता होने और परिणाम के बीच संबंधों के कोई अप्रतिक्षित कन्फ़्यूडर नहीं हैं।" यह "सभी प्रासंगिक भविष्यवक्ताओं" सहित कठिनाई का एक और उदाहरण है। हालांकि, TMLE की एक ताकत यह है कि इस संदर्भ में लक्ष्य पैरामीटर का आकलन करने के लिए डेटा में पर्याप्त समर्थन की "सकारात्मकता धारणा" का मूल्यांकन करने में मदद मिलती है। लक्ष्य डेटा के एक यथार्थवादी मॉडल के जितना संभव हो उतना करीब आना है।

2) TMLE की चर्चा पहले से मान्य क्रॉस पर की गई है। मुझे वास्तविक डेटा पर व्यापक उपयोग की जानकारी नहीं है। Google विद्वान ने आज शुरुआती रिपोर्ट में जो प्रतीत होता है, उसके 258 उद्धरण दिखाए , लेकिन पहली नज़र में यह वास्तविक वास्तविक दुनिया के बड़े डेटा सेटों पर नहीं लगता था। संबद्ध आर पैकेज पर सांख्यिकीय जर्नल ऑफ सॉफ्टवेयर लेख केवल 27 Google विद्वान उद्धरणों का आज पता चलता है। हालाँकि, TMLE के मूल्य के साक्ष्य के रूप में नहीं लिया जाना चाहिए। ब्याज के वास्तविक "अनुमान" के विश्वसनीय निष्पक्ष अनुमान प्राप्त करने पर इसका ध्यान, अक्सर मानक सांख्यिकीय मॉडल से प्राप्त प्लग-इन अनुमानों के साथ एक समस्या, संभावित रूप से मूल्यवान लगती है।

1) कथन: "एक सांख्यिकीय मॉडल जो कोई धारणा नहीं बनाता है वह हमेशा सच होता है" एक पुआल आदमी, एक तनातनी के रूप में अभिप्रेत है। डेटा डेटा हैं। मैं मानता हूं कि ब्रह्मांड के नियम हैं जो दिन-प्रतिदिन बने रहते हैं। TMLE विधि में संभवतः खोज स्थान में उत्तलता के बारे में धारणाएँ हैं, और जैसा कि एक विशेष संदर्भ में इसके आवेदन के ऊपर उल्लेख किया गया है, को अतिरिक्त मान्यताओं की आवश्यकता हो सकती है।

यहां तक ​​कि प्रो। वैन डेर लान इस बात से सहमत होंगे कि कुछ धारणाएं आवश्यक हैं। मेरी समझ में यह है कि वह मान्यताओं की संख्या को कम करना और उन लोगों से बचना चाहेंगे जो अवास्तविक हैं। चाहे वह वास्तव में पैरामीट्रिक मॉडल पर देने की आवश्यकता हो, जैसा कि वह दावा करता है, महत्वपूर्ण प्रश्न है।


बहुत अच्छा जवाब। बुक टार्गेटेड लर्निंग अधिक जानने के लिए एक अच्छी जगह है। सिद्धांत के अलावा इसमें कुछ केस स्टडी शामिल हैं।
NRH

12

हो सकता है मैं चूक गया हो, लेकिन मुझे लगता है कि आपको थोड़ा पीछे हटना होगा।

मुझे लगता है कि उनकी बात बिना किसी ज्ञान के आसान-सुलभ साधनों का दुरुपयोग है। यह एक साधारण टी-टेस्ट के लिए भी सही है: बस अपने डेटा के साथ एल्गोरिथ्म को खिलाएं, पी <0.05 और सोच, कि आपकी थीसिस सच है। पूरी तरह से ग़लत। बेशक, आपको अपने डेटा के बारे में अधिक जानना होगा।

और भी पीछे कदम रखना: एक सटीक मॉडल ( यहाँ भौतिक विज्ञानी ) जैसा कुछ नहीं है । लेकिन कुछ हमारे मापों से बहुत अच्छी तरह सहमत हैं। एकमात्र सटीक चीज गणित है। जिसका वास्तविकता या उसके मॉडल से कोई लेना-देना नहीं है । बाकी सब कुछ (और वास्तविकता का हर मॉडल) "गलत" है (जैसा कि अक्सर उद्धृत किया गया है)।

लेकिन "गलत" और उपयोगी का क्या मतलब है? अपने आप से न्याय करें:

हमारे सभी मौजूदा उच्च तकनीक (कंप्यूटर, रॉकेट, रेडियोधर्मिता आदि) इन गलत मॉडलों पर आधारित हैं। शायद "गलत" मॉडल से "गलत" सिमुलेशन द्वारा भी गणना की जाती है।
-> "गलत" के बजाय "उपयोगी" पर अधिक ध्यान दें;)

आपके प्रश्नों के अधिक स्पष्ट रूप से:

  1. पता नहीं, क्षमा करें!
  2. हाँ। एक उदाहरण: कण-भौतिकी में, आप कुछ कणों (जैसे इलेक्ट्रॉनों, प्रोटॉन आदि) का पता लगाना चाहते हैं। प्रत्येक कण डिटेक्टर (और इसलिए डेटा) में एक विशेषता का निशान छोड़ता है, लेकिन समान कण (इसकी प्रकृति से) के लिए भी भिन्न होता है। आज, अधिकांश लोग इस लक्ष्य को प्राप्त करने के लिए मशीन-लर्निंग का उपयोग करते हैं (यह एक बहुत बड़ा सरलीकरण था, लेकिन यह इस तरह से बहुत अधिक है) और हाथ के आंकड़ों द्वारा इसे करने की तुलना में 20% -50% की दक्षता में वृद्धि है ।
  3. किसी ने भी वास्तव में यह दावा नहीं किया! गलत निष्कर्ष मत करो! (ए: सभी मॉडल अक्षम हैं और बी: कुछ उपयोगी हैं। चीजों को भ्रमित न करें)
  4. एक सटीक मॉडल के रूप में कोई बात नहीं है ( गणित को छोड़कर , लेकिन वास्तव में आंकड़ों में नहीं है क्योंकि एक सीधी रेखा पर बिल्कुल अंक होते हैं और इसके माध्यम से एक पंक्ति "फिटिंग" सटीक हो सकती है ... लेकिन यह एक ऐसा विशेष मामला है जो कभी नहीं होता है) ।
  5. नहीं पता :) लेकिन IMHO मैं इसे "सिर्फ इसलिए कि हर बच्चा इसका इस्तेमाल कर सकता है, हर किसी को नहीं" के रूप में देखना चाहिए और इसे नेत्रहीन रूप से अधिक उपयोग नहीं करना चाहिए।

मैं आपके बिंदुओं पर विचार करूंगा, लेकिन (3) और (4) पर, मेरा सुझाव है कि आप वैन डेर लान के लेख को देखें, साथ ही मेरे प्रश्न को भी, क्योंकि लेख में स्पष्ट रूप से कहा गया है कि उनके पास अक्षम मॉडल के लिए कोई उपयोग नहीं है, और बार-बार "सटीक मॉडल" को संदर्भित करता है। तो हां, मैं कहूंगा कि किसी ने वास्तव में ऐसा कहा है। मैं आपके द्वारा मॉडल के बारे में, साथ ही विधियों के यांत्रिक अनुप्रयोग से बहुत सहमत हूं; और इसलिए मुझे नहीं लगता कि यह वह है जो आप चाहते हैं कि मैं कदम पीछे खींचूं।
rvl

सब को हां। और ज्यादातर, मेरा मतलब था कि वह वापस कदम बढ़ाएगा, निश्चित रूप से;) मुझे लगता है, जो मैंने उल्लेख नहीं किया, सैद्धांतिक (गणितीय) मॉडल बनाने के लिए, आपको निश्चित रूप से "सटीक" मॉडल की आवश्यकता है। तो बेहतर मॉडल और सांख्यिकीय उपकरणों को "आविष्कार" करने के लिए, आपको आधार के रूप में निर्धारक (या सटीक) मॉडल की आवश्यकता होती है। यहां तक ​​कि आटा लक्षित सीखने को इस अर्थ में "अक्षम" होने की आवश्यकता नहीं है, मुझे लगता है।
१२:३० पर मय ३६

6

एकॉन में, 'डेटा जनरेट करने की प्रक्रिया' को समझने के लिए बहुत कुछ कहा जाता है। मुझे यकीन नहीं है कि वास्तव में एक 'सटीक' मॉडल का क्या मतलब है, लेकिन ईकोन में यह 'सही ढंग से निर्दिष्ट' मॉडल के समान हो सकता है।

निश्चित रूप से, आप उस प्रक्रिया के बारे में अधिक से अधिक जानना चाहते हैं जिसने डेटा तैयार किया, जैसा कि आप एक मॉडल का प्रयास करने से पहले कर सकते हैं, है ना? मुझे लगता है कि कठिनाई एक से आती है) हमारे पास असली डीजीपी और बी के बारे में कोई सुराग नहीं हो सकता है, भले ही हमें पता था कि असली डीजीपी यह मॉडल और अनुमान के लिए भिन्न हो सकता है (कई कारणों से)।

तो आप मामलों को आसान बनाने और अनुमान आवश्यकताओं को कम करने के लिए धारणाएं बनाते हैं। क्या आप कभी जान सकते हैं कि क्या आपकी धारणाएँ बिल्कुल सही हैं? आप उनके पक्ष में प्रमाण प्राप्त कर सकते हैं, लेकिन IMO कुछ मामलों में वास्तव में निश्चित होना कठिन है।

मुझे यह सब स्थापित सिद्धांत और व्यावहारिकता दोनों के संदर्भ में करना होगा। यदि आप एक सिद्धांत के अनुरूप धारणा बनाते हैं और वह धारणा आपको बेहतर अनुमान प्रदर्शन (दक्षता, सटीकता, स्थिरता, जो भी हो) खरीदती है तो मुझे इससे बचने का कोई कारण नहीं दिखता है, भले ही यह मॉडल को 'अक्षम' बना दे।

सच कहूँ तो, मुझे लगता है कि लेख उन लोगों को उत्तेजित करने के लिए है जो पूरी मॉडलिंग प्रक्रिया के बारे में कठिन सोचने के लिए डेटा के साथ काम करते हैं। यह स्पष्ट है कि वैन डेर लान अपने काम में धारणाएं बनाता है । में इस उदाहरण , वास्तव में, Laan der वैन एक सटीक मॉडल के लिए किसी भी चिंता फेंक रहा है, और बदले में अधिकतम प्रदर्शन के लिए प्रक्रियाओं की एक mish मैश उपयोग करता है। इससे मुझे और अधिक विश्वास हो गया कि उन्होंने बॉक्स के उद्धरण को लोगों को समस्या को समझने के कठिन कार्य से भागने के रूप में उपयोग करने से रोकने के इरादे से उठाया।

आइए इसका सामना करते हैं, दुनिया सांख्यिकीय मॉडल के दुरुपयोग और दुरुपयोग के साथ व्याप्त है। लोग नेत्रहीन रूप से जो कुछ भी करना जानते हैं उसे लागू करते हैं, और इससे भी बदतर, अन्य लोग अक्सर परिणामों को सबसे वांछनीय तरीके से व्याख्या करते हैं। यह लेख सावधान रहने के लिए एक अच्छा अनुस्मारक है, लेकिन मुझे नहीं लगता कि हमें इसे चरम पर ले जाना चाहिए।

आपके प्रश्नों के लिए उपरोक्त के निहितार्थ:

  1. मैं इस पोस्ट पर अन्य लोगों से सहमत हूं जिन्होंने एक मॉडल को मान्यताओं के एक सेट के रूप में परिभाषित किया है। उस परिभाषा के साथ, बिना किसी धारणा के एक मॉडल वास्तव में एक मॉडल नहीं है। यहां तक ​​कि खोजपूर्ण डेटा विश्लेषण (यानी मॉडल मुक्त) के लिए मान्यताओं की आवश्यकता होती है। उदाहरण के लिए, अधिकांश लोग मानते हैं कि डेटा को सही तरीके से मापा जाता है।
  2. मैं प्रति व्यक्ति TMLE के बारे में नहीं जानता, लेकिन अर्थशास्त्र में ऐसे कई लेख हैं जो एक अप्रतिबंधित काउंटरफैक्टुअल नमूने पर एक कारण प्रभाव के बारे में एक ही अंतर्निहित दर्शन का उपयोग करते हैं। उन मामलों में, हालांकि, उपचार प्राप्त करना मॉडल (TMLE के विपरीत) में अन्य चर से स्वतंत्र नहीं है, और इसलिए अर्थशास्त्री मॉडलिंग का व्यापक उपयोग करते हैं। संरचनात्मक मॉडल के लिए कुछ मामले के अध्ययन हैं, जैसे यह एक जहां लेखकों ने एक कंपनी को अपने मॉडल को लागू करने के लिए आश्वस्त किया और अच्छे परिणाम पाए।
  3. मुझे लगता है कि सभी मॉडल अक्षम हैं, लेकिन फिर से, यह शब्द थोड़ा फजी है। IMO, यह बॉक्स के उद्धरण के मूल में है। मैं इस तरह से बॉक्स के बारे में अपनी समझ को बहाल करूंगा: 'कोई भी मॉडल वास्तविकता के सटीक सार को नहीं पकड़ सकता है, लेकिन कुछ मॉडल ब्याज के एक चर को पकड़ते हैं, इसलिए इस अर्थ में आप उनके लिए उपयोग कर सकते हैं।'
  4. मैंने इसे ऊपर संबोधित किया। संक्षेप में, मुझे ऐसा नहीं लगता।
  5. मुझे यकीन नहीं है। मुझे यहीं अच्छा लगता है।

5

बिंदु 3 को संबोधित करने के लिए, उत्तर, स्पष्ट रूप से, नहीं है। बस हर मानव उद्यम किसी बिंदु पर एक सरलीकृत मॉडल पर आधारित होता है: खाना पकाने, निर्माण, पारस्परिक संबंध सभी में किसी न किसी तरह के डेटा + मान्यताओं पर काम करने वाले मानव शामिल होते हैं। किसी ने कभी भी एक मॉडल का निर्माण नहीं किया है जिसका उन्होंने उपयोग करने का इरादा नहीं किया है। अन्यथा जोर देना पांडित्य है।

यह अधिक दिलचस्प और ज्ञानवर्धक है, और यह पूछने के लिए उपयोगी है कि जब निष्क्रिय मॉडल उपयोगी नहीं होते हैं , तो वे अपनी उपयोगिता में विफल क्यों होते हैं, और क्या होता है जब हम उन मॉडलों पर भरोसा करते हैं जो उपयोगी नहीं होते हैं। किसी भी शोधकर्ता, चाहे वह अकादमिया या उद्योग में हो, उस प्रश्न को चतुराई और अक्सर पूछना पड़ता है।

मुझे नहीं लगता कि प्रश्न का उत्तर सामान्य रूप से दिया जा सकता है, लेकिन त्रुटि प्रचार के सिद्धांत उत्तर को सूचित करेंगे। जब वे व्यवहार करते हैं तो वास्तविक मॉडल वास्तविक दुनिया में व्यवहार को प्रतिबिंबित करने में विफल रहता है। यह समझना कि सिस्टम के माध्यम से त्रुटियां कैसे फैलती हैं, यह समझने में मदद कर सकता है कि सिस्टम को मॉडलिंग करने में कितनी सटीकता आवश्यक है।

उदाहरण के लिए, एक कठोर क्षेत्र एक बेसबॉल के लिए आमतौर पर एक खराब मॉडल नहीं है। लेकिन जब आप कैचर के मिट को डिजाइन कर रहे होते हैं, तो यह मॉडल आपको विफल कर देगा और आपको गलत चीज को डिजाइन करने के लिए प्रेरित करेगा। बेसबॉल भौतिकी के बारे में आपकी सरल धारणाएँ आपके बेसबॉल-मिट सिस्टम के माध्यम से फैलती हैं, और आपको गलत निष्कर्ष निकालने के लिए प्रेरित करती हैं।


5

1) एक मॉडल का उपयोग करके क्या सांख्यिकीय अनुमान लगाया जा सकता है जो बिल्कुल भी कोई धारणा नहीं बनाता है?

एक मॉडल परिभाषा है कि आप जो देख रहे हैं उसका एक सामान्यीकरण है जो कि कुछ कारण कारकों द्वारा कैप्चर किया जा सकता है जो बदले में आपके द्वारा देखी जा रही घटना की व्याख्या और अनुमान लगा सकते हैं। यह देखते हुए कि उन सभी सामान्यीकरण एल्गोरिदम में अंतर्निहित मान्यताओं के कुछ प्रकार हैं। मुझे यकीन नहीं है कि अगर आपके पास कोई धारणा नहीं है तो किसी मॉडल से क्या बचा है? मुझे लगता है कि आप मूल डेटा और मॉडल से नहीं बचे हैं।

2) क्या लक्षित अधिकतम संभावना के उपयोग में महत्वपूर्ण, वास्तविक डेटा के साथ एक केस स्टडी मौजूद है? क्या इन विधियों का व्यापक रूप से उपयोग और स्वीकार किया जाता है?

मुझे नहीं पता। अधिकतम संभावना हर समय उपयोग की जाती है। लॉजिट मॉडल उन लोगों के साथ-साथ कई अन्य मॉडलों पर आधारित हैं। वे मानक OLS में बहुत भिन्न नहीं होते हैं जहाँ आप अवशिष्ट के वर्ग के योग को कम करते हैं। मुझे यकीन नहीं है कि अधिकतम संभावना क्या लक्षित है। और, यह पारंपरिक अधिकतम संभावना से कैसे अलग है।

3) क्या सभी अनुभवहीन मॉडल वास्तव में बेकार हैं?

बिलकुल नहीं। निष्क्रिय मॉडल बहुत उपयोगी हो सकते हैं। सबसे पहले, वे एक घटना को बेहतर ढंग से समझने या समझाने में योगदान करते हैं। जिसे किसी चीज के लिए गिनना चाहिए। दूसरा, वे एक अनुमान के आसपास की अनिश्चितता को पकड़ने के लिए प्रासंगिक आत्मविश्वास अंतराल के साथ वंश अनुमान और पूर्वानुमान प्रदान कर सकते हैं। जो आप पढ़ रहे हैं उस पर बहुत सी जानकारी प्रदान कर सकते हैं।

"अनुभवहीनता" का मुद्दा भी पारसीमोनी और अतिभोग के बीच तनाव का मुद्दा उठाता है। आपके पास 5 चर के साथ एक सरल मॉडल हो सकता है जो "अक्षम" है, लेकिन आश्रित चर के समग्र रुझान को पकड़ने और समझाने का एक अच्छा काम करता है। आपके पास 10 चर के साथ एक अधिक जटिल मॉडल हो सकता है जो पहले वाले (उच्च समायोजित आर स्क्वायर, कम मानक त्रुटि, आदि) की तुलना में "अधिक सटीक" है। फिर भी, यह दूसरा अधिक जटिल मॉडल वास्तव में क्रैश हो सकता है जब आप होल्ड आउट नमूने का उपयोग करके इसका परीक्षण करेंगे। और, ऐसे मामले में शायद "अनुभवहीन" मॉडल वास्तव में होल्ड आउट के नमूने में बहुत बेहतर प्रदर्शन करता है। यह शाब्दिक अर्थमिति में हर समय होता है और मुझे कई अन्य सामाजिक विज्ञानों में संदेह है। "सटीक" मॉडल से सावधान रहें।

4) क्या यह जानना संभव है कि आपके पास तुच्छ मामलों के अलावा सटीक मॉडल है?

यह जानना संभव नहीं है कि आपके पास सटीक मॉडल है। लेकिन, यह जानना संभव है कि आपके पास एक बहुत अच्छा मॉडल है। सूचना मानदंड के उपाय (एआईसी, बीआईसी, एसआईसी) आपको विभिन्न मॉडलों के सापेक्ष प्रदर्शन की तुलना करने और बेंचमार्क करने की अनुमति देने के लिए बहुत जानकारी दे सकते हैं। इसके अलावा, लिंक परीक्षण भी उस संबंध में मदद कर सकता है।

५) यदि यह बहुत अधिक राय-आधारित है और इसलिए ऑफ-टॉपिक है, तो इसकी चर्चा कहाँ की जा सकती है? क्योंकि डॉ। वैन डेर लान के लेख को निश्चित रूप से कुछ चर्चा की आवश्यकता है।

मुझे लगता है कि यह इस मुद्दे पर चर्चा करने के लिए एक मंच के रूप में उपयुक्त है। यह हम में से अधिकांश के लिए एक बहुत ही दिलचस्प मुद्दा है।


5

(मैं लेख में "सटीक मॉडल" वाक्यांश नहीं देखता हूं (हालांकि ऊपर उद्धृत किया गया है))

1) एक मॉडल का उपयोग करके क्या सांख्यिकीय अनुमान लगाया जा सकता है जो बिल्कुल भी कोई धारणा नहीं बनाता है?

कहीं न कहीं से आपको प्रारंभ करना होगा। यदि यह सब आपके पास है (कुछ नहीं), तो यह एक प्रारंभिक बिंदु हो सकता है।

2) क्या लक्षित अधिकतम संभावना के उपयोग में महत्वपूर्ण, वास्तविक डेटा के साथ एक केस स्टडी मौजूद है? क्या इन विधियों का व्यापक रूप से उपयोग और स्वीकार किया जाता है?

दूसरे सवाल का जवाब देने के लिए, लक्षित अधिकतम संभावना 93x43281 (~ .008%) में arxiv.org के कागजात में बदल जाती है। तो, शायद कोई भी एक अच्छा अनुमान (मान्यताओं के बिना) नहीं है।

3) क्या सभी अनुभवहीन मॉडल वास्तव में बेकार हैं?

नहीं। कभी-कभी आप केवल एक मॉडल का एक पहलू के बारे में परवाह। वह पहलू बहुत अच्छा हो सकता है और बाकी बहुत सटीक।

4) क्या यह जानना संभव है कि आपके पास तुच्छ मामलों के अलावा सटीक मॉडल है?

सबसे अच्छा मॉडल वह मॉडल है जो आपके प्रश्न का सबसे अच्छा जवाब देता है। इसका मतलब हो सकता है कि किसी चीज को छोड़ देना। आप जिस चीज से बचना चाहते हैं, वह सबसे अच्छा है, यह धारणा का उल्लंघन है।

5) हैप्पी आवर । और पेय बूट के लिए सस्ता है!

मुझे "सटीक" शब्द का उपयोग थोड़ा अटपटा लगता है। यह बहुत सांख्यिकीविद् जैसी बात नहीं है। अशुद्धता? रूपांतर? जीडी धन्यवाद! इसलिए हम सब यहां हैं। मुझे लगता है कि "सभी मॉडल गलत हैं ..." वाक्यांश ठीक है, लेकिन केवल सही कंपनी में। सांख्यिकीविद समझते हैं कि इसका क्या मतलब है, लेकिन कुछ अन्य लोग करते हैं।


वाक्यांश के बारे में अच्छा बिंदु "सटीक मॉडल।" वह "सच" और "वास्तविक" मॉडल के बारे में बातें कहते हैं जो समकक्ष हैं, विशेष रूप से लेख का संदर्भ और लहजा दिया गया है, लेकिन आप सही हैं, उद्धरण "सटीक" (दंडित उद्देश्य) नहीं है।
SQLServerSteve

मेरी गलती। मुझे उसे सही तरीके से उद्धृत करना चाहिए था।
rvl

मुझे लगता है कि सही या वास्तविक मॉडल को हासिल करने की कोशिश में अभ्यास की बात याद आती है। मुझे लगता है कि जो वह वास्तव में चर्चा करने की कोशिश कर रहा है वह खराब मॉडल है।
मंधा

हाँ लेख कई अच्छे बिंदु बनाता है, लेकिन वह बहुत सारे चरम टिप्पणियों को प्रतिच्छेद करता है जैसे "यह बताना पूरी तरह से बकवास है कि सभी मॉडल गलत हैं," जब वे वास्तव में कुछ हद तक सभी गलत होते हैं। अन्यथा कहना बकवास है। वह निश्चित रूप से एक चरम स्थिति को रोक रहा है। Rvl को इसे लाने और उसे बाहर बुलाने के लिए पूरी तरह से सही था (बोली Ryl को पसीना न करें, महत्वपूर्ण बात यह है कि आपने अर्थ को सही तरीके से कैप्चर किया है)।
SQLServerSteve

4

कहा लेख मुझे एक ईमानदार लेकिन राजनीतिक लेख, एक ईमानदार नीतिवचन प्रतीत होता है । जैसे, इसमें बहुत सारे भावुक अंश शामिल हैं जो वैज्ञानिक गैर-समझदारी हैं, लेकिन फिर भी महत्वपूर्ण मामलों पर उपयोगी बातचीत और विचार-विमर्श को प्रभावी बनाने में प्रभावी हो सकते हैं।

यहाँ कई अच्छे जवाब हैं, इसलिए मुझे लेख से कुछ पंक्तियाँ उद्धृत करने के लिए सिर्फ यह दिखाने के लिए कि प्रो। लान निश्चित रूप से अपने काम में किसी भी तरह के "सटीक मॉडल" का उपयोग नहीं कर रहे हैं (और वैसे, कौन कहता है कि "सटीक" मॉडल "एक अवधारणा वास्तविक डेटा जनरेटिंग तंत्र के बराबर है?"

उद्धरण (साहसिक मेरा जोर)

"एक बार जब हमने एक यथार्थवादी सांख्यिकीय मॉडल पेश किया है, तो हमें अपने सहयोगियों से निकालने की ज़रूरत है जो अनुमान लगाते हैं कि उनके हित के वैज्ञानिक प्रश्न के उत्तर का सबसे अच्छा प्रतिनिधित्व करता है। "

टिप्पणी: "यथार्थवादी" को "सटीक" से हटा दिया जाता है क्योंकि मंगल पृथ्वी से है। वे दोनों सूर्य की परिक्रमा करते हैं, इसलिए कुछ उद्देश्यों के लिए यह मायने नहीं रखता है कि कौन सा ग्रह किसे चुनता है। अन्य उद्देश्यों के लिए, यह मायने रखता है। इसके अलावा "सर्वश्रेष्ठ" एक सापेक्ष अवधारणा है। "सटीक" नहीं है।

"एक ईमानदार सांख्यिकीय मॉडल में परिभाषित एक अनुमान के अनुमानक पैरामीट्रिक मॉडल के आधार पर समझदारी से अनुमान नहीं लगाया जा सकता है ...

टिप्पणी: ईमानदारी वास्तव में सबसे अच्छी नीति है, लेकिन यह निश्चित रूप से "सटीक" होने की गारंटी नहीं है। इसके अलावा, "समझदार अनुमान" एक बहुत पतला परिणाम प्रतीत होता है अगर कोई "सटीक मॉडल" का उपयोग करता है।

" इन कठिन अनुमान समस्याओं को हल करने के लिए सबसे अच्छा हम कर सकते हैं , हमने एक सामान्य सांख्यिकीय दृष्टिकोण विकसित किया है ... "

टिप्पणी: ठीक है। हम "सबसे अच्छा हम कर सकते हैं" कर रहे हैं। जैसा कि लगभग हर कोई अपने बारे में सोच रहा है। लेकिन "सबसे अच्छा हम" "सटीक" नहीं है।


2

मैं जॉर्ज एफ। क्लेर की किताबों की फजी सेट्स पर चर्चा के बारे में दर्शन के वैकल्पिक दिशा से इस दिशा में संपर्क करने जा रहा हूं। मैं वैन डेर लान को सटीकता नहीं दे सकता, लेकिन मैं इसके लिए कुछ हद तक संपूर्ण मामला प्रदान कर सकता हूं कि उसका लक्ष्य तार्किक रूप से असंभव क्यों है; यह एक लंबी चर्चा के लिए बुलाने जा रहा है जो अन्य क्षेत्रों को संदर्भित करता है, इसलिए मेरे साथ सहन करें।

क्लिर और उनके सह-लेखक अनिश्चितता को कई उपप्रकारों में विभाजित करते हैं, जैसे कि बकवास (यानी जब आपके पास विकल्पों का एक अज्ञात सेट होता है, तो हार्टले फंक्शन जैसे माध्यमों से निपटा जाता है); परिभाषाओं में अपव्यय (यानी "फजीता" फजी सेट्स में मॉडलिंग और परिमाणित); सबूतों में संघर्ष या कलह (डेम्पस्टर-शेफ़र साक्ष्य सिद्धांत में संबोधित); प्लस संभावना सिद्धांत, संभावना सिद्धांत और माप अनिश्चितता, जहां लक्ष्यों को प्रासंगिक प्रमाणों को पकड़ने के लिए पर्याप्त गुंजाइश है, जबकि त्रुटियों को कम करना है। मैं सांख्यिकीय तकनीकों के पूरे टूलबॉक्स को विभिन्न तरीकों से अनिश्चितता के विभाजन के वैकल्पिक साधन के रूप में देखता हूं, बहुत कुछ कुकी कटर की तरह; आत्मविश्वास अंतराल और पी-वैल्यू एक तरह से अनिश्चितता को दूर करते हैं, जबकि शैनन की एंट्रोपी इसे दूसरे कोण से नीचे गिरा देती है। वे क्या कर सकते हैं ' टी डू, हालांकि, इसे पूरी तरह से खत्म कर रहा है। जिस तरह की वैन डेर लान का "सटीक मॉडल" प्राप्त करने के लिए वर्णन करने के लिए लगता है, हमें इन सभी प्रकार की अनिश्चितता को शून्य से कम करने की आवश्यकता होगी, ताकि विभाजन के लिए और अधिक न बचे। एक सही मायने में "सटीक" मॉडल में हमेशा 1 की संभावना और संभावना मान होंगे, 0 की निरर्थक स्कोर और शर्तों की परिभाषा में कोई अनिश्चितता नहीं होगी, मूल्यों की सीमाएं या माप तराजू। साक्ष्य के वैकल्पिक स्रोतों में कोई कलह नहीं होगी। ऐसे मॉडल द्वारा की गई भविष्यवाणियां हमेशा 100 प्रतिशत सटीक होंगी; भविष्य कहनेवाला मॉडल अनिवार्य रूप से भविष्य में अपनी अनिश्चितता का विभाजन करते हैं, लेकिन इसे बंद करने के लिए कोई नहीं होगा। अनिश्चितता के परिप्रेक्ष्य में कुछ महत्वपूर्ण निहितार्थ हैं: जिस तरह की वैन डेर लान का वर्णन किया गया है, हमें इन सभी प्रकार की अनिश्चितता को शून्य तक कम करने की आवश्यकता होगी, ताकि विभाजन के लिए और अधिक न बचे। एक सही मायने में "सटीक" मॉडल में हमेशा 1 की संभावना और संभावना मान होंगे, 0 की निरर्थक स्कोर और शर्तों की परिभाषा में कोई अनिश्चितता नहीं होगी, मूल्यों की सीमाएं या माप तराजू। साक्ष्य के वैकल्पिक स्रोतों में कोई कलह नहीं होगी। ऐसे मॉडल द्वारा की गई भविष्यवाणियां हमेशा 100 प्रतिशत सटीक होंगी; भविष्य कहनेवाला मॉडल अनिवार्य रूप से भविष्य में अपनी अनिश्चितता का विभाजन करते हैं, लेकिन इसे बंद करने के लिए कोई नहीं होगा। अनिश्चितता के परिप्रेक्ष्य में कुछ महत्वपूर्ण निहितार्थ हैं: जिस तरह की वैन डेर लान का वर्णन किया गया है, हमें इन सभी प्रकार की अनिश्चितता को शून्य तक कम करने की आवश्यकता होगी, ताकि विभाजन के लिए और अधिक न बचे। एक सही मायने में "सटीक" मॉडल में हमेशा 1 की संभावना और संभावना मान होंगे, 0 की निरर्थक स्कोर और शर्तों की परिभाषा में कोई अनिश्चितता नहीं होगी, मूल्यों की सीमाएं या माप तराजू। साक्ष्य के वैकल्पिक स्रोतों में कोई कलह नहीं होगी। ऐसे मॉडल द्वारा की गई भविष्यवाणियां हमेशा 100 प्रतिशत सटीक होंगी; भविष्य कहनेवाला मॉडल अनिवार्य रूप से भविष्य में अपनी अनिश्चितता का विभाजन करते हैं, लेकिन इसे बंद करने के लिए कोई नहीं होगा। अनिश्चितता के परिप्रेक्ष्य में कुछ महत्वपूर्ण निहितार्थ हैं: एक सही मायने में "सटीक" मॉडल में हमेशा 1 की संभावना और संभावना मान होंगे, 0 की निरर्थक स्कोर और शर्तों की परिभाषा में कोई अनिश्चितता नहीं होगी, मूल्यों की सीमाएं या माप तराजू। साक्ष्य के वैकल्पिक स्रोतों में कोई कलह नहीं होगी। ऐसे मॉडल द्वारा की गई भविष्यवाणियां हमेशा 100 प्रतिशत सटीक होंगी; भविष्य कहनेवाला मॉडल अनिवार्य रूप से भविष्य में अपनी अनिश्चितता का विभाजन करते हैं, लेकिन इसे बंद करने के लिए कोई नहीं होगा। अनिश्चितता के परिप्रेक्ष्य में कुछ महत्वपूर्ण निहितार्थ हैं: एक सही मायने में "सटीक" मॉडल में हमेशा 1 की संभावना और संभावना मान होंगे, 0 की निरर्थक स्कोर और शर्तों की परिभाषा में कोई अनिश्चितता नहीं होगी, मूल्यों की सीमाएं या माप तराजू। साक्ष्य के वैकल्पिक स्रोतों में कोई कलह नहीं होगी। ऐसे मॉडल द्वारा की गई भविष्यवाणियां हमेशा 100 प्रतिशत सटीक होंगी; भविष्य कहनेवाला मॉडल अनिवार्य रूप से भविष्य में अपनी अनिश्चितता का विभाजन करते हैं, लेकिन इसे बंद करने के लिए कोई नहीं होगा। अनिश्चितता के परिप्रेक्ष्य में कुछ महत्वपूर्ण निहितार्थ हैं: ऐसे मॉडल द्वारा की गई भविष्यवाणियां हमेशा 100 प्रतिशत सटीक होंगी; भविष्य कहनेवाला मॉडल अनिवार्य रूप से भविष्य में अपनी अनिश्चितता का विभाजन करते हैं, लेकिन इसे बंद करने के लिए कोई नहीं होगा। अनिश्चितता के परिप्रेक्ष्य में कुछ महत्वपूर्ण निहितार्थ हैं: ऐसे मॉडल द्वारा की गई भविष्यवाणियां हमेशा 100 प्रतिशत सटीक होंगी; भविष्य कहनेवाला मॉडल अनिवार्य रूप से भविष्य में अपनी अनिश्चितता का विभाजन करते हैं, लेकिन इसे बंद करने के लिए कोई नहीं होगा। अनिश्चितता के परिप्रेक्ष्य में कुछ महत्वपूर्ण निहितार्थ हैं:

• यह लंबा आदेश न केवल शारीरिक रूप से असंभव है, बल्कि वास्तव में तार्किक रूप से असंभव है। जाहिर है, हम अपरिमेय डिग्री के साथ पूरी तरह से निरंतर माप तराजू को प्राप्त नहीं कर सकते हैं, गिरने योग्य, भौतिक वैज्ञानिक उपकरणों का उपयोग करके बारीक टिप्पणियों को इकट्ठा करके; माप पैमाने के मामले में हमेशा कुछ अनिश्चितता रहेगी। इसी तरह, हमारे प्रयोगों में हमारे द्वारा नियत की गई परिभाषाओं के आसपास हमेशा कुछ नोक-झोंक होती रहेगी। भविष्य भी स्वाभाविक रूप से अनिश्चित है, इसलिए हमारे "सटीक" मॉडल की कथित रूप से सही भविष्यवाणियों को अन्यथा साबित होने तक अपूर्ण माना जाएगा - जो एक अनंत काल लेगा।

• मामलों को बदतर बनाने के लिए, कोई माप तकनीक प्रक्रिया में कुछ बिंदु पर त्रुटि से 100 प्रतिशत मुक्त है, और न ही इसे व्यापक रूप से बनाया जा सकता है ताकि ब्रह्मांड में संभवतः सभी परस्पर विरोधी जानकारी को गले लगाया जा सके। इसके अलावा, संभावित भ्रमित चर और पूर्ण सशर्त स्वतंत्रता के उन्मूलन को अन्य सभी शारीरिक प्रक्रियाओं की जांच किए बिना पूरी तरह से साबित नहीं किया जा सकता है जो हम जांच कर रहे हैं, साथ ही साथ जो इन माध्यमिक प्रक्रियाओं और इतने पर प्रभावित करते हैं।

• निर्मलता केवल शुद्ध तर्क और उसके उपसमुच्चय, गणित में ही संभव है, क्योंकि अमूर्तता वास्तविक दुनिया की चिंताओं से तलाक लेती है जैसे अनिश्चितता के इन स्रोतों से। उदाहरण के लिए, शुद्ध कटौतीत्मक तर्क से, हम यह साबित कर सकते हैं कि 2 + 2 = 4 और कोई अन्य उत्तर 100 प्रतिशत गलत है। हम पूरी तरह से सटीक भविष्यवाणियां भी कर सकते हैं कि यह हमेशा 4 के बराबर होगी। इस तरह की परिशुद्धता केवल आंकड़ों में संभव है जब हम सार के साथ काम कर रहे हैं। आँकड़े वास्तविक दुनिया में लागू होने पर अविश्वसनीय रूप से उपयोगी होते हैं, लेकिन यह बहुत ही उपयोगी चीज है जो इसे कम से कम कुछ हद तक अपरिहार्य अनिश्चितता का इंजेक्शन देती है, जिससे यह अक्षम हो जाता है। यह एक अपरिहार्य दुविधा है।

• इसके अलावा, पीटर चू लेख आरएलएल से जुड़े लेख के टिप्पणी अनुभाग में अतिरिक्त सीमाएं बढ़ाता है। वह इसे मुझसे बेहतर कर सकता है:

"एनपी-हार्ड समस्याओं की यह समाधान सतह आमतौर पर कई स्थानीय ऑप्टिमा के साथ व्याप्त है और ज्यादातर मामले में समस्या को हल करने के लिए यह व्यावहारिक रूप से अक्षम है अर्थात सामान्य रूप से वैश्विक इष्टतम समाधान ढूंढना। इसलिए, प्रत्येक मॉडलर कुछ (हेयुरिस्टिक) मॉडलिंग तकनीकों का उपयोग कर रहा है। सबसे अच्छा, इस जटिल उद्देश्य समारोह के विशाल समाधान स्थान में पर्याप्त स्थानीय इष्टतम समाधान खोजने के लिए। "

• इसका मतलब यह है कि विज्ञान स्वयं पूरी तरह से सटीक नहीं हो सकता है, हालांकि वैन डेर लान अपने लेख में इस तरह से बात करते हैं; एक अमूर्त प्रक्रिया के रूप में वैज्ञानिक विधि निश्चित रूप से निश्चित है, लेकिन सार्वभौमिक और सही सटीक माप की असंभवता का अर्थ है कि यह अनिश्चितता से रहित सटीक मॉडल का उत्पादन नहीं कर सकता है। विज्ञान एक महान उपकरण है, लेकिन इसकी सीमाएँ हैं।

• यह वहाँ से भी बदतर हो जाता है: भले ही ब्रह्मांड में हर घटक क्वार्क और ग्लूऑन पर काम करने वाले सभी बलों को मापना संभव था, फिर भी कुछ अनिश्चितताएं अभी भी बनी हुई हैं। सबसे पहले, इस तरह के एक पूर्ण मॉडल द्वारा की गई कोई भी भविष्यवाणी क्विंटिक समीकरणों और उच्च बहुपद के लिए कई समाधानों के अस्तित्व के कारण अभी भी अनिश्चित होगी। दूसरे, हम पूरी तरह से निश्चित नहीं हो सकते हैं कि क्लासिक प्रश्न में सन्निहित चरम संदेह "शायद यह सब एक सपना है या मतिभ्रम है" वास्तविकता का प्रतिबिंब नहीं है - इस मामले में हमारे सभी मॉडल वास्तव में सबसे खराब तरीके से गलत हैं। । यह मूल रूप से अभूतपूर्ववाद, आदर्शवाद और एकांतवाद जैसे दार्शनिकों की मूल महामारी संबंधी योगों की एक अधिक चरम ontological व्याख्या के बराबर है।

• अपने 1909 में क्लासिक रूढ़िवादीजीके चेस्टर्टन ने उल्लेख किया कि इन दर्शनों के चरम संस्करणों को वास्तव में आंका जा सकता है, लेकिन वे अपने विश्वासियों को मानसिक संस्थानों में चलाते हैं या नहीं; उदाहरण के लिए, ऑन्कोलॉजिकल सॉलिपिज़्म वास्तव में सिज़ोफ्रेनिया का एक मार्कर है, जैसा कि इसके कुछ चचेरे भाई हैं। इस दुनिया में हम जो सबसे अच्छा प्राप्त कर सकते हैं, वह उचित संदेह को खत्म करना है; इस भद्दे किस्म के अनुचित संदेह को कड़ाई से दूर नहीं किया जा सकता है, यहां तक ​​कि सटीक मॉडल, संपूर्ण और त्रुटि रहित माप की काल्पनिक दुनिया में भी। यदि वैन डेर लान का उद्देश्य अनुचित संदेह से हमें छुटकारा दिलाना है तो वह आग से खेल रहा है। पूर्णता पर भरोसा करके, हम जो अच्छा काम कर सकते हैं, वह हमारी उंगलियों के माध्यम से होगा; हम एक अनंत दुनिया में विद्यमान परिमित प्राणी हैं, जिसका अर्थ है कि पूर्ण और पूरी तरह से निश्चित ज्ञान वान डेर लाॅन का तर्क स्थायी रूप से हमारी समझ से परे है। जिस तरह से हम उस तरह की निश्चितता तक पहुँच सकते हैं उस दुनिया से पीछे हटने के द्वारा हम पूरी तरह से सार "शुद्ध गणित" कहते हैं। हालांकि, इसका मतलब यह नहीं है कि शुद्ध गणित में एक वापसी अनिश्चितता को खत्म करने का उपाय है। यह अनिवार्य रूप से लुडविग विट्गेन्स्टाइन (1889-1951) के उत्तराधिकारियों द्वारा लिया गया दृष्टिकोण था, जिसने मेटाफिजिक्स को पूरी तरह से खारिज करने और पूरी तरह से शुद्ध गणित और वैज्ञानिकता के साथ-साथ चरम संशयवाद को पूरी तरह से पीछे हटने के द्वारा जो कुछ भी सामान्य ज्ञान के तार्किक प्रत्यक्षवाद के अपने दर्शन को सूखा दिया था। ओवरस्पीपलाइजेशन और ओवरपेन्हासिस उपयोगिता पर सटीकता पर। इस प्रक्रिया में, उन्होंने इसे परिभाषाओं और नाभि-टकटकी पर नाइटपैकिंग के एक नैतिकता में भंग करके दर्शन के अनुशासन को नष्ट कर दिया, जिससे यह बाकी शिक्षाविदों के लिए अप्रासंगिक हो गया। इसने अनिवार्य रूप से पूरे अनुशासन को मार दिया, जो अभी भी 20 वीं शताब्दी की शुरुआत तक शैक्षणिक बहस में सबसे आगे था, इस बिंदु पर जहां इसने अभी भी मीडिया का ध्यान आकर्षित किया था और इसके कुछ नेता घरेलू नाम थे। वे दुनिया के एक परिपूर्ण, पॉलिश स्पष्टीकरण पर गर्व करते हैं और यह उनकी उंगलियों के माध्यम से फिसल जाता है - ठीक उसी तरह जैसे कि मानसिक रोगियों के माध्यम से जीकेसी ने बात की थी। यह वैन डेर लान की समझ से बाहर निकल जाएगा, जिसने पहले से ही अपनी बात को खारिज कर दिया है, जैसा कि नीचे चर्चा की गई है। मॉडल की खोज जो बहुत सटीक है, असंभव नहीं है; यह खतरनाक हो सकता है, अगर इसे आत्म-पराजित जुनून के बिंदु पर ले जाया जाए। उस तरह की शुद्धता का पीछा शायद ही कभी समाप्त होता है; यह अक्सर उन जर्मोफोब्स के रूप में आत्म-पराजित होता है जो अपने हाथों को इतनी गहराई से रगड़ते हैं कि वे संक्रमित होने वाले घावों के साथ समाप्त हो जाते हैं। यह सूर्य से आग चुराने की कोशिश करने वाले इकारस की याद ताजा करती है: परिमित प्राणियों के रूप में, हम केवल चीजों की एक सीमित समझ रख सकते हैं। जैसा कि चेस्टर्टन रूढ़िवादी में भी कहते हैं, "यह तर्कशास्त्री है जो आकाश को अपने सिर में लाना चाहता है। और यह उसका सिर है जो फूट जाता है।"

उपरोक्त के प्रकाश में, मुझे rvl द्वारा सूचीबद्ध कुछ विशिष्ट प्रश्नों से निपटने दें:

1) कोई भी ऐसा मॉडल जिसकी कोई मान्यता नहीं है) अपनी स्वयं की मान्यताओं के बारे में नहीं जानता है या b) स्पष्टता से अनिश्चितता का परिचय देने वाले विचारों से तलाकशुदा होना चाहिए, जैसे माप त्रुटियां, हर एक संभव भ्रमित चर के लिए लेखांकन, पूरी तरह से माप तराजू और पसंद।

2) मैं अभी भी एक नौसिखिया हूँ जब यह अधिकतम संभावना अनुमान (MLE) की बात आती है, तो मैं लक्ष्य संभावना के यांत्रिकी पर टिप्पणी नहीं कर सकता, स्पष्ट को इंगित करने के अलावा: संभावना सिर्फ इतनी है कि, एक संभावना, एक निश्चितता नहीं । एक सटीक मॉडल प्राप्त करने के लिए अनिश्चितता के पूर्ण उन्मूलन की आवश्यकता होती है, जो संभाव्य तर्क शायद ही कभी कर सकता है।

3) बेशक नहीं। चूँकि सभी मॉडल कुछ अनिश्चितता बनाए रखते हैं और इस तरह अक्षम होते हैं (शुद्ध गणित के मामलों को छोड़कर, वास्तविक दुनिया के भौतिक माप से तलाकशुदा), मानव जाति आज तक कोई तकनीकी प्रगति नहीं कर पाई है - या वास्तव में, कोई अन्य प्रगति सब। यदि अनुभवहीन मॉडल हमेशा बेकार होते थे, तो हम इंटरनेट नामक प्रौद्योगिकी के इस अविश्वसनीय कारनामे के बजाय, एक गुफा में यह वार्तालाप कर रहे होते थे, जो सभी को अक्षम मॉडलिंग के माध्यम से संभव बनाया गया था।

विडंबना यह है कि वैन डेर लान का अपना मॉडल अनुभवहीनता का एक प्राथमिक उदाहरण है। अपने स्वयं के लेख सटीक मॉडल की ओर एक उद्देश्य के साथ, आंकड़ों के क्षेत्र को कैसे प्रबंधित किया जाना चाहिए, इसके प्रकारों का एक मॉडल रेखाचित्र; इस "मॉडल" से जुड़ी कोई संख्या अभी तक नहीं है, सिर्फ इस बात का कोई मापदण्ड नहीं है कि अधिकांश मॉडल कितने बेकार या बेकार हैं, अब उनके विचार में, उनकी दृष्टि से हम कितनी दूर हैं, इसका कोई परिमाण नहीं है, लेकिन मुझे लगता है कि कोई उन चीजों के लिए परीक्षण कर सकता है । हालांकि, यह खड़ा है, हालांकि, उसका मॉडल अक्षम है। यदि यह उपयोगी नहीं है, तो इसका मतलब है कि उसकी बात गलत है; यदि यह उपयोगी है, तो यह उनके मुख्य बिंदु को हरा देता है कि अक्षम मॉडल उपयोगी नहीं हैं। किसी भी तरह से, वह अपने स्वयं के तर्क को खारिज कर देता है।

4) शायद नहीं, क्योंकि हमारे पास अपने मॉडल का परीक्षण करने के लिए पूरी जानकारी नहीं हो सकती है, उन्हीं कारणों से जो हम पहली बार में एक सटीक मॉडल प्राप्त नहीं कर सकते हैं। परिभाषा के अनुसार एक सटीक मॉडल के लिए सही भविष्यवाणी की आवश्यकता होती है, लेकिन भले ही पहले 100 परीक्षण 100 प्रतिशत सटीक हों, 101 वां नहीं हो सकता है। तो फिर वहाँ infinitesimal माप तराजू का पूरा मुद्दा है। उसके बाद, हम अनिश्चितता के अन्य स्रोतों में प्रवेश करते हैं, जो हमारे आइवरी टॉवर मॉडल के किसी भी आइवरी टॉवर मूल्यांकन को दूषित करेगा।

5) इस मुद्दे को हल करने के लिए, मुझे इसे बहुत बड़े दार्शनिक मुद्दों के व्यापक संदर्भ में रखना पड़ा, जो अक्सर विवादास्पद होते हैं, इसलिए मुझे नहीं लगता कि इस पर विचार किए बिना इस पर चर्चा संभव है (ध्यान दें कि कैसे और खुद में एक और है अनिश्चितता का स्रोत) लेकिन आप सही हैं, यह लेख एक उत्तर के हकदार हैं। अन्य विषयों पर वह जो कहता है, उसका बहुत कुछ सही रास्ते पर है, जैसे कि बिग डेटा से संबंधित आंकड़े बनाने की आवश्यकता है, लेकिन वहां कुछ अव्यवहारिक अतिवाद मिला हुआ है जिसे सही किया जाना चाहिए।


1
ये "विट्गेन्स्टाइन के उत्तराधिकारी" कौन हैं जिन्होंने "दर्शनशास्त्र के अनुशासन को नष्ट कर दिया"! " युद्धोत्तर विश्लेषणात्मक दर्शन की प्रवृत्ति - बाद में विट्गेन्स्टाइन, ऑस्टिन, क्वीन, केनी, गुडमैन, लुईस, डेविडसन, रोर्टी के विचार - तार्किक प्रत्यक्षवाद के सिद्धांतों की अस्वीकृति प्रतीत होती है, मेटाफिज़िक्स का पुनर्वास, और वैज्ञानिकता से पीछे हटना । (नीत्शे और लोयोला के बारे में रोर्टी की टिप्पणी से लगता है कि वह चेस्टर्टन की बात से सहमत हो सकते हैं।) क्यों कि किम कार्दशियन का शाऊल क्रिप्के की बजाय एक घरेलू नाम है, मुझे संदेह है कि 20 वीं शताब्दी की शुरुआत से ही अन्य रुझान काम पर हैं।
Scortchi - को पुनः स्थापित मोनिका

युद्ध के बाद के सुधारक अपने क्षेत्र के बाहर अज्ञात होते हैं, क्योंकि वे अनुशासन में आने के बाद आए थे '20 / / 30' (एक सदियों से चली आ रही चरम तार्किक प्रत्यक्षवादियों के बाद केवल तेजी से घटते हुए) एक अप्रासंगिकता में यह कभी नहीं उबर पाया। क्षति पहले ही हो चुकी थी। 50 के दशक तक अन्य अकादमिक विषय अब नेतृत्व के लिए दर्शन की तलाश में नहीं थे और तब से अक्सर इसे एकमुश्त तिरस्कार के साथ, आउट-ऑफ-टच, नाइटपैकिंग पेडेंट्री के लिए इलाज करते थे .. काश कि यह सच नहीं होता। छवि दर्शन की वास्तविकता को प्रतिबिंबित नहीं कर सकती है, लेकिन दागी अभी भी बनी हुई है।
SQLServerSteve

मुझे अगले सप्ताह चैट में इस पर चर्चा करने में खुशी होगी यदि आपके पास समय है, मैं इस धागे में एक स्पर्शरेखा पर उतरना नहीं चाहता हूं, लेकिन मुझे संदेह है कि हमारे स्थान अभी तक अलग नहीं हैं। मुझे लगता है कि आप पूरी तरह से सही हैं, 20 वीं शताब्दी की शुरुआत से कार्दशियन आदि आंदोलन चल रहे थे - ठीक उस समय जब दर्शन का अनुशासन ग्रहण में गिर गया था (क्या इसके लायक कोई और मामला है? मैं इसे बहुत मानता हूं; व्यावहारिक और काश यह अभी भी उच्च माना जाता था)।
SQLServerSteve

टिप्पणियाँ विस्तारित चर्चा के लिए नहीं हैं; इस वार्तालाप को बातचीत में स्थानांतरित कर दिया गया है ।
स्कॉर्टी - मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.