पिछले 15 वर्षों के आंकड़ों में क्या सफलता है?


56

मुझे अब भी फ्रीडमैन-हस्ती-तिब्शीरानी द्वारा बूस्टिंग पर सांख्यिकी के पेपर और अन्य लेखकों द्वारा उसी मुद्दों पर टिप्पणियों (फ्रंड और शापायर सहित) को याद किया जाता है। उस समय, स्पष्ट रूप से बूस्टिंग को कई मामलों में एक सफलता के रूप में देखा गया था: कम्प्यूटेशनल रूप से व्यवहार्य, एक पहनावा विधि, उत्कृष्ट उत्कृष्ट रहस्यमय प्रदर्शन के साथ। लगभग उसी समय, एसवीएम उम्र में आया, जो ठोस सिद्धांत और बहुत सारे वेरिएंट और अनुप्रयोगों के साथ एक रूपरेखा प्रस्तुत करता है ।

वह 90 के दशक में अद्भुत था। पिछले 15 वर्षों में, यह मुझे लगता है कि बहुत सारे आँकड़े एक सफाई और विस्तार का काम रहे हैं, लेकिन कुछ सही मायने में नए विचारों के साथ।

इसलिए मैं दो प्रश्न पूछूंगा:

  1. क्या मैंने कुछ क्रांतिकारी / सेमिनल पेपर याद किया है?
  2. यदि नहीं, तो क्या नए दृष्टिकोण हैं जो आपको लगता है कि सांख्यिकीय अनुमान के दृष्टिकोण को बदलने की क्षमता है?

नियम:

  1. प्रति पोस्ट एक उत्तर;
  2. संदर्भ या लिंक का स्वागत है।

पुनश्च: मेरे पास आशाजनक सफलताओं के लिए कुछ उम्मीदवार हैं। मैं उन्हें बाद में पोस्ट करूंगा।


5
इसी तरह के प्रश्न के लिए आँकड़े देखें ।stackexchange.com/q/1883/159 (जो व्यक्तिपरक और तर्क के रूप में बंद था)।
रोब हंडमैन

1
मैं उसी धागे को लाने वाला था। एक नकल की तरह बदबू आ रही है।
डिर्क एडल्डबुलेटेल

1
यह व्यक्तिपरक है, निश्चित है, लेकिन क्या यह अभी भी CW के लिए ठीक नहीं है?
क्रिस्टोफर अदन

1
यह एक लंबे समय के पैमाने पर था। मुझे नहीं लगता कि यह कोई डुप्लिकेट है। तर्क के लिए, यह प्रतिभागियों पर निर्भर है। मैं यहां एक ट्रॉफी देने की कोशिश नहीं कर रहा हूं, सिर्फ मैं और अन्य लोगों के बीच सेमिनार के कागजात को याद रखने के लिए। चूंकि कोई सही जवाब नहीं है, इसलिए मैं एक सीडब्ल्यू के लिए हूं। मुझे यह दिलचस्प लगता है कि अब तक के सभी उत्तर बायेसियन इनोवेशन पर हैं।
गप्पे

2
यह एक पोस्ट की तरह लगता है जो दादागिरी कर सकता है। मुझे लगता है कि यह खुला रह सकता है।
गंग -

जवाबों:


43

जवाब इतना आसान है कि मुझे यह सब लिखने के लिए सीवी बनाने के लिए लिखना है मुझे इसे पोस्ट करने दें: आर


14

मुझे यकीन नहीं है कि आप इसे प्रति "सफलता" कहेंगे, लेकिन प्रकाशन का प्रोबेबिलिटी थ्योरी: द लॉजिक ऑफ साइंस बाय एडविन जेन्स और लैरी ब्रेथॉर्स्ट उल्लेखनीय हो सकते हैं। यहाँ वे कुछ काम करते हैं:

1) कुछ पुनरावृत्त "मौसमी समायोजन" योजनाओं और बायेसियन "उपद्रव पैरामीटर" एकीकरण के बीच समानता दिखाते हैं।

2) तथाकथित "मार्गीकरण विरोधाभास" - कुछ लोगों द्वारा "बेइज़ियनवाद की मृत्यु" और दूसरों द्वारा "अनुचित पुजारियों की मौत" का समाधान किया गया।

3) यह विचार कि प्रायिकता दुनिया की भौतिक संपत्ति का वर्णन करने के विपरीत एक प्रस्ताव के सही या गलत होने के बारे में ज्ञान की स्थिति का वर्णन करती है

इस पुस्तक के पहले तीन अध्याय यहाँ मुफ्त में उपलब्ध हैं


2
दुर्भाग्य से, जेनेस के हाशिए के विरोधाभास का दोष त्रुटिपूर्ण था। केविन वान हॉर्न के नोट्स को देखें जेनेसिस ट्रीटमेंट ऑफ़ द मार्जिनलाइज़ेशन पैराडॉक्स , यहां उपलब्ध है
सियान

1
@ इस्सन - ध्यान दें कि जब उनका संकल्प कुछ क्षेत्रों में त्रुटिपूर्ण था तो उनके अंतर्निहित सिद्धांतों ने इसे हल कर दिया। उचित पुजारियों और उनके अभिसरण सीमाओं के सामान्य नियम का अर्थ है कि सांसद उत्पन्न नहीं हो सकता है। पुस्तक के अधिकांश भाग दो के अधूरे होने के कारण दोष सबसे अधिक है। मुझे पसंद है [यहां] संकल्प ( arxiv.org/abs/math/0310006 ) ksvh संस्करण की तुलना में बेहतर है। छोटा और अधिक सामान्य।
संभावना

14

एक लागू सांख्यिकीविद और सामयिक मामूली सॉफ्टवेयर लेखक के रूप में, मैं कहूंगा:

WinBUGS (1997 जारी)

यह BUGS पर आधारित है, जिसे 15 साल पहले (1989) से अधिक समय से जारी किया गया था, लेकिन यह WinBUGS है, जिसने रियलिस्टिक रूप से जटिल मॉडल के बायेसियन विश्लेषण को व्यापक उपयोगकर्ता आधार के लिए उपलब्ध कराया है। उदाहरण के लिए देखें लून, स्पीगेल्टर, थॉमस एंड बेस्ट (2009) (और इसके बारे में सांख्यिकी में चिकित्सा खंड 28.25 में चर्चा )।


2
अब यह परिवर्तन कैसे Stanबाहर है?
अरी बी। फ्रीडमैन

13

लार्स को मेरा वोट मिलता है। यह चर चयन के साथ रैखिक प्रतिगमन को जोड़ती है। गणना करने के लिए एल्गोरिदम आमतौर पर आपको इसका संग्रह देता है रैखिक मॉडल, मैंवें में से एक में केवल के लिए नॉनजेरो गुणांक हैं मैं regressors, ताकि आप आसानी से विभिन्न जटिलता के मॉडल को देख सकें।


क्या आपने कभी लार्स का इस्तेमाल किया है? मैं पूछ रहा हूं क्योंकि मैंने इसके बारे में पहले कभी नहीं सुना है और यह वास्तव में दिलचस्प लगता है। मूल लेख थोड़ा लंबा (93 पृष्ठ) है, इसलिए इससे पहले कि मैं इसमें गहराई से कुछ राय प्राप्त करूं।
टोमेक टारसिनेस्की

@ टोमेक टारसिनेस्की: मैंने इसे एक छोटी राशि का उपयोग किया है। मतलाब में एक पैकेज है (मुझे यकीन है कि आर में एक या एक से अधिक है), जिसका मैंने उपयोग किया है। यह एक विरल PCA भी प्रदान करता है, जिसकी मुझे अधिक रुचि थी। मैं मानता हूं कि मैंने केवल कागज को स्किम्ड किया है। ;)
shabbychef

11

निर्णय सिद्धांत में "आंतरिक विसंगति" हानि फ़ंक्शन और अन्य "पैरामीटरिमिटेशन फ्री" नुकसान कार्यों की शुरूआत। इसके कई अन्य "अच्छे" गुण हैं, लेकिन मुझे लगता है कि सबसे अच्छा एक इस प्रकार है:

अगर सबसे अच्छा अनुमान है θ आंतरिक विसंगति हानि फ़ंक्शन का उपयोग करना है θ, तो किसी भी एक-से-एक फ़ंक्शन का सबसे अच्छा अनुमान θ, कहते हैं जी(θ) सादा है जी(θ)

मुझे लगता है कि यह बहुत अच्छा है! (जैसे लॉग-ऑड का सबसे अच्छा अनुमान लॉग (पी / (1-पी)) है, विचरण का सबसे अच्छा अनुमान मानक विचलन का वर्ग है, आदि)

कैच? आंतरिक विसंगति से बाहर काम करना काफी मुश्किल हो सकता है! (इसमें मिन () फंकशन, एक संभावना अनुपात और अभिन्न अंग शामिल हैं!)

"काउंटर-कैच"? आप समस्या को "पुनः व्यवस्थित" कर सकते हैं ताकि गणना करना आसान हो जाए!

"काउंटर-काउंटर-कैच"? पता लगाना कि समस्या को "फिर से व्यवस्थित" कैसे किया जा सकता है!

यहां कुछ संदर्भ दिए गए हैं जिनके बारे में मुझे पता है कि इस नुकसान का उपयोग क्या है। जबकि मुझे इन पत्रों / स्लाइड्स के "आंतरिक अनुमान" भागों की तरह बहुत पसंद है, मुझे "संदर्भ पूर्व" दृष्टिकोण के बारे में कुछ आरक्षण हैं जो भी वर्णित हैं।

बायेसियन परिकल्पना परीक्षण: एक संदर्भ दृष्टिकोण

आंतरिक अनुमान

सामान्य साधनों की तुलना: एक पुरानी समस्या के लिए नए तरीके

एकीकृत उद्देश्य बायेसियन अनुमान और परिकल्पना परीक्षण


11

मेरा मानना ​​है कि 15 साल की खिड़की के भीतर गिरने से फेक डिस्कवरी रेट को नियंत्रित करने के लिए एल्गोरिदम हैं । मुझे 'q-value' दृष्टिकोण पसंद है।


1
हम्म, बहुत-उद्धृत बेनजामिनी-होचबर्ग जेआरएसएसबी पेपर 1995 में प्रकाशित हुआ था, इसलिए खिड़की के बाहर बस डर लगता है! jstor.org/stable/2346101 स्टोरी का पेपर जो पेश किया गयाक्ष-वास्तव हालांकि 2002 था। dx.doi.org/10.1111/1467-9868.00346
onestop

9

मेरा अपना 5 सेंट जोड़ना, मेरा मानना ​​है कि पिछले 15 वर्षों की सबसे महत्वपूर्ण सफलता कंप्रेस्ड सेंसिंग है। इस डोमेन में LARS, LASSO, और अन्य एल्गोरिदम के एक मेजबान गिरते हैं, जिसमें संपीडित सेंसिंग बताते हैं कि वे क्यों काम करते हैं और उन्हें अन्य डोमेन तक पहुंचाते हैं।


1
मैंने कम्प्रेस्ड सेंसिंग को देखा है और एक गैर-सांख्यिकीविद् के रूप में मैं खुद से पूछती रहती हूं, "क्या यह सिर्फ रैंडम प्रोजेक्शन नहीं है?" मुझे पता है कि "बस" एक आसान शब्द है जिसे चारों ओर फेंकना है, लेकिन यह महसूस करता है कि लोग यादृच्छिक प्रक्षेपण (लगभग 2000) और संपीड़ित संवेदन (लगभग 2004) के बीच स्पष्ट कनेक्शन की तरह लग रहे हैं।
वेन

9

कुछ ऐसा जो आंकड़ों के साथ खुद बहुत कम करता है, लेकिन बड़े पैमाने पर फायदेमंद रहा है: कंप्यूटर की बढ़ती मारक क्षमता, बड़े डेटासेट और अधिक जटिल सांख्यिकीय विश्लेषण को और अधिक सुलभ, विशेष रूप से लागू क्षेत्रों में।


8

बायेसियन इंट्रैक्शन के लिए एक्सपेक्टेशन-प्रोपेगेशन एल्गोरिदम, विशेष रूप से गॉसियन प्रोसेस वर्गीकरण में, यकीनन एक महत्वपूर्ण सफलता थी, क्योंकि यह एक कुशल विश्लेषणात्मक सन्निकटन विधि प्रदान करता है जो लगभग समान रूप से महंगे नमूने आधारित दृष्टिकोण (सामान्य लाप्लास सन्निकटन के विपरीत) काम करता है। ईपी रोडमैप पर थॉमस मिंका और अन्य का काम देखें


ईपी शांत लगता है (हालांकि यह अभी भी मेरे सिर को चोट पहुँचाता है)। क्या अब भी सामान्य अभिसरण गारंटी की कमी है?
कंजुगेटपायर

7

हम इस 2011 के स्टोकेस्टिक आंशिक विभेदक समीकरण लिंडग्रेन, रुए और लिंडस्ट्रॉम के
यवेस

2

मेरी राय में, बड़े पैमाने पर नए मॉडल को चलाने की अनुमति देने वाली सब कुछ एक सफलता है। स्केलेबल संरचित गाऊसी प्रक्रियाओं (KISS-जीपी) के लिए कर्नेल अंतर्वेशन एक उम्मीदवार हो सकते हैं (हालांकि विचार नया है और वहाँ प्रस्तुत विचार के कई प्रयोगों नहीं किया गया है)।


2

जबकि आंकड़ों की तुलना में थोड़ा अधिक सामान्य है, मुझे लगता है कि आर eproducible अनुसंधान (आरआर) के तरीकों में महत्वपूर्ण प्रगति हुई है । उदाहरण के लिए आर का विकासknittr औरSweaveपैकेज और "आर मार्केडाउन" नोटबुक, LyX और LaTeX सुधार ने डेटा साझाकरण, सहयोग, सत्यापन / सत्यापन और यहां तक ​​कि अतिरिक्त सांख्यिकीय उन्नति में महत्वपूर्ण योगदान दिया है। सांख्यिकीय, चिकित्सा और महामारी विज्ञान पत्रिकाओं में संदर्भित पत्र शायद ही कभी इन प्रतिलिपि प्रस्तुत करने योग्य अनुसंधान विधियों / प्रौद्योगिकियों के उद्भव से पहले आसानी से परिणामों को पुन: पेश करने की अनुमति देते हैं। अब, कई पत्रिकाओं को प्रतिलिपि प्रस्तुत करने योग्य अनुसंधान की आवश्यकता है और कई सांख्यिकीविद् आरआर और पोस्टिंग कोड, उनके परिणामों और वेब पर डेटा स्रोतों का उपयोग कर रहे हैं। इसने डेटा विज्ञान विषयों को बढ़ावा देने में मदद की है और सांख्यिकीय शिक्षा को अधिक सुलभ बनाया है।


1

मेरी राय में, 2011 में विज्ञान पत्रिका में प्रकाशित पत्र। लेखक यादृच्छिक चर की जोड़ी के बीच बहुत दिलचस्प माप का प्रस्ताव रखते हैं जो कई स्थितियों में अच्छी तरह से काम करता है जहां समान उपाय विफल होते हैं (पियर्सन, स्पीयरमैन, केंडल)। वास्तव में अच्छा कागज। यही पर है।


लिंक टूटा हुआ प्रतीत होता है।
dsaxton 15

यह यहाँ भी पाया जा सकता है: ncbi.nlm.nih.gov/pmc/articles/PMC3325791/pdf/nihms358982.pdf
मिरोस्लाव
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.