कुछ दिलचस्प और अच्छी तरह से लिखे गए आँकड़े के कागजात क्या हैं?


28

आंकड़ों के अनुप्रयोगों का वर्णन करने वाले कुछ अच्छे पेपर क्या हैं जो पढ़ने में मजेदार और जानकारीपूर्ण होंगे? बस स्पष्ट होने के लिए, मैं वास्तव में नए सांख्यिकीय तरीकों (उदाहरण के लिए, कम से कम कोण प्रतिगमन पर एक कागज) का वर्णन करने वाले कागजात की तलाश नहीं कर रहा हूं, बल्कि वास्तविक दुनिया की समस्याओं को हल करने के तरीके का वर्णन करने वाले कागजात।

उदाहरण के लिए, एक पेपर जो फिट होगा वह मैं देख रहा हूं दूसरा क्रॉस-वैलिडेटेड जर्नल क्लब का जलवायु पत्र है । मैं मशीन लर्निंग पेपर के बजाय अधिक आँकड़े-ईश पत्रों की तलाश कर रहा हूं, लेकिन मुझे लगता है कि यह एक फजी भेद की तरह है (मैं नेटफ्लिक्स पुरस्कार के कागजात को थोड़ा सीमा रेखा के रूप में वर्गीकृत करता हूं, और कुछ पर भावना विश्लेषण पर एक पेपर। मैं तलाश नहीं कर रहा हूं )।

मैं पूछ रहा हूं क्योंकि मैंने जितने भी आँकड़े देखे हैं उनमें से अधिकतर छोटे-छोटे स्निपेट हैं जो आपने पाठ्यपुस्तकों में देखे हैं, या मेरे अपने काम से संबंधित चीजें हैं, इसलिए मैं थोड़ा बाहर शाखा करना चाहता हूं।


4
क्या आपके कुछ सामान्य हित हैं जिन्हें आप सूचीबद्ध करना चाहते हैं? यह सुझाव देने में मदद कर सकता है। आँकड़ों के अनुप्रयोग उल्लेखनीय रूप से व्यापक क्षेत्र में व्यापक हो गए हैं।
कार्डिनल

1
@ कार्डिनल, नहीं, कोई विशेष रुचियां नहीं - उद्देश्य आम तौर पर मेरे द्वारा पढ़े जाने वाले सामान से अलग होना था, इसलिए मैं किसी भी उत्तर को सीमित नहीं करने की कोशिश कर रहा हूं। (यह शायद सवाल को थोड़ा व्यापक बनाता है, लेकिन मुझे लगता है कि मैं लोगों की व्यक्तिगत "सर्वोत्तम" सूचियों की तलाश कर रहा हूं।)
raegtin

1
एक क्लासिक को अवश्य पढ़ा जाना चाहिए, विशेष रूप से क्योंकि पेश किए गए सभी संभाव्यता मॉडल "भौतिक" समस्या के बारे में तर्क से प्रेरित होते हैं, न कि एक टोपी से निकाले जाने के कारण, यह है: F. Mosteller, DL Wallace (1963): एक लेखक की समस्या में हस्तक्षेप। विवादित फेडरलिस्ट पेपर्स के लेखक जे। एम। पर लागू भेदभाव विधियों का एक तुलनात्मक अध्ययन । स्टेट। Assoc। 58 (302), पीपी। 275–309। इसके अलावा इस लिंक पर
pglpm

जवाबों:


12

मेरे लिए यह देखना थोड़ा मुश्किल है कि आपके लिए कौन सा पेपर रूचिकर हो सकता है, इसलिए मुझे साइकोमेट्रिक संसाधन से निम्नलिखित बातों को आज़माने और सुझाने दें:

बोरसूम, डी। (2006)। मनोचिकित्सकों का हमलासाइकोमेट्रिका , 71 , 425-440।

दृश्य तैयार करने के लिए (हमें सांख्यिकीय मॉडल का उपयोग करने की आवश्यकता क्यों है जो मनोवैज्ञानिक अनुसंधान में आमतौर पर पाए जाने वाले अंतर्निहित परिकल्पनाओं को बेहतर ढंग से दर्शाते हैं?), और

बोरसूम, डी। (2008)। नैदानिक ​​प्रणालियों पर साइकोमेट्रिक दृष्टिकोणजर्नल ऑफ़ क्लिनिकल साइकोलॉजी , 64 , 1089-1108।

नैदानिक ​​चिकित्सा पर लागू दृष्टिकोण के लिए (डीएसएम-वी के लिए "आयामी" दृष्टिकोण के रूप में डीएसएम-चतुर्थ में उपयोग के रूप में हाँ / नहीं मूल्यांकन से संक्रमण)। बायोमेडिकल रिसर्च में अव्यक्त चर मॉडल की एक बड़ी समीक्षा जो मुझे पसंद है:

राबे-हेसेथ, एस। और स्कर्नडाल, ए। (2008)। चिकित्सा अनुसंधान के लिए शास्त्रीय अव्यक्त चर मॉडलचिकित्सा अनुसंधान में सांख्यिकीय तरीके , 17 (1) , 5-32।


@ chl (+1) बोर्स्बोम पेपर अद्भुत थे, उन्होंने वास्तव में माप के बारे में मेरी सोच को व्यापक किया
अमीर

+1, मुझे Borsboom भी पसंद है। द अटैक आर्टिकल में दिलचस्पी रखने वालों के लिए "द कॉन्सेप्ट ऑफ वैलिडिटी ", rhowell.ba.ttu.edu/borsboomValidity2004.pdf में भी रुचि होगी । हालाँकि यह थोड़ी अधिक क्रिया है, इसलिए यह अटैक आर्टिकल का पालन करना उतना आसान नहीं है।
एंडी डब्ल्यू

10

रॉयल स्टैटिस्टिकल सोसाइटी, सी सीरीज सी: एप्लाइड स्टैटिस्टिक्स के पिछले 40 वर्षों के पाँच उच्च-उद्धृत पेपर हैं , शीर्षक में एक स्पष्ट आवेदन के साथ एप्लाइड सांख्यिकी जो ज्ञान की खोज परिणामों के वेब के माध्यम से स्कैन करते समय मेरी आंख को पकड़ा:


9

व्यापक स्तर पर मैं 2001 में लियो ब्रिमन द्वारा ["सांख्यिकीय मॉडलिंग: द टू कल्चर"] [1] पत्र की सिफारिश करूँगा (मुझे 515) पता है कि यह हाल ही में जर्नल क्लब द्वारा कवर किया गया था और मुझे यह वास्तव में दिलचस्प लगा। मैंने अमूर्त को c & p'd किया है।

सार। आंकड़ों से निष्कर्ष तक पहुंचने के लिए सांख्यिकीय मॉडलिंग के उपयोग में दो संस्कृतियां हैं। एक मानता है कि डेटा किसी दिए गए स्टोचस्टिक डेटा मॉडल द्वारा उत्पन्न होते हैं। अन्य एल्गोरिथम मॉडल का उपयोग करता है और डेटा तंत्र को अज्ञात मानता है। सांख्यिकीय समुदाय डेटा मॉडल के लगभग अनन्य उपयोग के लिए प्रतिबद्ध है। इस प्रतिबद्धता ने अप्रासंगिक सिद्धांत, संदिग्ध निष्कर्षों को जन्म दिया है, और सांख्यिकीविदों को दिलचस्प समस्याओं की एक बड़ी श्रृंखला पर काम करने से रोक दिया है। थ्योरी और प्रैक्टिस दोनों में एलगोरिदमिक मॉडलिंग ने सांख्यिकी के बाहर तेजी से क्षेत्र विकसित किए हैं। इसका उपयोग बड़े जटिल डेटा सेटों और छोटे डेटा सेटों पर डेटा मॉडलिंग के लिए अधिक सटीक और सूचनात्मक विकल्प के रूप में किया जा सकता है। यदि क्षेत्र के रूप में हमारा लक्ष्य समस्याओं को हल करने के लिए डेटा का उपयोग करना है,

[१]: https://doi.org/10.1214/ss/1009213726 (खुली पहुंच)


8

आनुवंशिक महामारी विज्ञान के नजरिए से, अब मैं जीनोम-वाइड एसोसिएशन अध्ययन के बारे में कागजात की निम्नलिखित श्रृंखला की सिफारिश करूंगा :

  1. कॉर्डेल, एचजे और क्लेटन, डीजी (2005)। जेनेटिक एसोसिएशन की पढ़ाईलैंसेट 366, 1121-1131।
  2. कैंटर, आरएम, लैंग, के।, और सिंसहाइमर, जेएस (2010)। GWAS परिणामों को प्राथमिकता देना: उनके आवेदन के लिए सांख्यिकीय तरीकों और सिफारिशों की समीक्षाअमेरिकन जर्नल ऑफ़ ह्यूमन जेनेटिक्स 86, 6–22।
  3. इयोनिडीस, जेपीए, थॉमस, जी, डेली, एमजे (2009)। जीनोम-वाइड एसोसिएशन संकेतों को मान्य, संवर्धित और परिष्कृत करनाप्रकृति की समीक्षा जेनेटिक्स 10, 318-329।
  4. बैल्डिंग, डीजे (2006)। जनसंख्या संघ के अध्ययन के लिए सांख्यिकीय तरीकों पर एक ट्यूटोरियलप्रकृति समीक्षा आनुवंशिकी 7, 781-791।
  5. ग्रीन, एई एट अल। (2008)। संज्ञानात्मक तंत्रिका विज्ञान में आनुवंशिक डेटा का उपयोग करना: बढ़ते दर्द से वास्तविक अंतर्दृष्टि तकप्रकृति समीक्षा तंत्रिका विज्ञान 9, 710-720।
  6. मैकार्थी, एमआई एट अल। (2008)। जटिल लक्षणों के लिए जीनोम-वाइड एसोसिएशन अध्ययन: आम सहमति, अनिश्चितता और चुनौतियांप्रकृति समीक्षा आनुवंशिकी 9, 356-369।
  7. मनोरोग GWAS कंसोर्टियम समन्वय समिति (2009)। जीनोमाइड एसोसिएशन स्टडीज: मनोरोग विकार के लिए इतिहास, औचित्य और संभावनाएंअमेरिकन जर्नल ऑफ साइकेट्री 166 (5), 540-556।
  8. सेबेस्टियन, पी। एट अल। (2009)। जीनोम-वाइड एसोसिएशन अध्ययन और जटिल लक्षणों के आनुवंशिक विच्छेदनअमेरिकन जर्नल ऑफ हेमटोलॉजी 84 (8), 504-15।
  9. वेलकम ट्रस्ट केस कंट्रोल कंसोर्टियम (2007)। सात सामान्य बीमारियों के 14,000 मामलों और 3,000 साझा नियंत्रणों के जीनोम-वाइड एसोसिएशन अध्ययनप्रकृति 447, 661-678।
  10. वेलकम ट्रस्ट केस कंट्रोल कंसोर्टियम (2010)। आठ सामान्य बीमारियों और 3,000 साझा नियंत्रणों के 16,000 मामलों में CNVs का जीनोम-वाइड एसोसिएशन अध्ययनप्रकृति 464, 713-720।


2

सांख्यिकीय जैव सूचना विज्ञान अनुसंधान के बारे में प्रारंभिक प्रभाव वाला एक लेख:

जेलिजाओ एट अलजैव सूचना विज्ञान में अति-आशावाद: एक चित्रण । जैव सूचना विज्ञान, 2010

यह पूर्वाग्रह स्रोतों पर एक दिलचस्प चर्चा के लिए बनाता है, overfitting, और महत्व के लिए मछली पकड़ने।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.