सिद्धांत और गणित पर समान तनाव के साथ एक अच्छी किताब


10

मेरे स्कूल के वर्षों के दौरान और विश्वविद्यालय में आंकड़ों पर पर्याप्त पाठ्यक्रम हैं। मुझे अवधारणाओं की बहुत अच्छी समझ है, जैसे, CI, p-मान, सांख्यिकीय महत्व की व्याख्या, एकाधिक परीक्षण, सहसंबंध, सरल रैखिक प्रतिगमन (कम से कम वर्ग) (सामान्य रैखिक मॉडल), और परिकल्पना के सभी परीक्षण। मैं इसे पहले के ज्यादातर दिनों में गणितीय रूप से पेश कर चुका था। और हाल ही में, किताब की मदद से सहज ज्ञान युक्त जीवविज्ञान मैंने वास्तविक वैचारिक सिद्धांत के प्रति समझ और अभूतपूर्व समझ हासिल की है, मुझे विश्वास है।

अब, जो मुझे लगता है कि मेरे पास फिटिंग मॉडल (मॉडल के मापदंडों का आकलन) और इसी तरह की कमी है। विशेष रूप से, इस तरह की अधिकतम संभावना अनुमान, सामान्यीकृत रैखिक मॉडल, द्विअर्थी आंकड़ों के लिए बेज़ियन दृष्टिकोण जैसी अवधारणाएं मुझे हमेशा विदेशी लगती हैं। पर्याप्त उदाहरण या ट्यूटोरियल या वैचारिक रूप से ध्वनि वाले नहीं हैं, क्योंकि एक व्यक्ति इंटरनेट पर सरल संभाव्य मॉडल या अन्य (मूल) विषयों पर मिलेगा।

मैं एक बायोइनफॉरमैटिशियन हूं और मैं आरएनए-सीक्यू डेटा पर काम करता हूं, जो कि कच्चे रीड से संबंधित है, जो कहता है कि जीन एक्सप्रेशन (या डिफरेंशियल जीन एक्सप्रेशन) ढूंढता है। मेरी पृष्ठभूमि से, भले ही मैं सांख्यिकीय मॉडल से परिचित नहीं हूं, मैं एक पॉइज़न वितरण धारणा और नकारात्मक द्विपद और इतने पर कारण को समझने में सक्षम हूं .. लेकिन कुछ कागजात सामान्यीकृत रैखिक मॉडल के साथ सौदा करते हैं और एक एमएलई आदि का अनुमान लगाते हैं। मेरा मानना ​​है कि मेरे पास समझने के लिए आवश्यक पृष्ठभूमि है।

मुझे लगता है कि मैं जो पूछ रहा हूं वह आपके लिए उपयोगी और (ए) पुस्तक (एस) के कुछ विशेषज्ञों के बीच एक दृष्टिकोण है जो मुझे इन अवधारणाओं को अधिक सहज तरीके से समझने में मदद करता है (न केवल कठोर गणित, बल्कि सिद्धांत गणित के साथ समर्थित)। जैसा कि मैं ज्यादातर उन्हें लागू करने जा रहा हूं, मुझे समझ में (इस समय) संतुष्ट हो जाएगा कि क्या है और बाद में, मैं कठोर गणितीय प्रमाण पर वापस जा सकता हूं ... क्या किसी की कोई सिफारिश है? अगर मुझे जिन विषयों के लिए कहा गया है, मुझे 1 से अधिक पुस्तक खरीदने से कोई आपत्ति नहीं है।

आपका बहुत बहुत धन्यवाद!


क्या आप मुझे इस क्षेत्र में RNA-Seq डेटा और सांख्यिकीय चुनौतियों के बारे में जानने के लिए कुछ अच्छे स्रोतों की सिफारिश कर सकते हैं?
बायोटैट

1
बायोस्टैट, निश्चित रूप से, वेबसाइट seqanswers.com NGS के लिए एक बहुत अच्छा संसाधन है। आप विभिन्न तकनीकों से शुरू कर सकते हैं और वे यहां से कैसे काम करते हैं: goo.gl/NLuvJ ये कुछ कागजात हैं जो एनजीएस डेटा के साथ कुछ सांख्यिकीय समस्याओं की व्याख्या करते हैं। संक्षेप में, वे तकनीकी और जैविक भिन्नता अनुमान (जीन अभिव्यक्ति के संबंध में) हैं। 1) सबसे पहले कागजात तकनीकी भिन्नता का आकलन करने में से एक: ncbi.nlm.nih.gov/pubmed/18550803 2) DESeq: जीन अभिव्यक्ति का पता लगाने के लिए एक उपकरण: ncbi.nlm.nih.gov/pubmed?term=DESeq%20simon%20anders
अरुण

1
सीडब्ल्यू में परिवर्तित हो गया क्योंकि ऐसा लगता है कि अच्छे सुझावों का एक गुच्छा पेश किया जाएगा और उनके बीच एक "सर्वश्रेष्ठ" तय करने के लिए कोई स्पष्ट उद्देश्य मानक नहीं है। मुझे उम्मीद है कि इससे पाठकों को बहुत सारे उत्तरों को वोट करने में आसानी होगी, :-)।
whuber

व्हीबर, ज़रूर! समझ में आता है। क्या मैं एक सामुदायिक विकि पद बना सकता हूँ? या इसके लिए मॉडरेटर के विशेषाधिकार की आवश्यकता है?
अरुण

जवाबों:


5

आपको गैर-बायेसियन सब कुछ मिलेगा जो आपने इसके बारे में पूछा था फ्रैंक हैरेल की प्रतिगमन मॉडलिंग रणनीतियाँ । मैं अधिक जानकार लोगों को बेयसियन की सिफारिशें छोड़ दूंगा (हालांकि मेरे बुकशेल्फ़ पर गेल्मेन , कार्लिन, स्टर्न और रुबिन के साथ-साथ गिलक्स, रिचर्डसन और स्पीगेलहेल्टर भी हैं)। बाजार पर कुछ बायेसियन बायोस्टैट किताबें होनी चाहिए।

अपडेट: मैककूल और नेल्डर (1989) GLMs पर एक क्लासिक पुस्तक है, बिल्कुल। यह अपने समय के लिए गंभीर था, लेकिन मुझे यह उबाऊ लगता है, स्पष्ट रूप से। इसके अलावा, यह अवशिष्ट निदान, शून्य-फुलाया गया मॉडल या बहुस्तरीय / पदानुक्रमित एक्सटेंशन जैसे बाद के परिवर्धन को कवर नहीं करता है। हार्डिन और हिल्बे (2007) ने इस नए सामान को स्टैटा में व्यावहारिक उदाहरणों के साथ अच्छे विवरणों में शामिल किया है (जहां GLM और एक्सटेंशन बहुत अच्छी तरह से लागू किए गए हैं; हार्डिन स्टाटा कॉर्प में काम करते थे, इनमें से कई कमांड लिखते थे, साथ ही साथ योगदान भी करते थे। सैंडविच अनुमानक)।


हाय StasK, बहुत बहुत धन्यवाद! मुझे पता है कि प्रतिगमन मॉडलिंग पर एक मेरी आवश्यकताओं को पूरा करेगा। वे GLM को कितना कवर करते हैं? मैं यह भी देखता हूं कि बायेसियन इंट्रेंस पर आपके संदर्भ वे मानक हैं जो मुझे हमेशा अनुशंसित लगते हैं। आपकी राय में, उनका अनुसरण करना कितना आसान / कठिन है (जैसे कि स्तर बहुत उन्नत है)? इसके अलावा, क्या आपके पास सामान्यीकृत रैखिक मॉडल पुस्तक पर एक नज़र है ? लेखकों में से एक जेए नेल्डर है। इसके अलावा, मैं इस पुस्तक को सांख्यिकीय मॉडल पर भी खरीदना चाहूंगा । क्या आपके पास इस पर कोई विचार है? धन्यवाद!
अरुण

मैंने इस फ्रीडमैन की किताब नहीं देखी है। यह काफी दिलचस्प है, हालांकि यह कठोरता के मामले में हल्का प्रतीत होता है, और मुझे यकीन नहीं है कि मैं इससे खुश हूं। (एक पुस्तक जो गणित पर बहुत हल्की है जो मैट्रिक्स बीजगणित के बिना प्रतिगमन के बारे में बात करती है, लेकिन वैज्ञानिक कठोरता पर बहुत गहरा है, ज्यादातर एंग्रीस्ट और पिस्चके द्वारा हानिरहित अर्थमिति है, और यदि आप कारण मॉडल के साथ काम करते हैं, तो यह पुस्तक एक आवश्यक है।) वास्तव में आपके गणित / स्टेट बैकग्राउंड को नहीं जानते हैं, इसलिए मेरे लिए यह अनुमान लगाना कठिन होगा कि क्या ये किताबें कठिन होंगी। कुछ बायेसियन पुस्तकें हो सकती हैं; वे मानते हैं कि आप पहले से ही MLE और GLM को जानते हैं।
स्टैस्क

1
मैंने मैककूल और नेल्डर संदर्भ को शामिल करने के लिए अपनी प्रतिक्रिया अपडेट की है।
StasK

मैं एक इलेक्ट्रॉनिक्स एनरजेंट हूं। बायोइनफॉरमैटिशियन बने। मेरे पास सांख्यिकी (संचार सिद्धांत के लिए), संभाव्यता और यादृच्छिक प्रक्रियाओं पर पाठ्यक्रम हैं, मैं कैलकुलस (हालांकि थोड़ा कठोर) और रैखिक बीजगणित के साथ सहज हूं। बेशक ये ज्यादातर स्नातक स्तर के होते हैं ... मेरा उद्देश्य वैचारिक रूप से ध्वनि (ज्यामितीय व्याख्याओं की अधिक, विधियों की समझ और सबसे महत्वपूर्ण रूप से उद्देश्य) आदि का होना है ... बेशक, मुझे गणित से कोई फर्क नहीं पड़ता, अगर यह इन व्यंजनों के साथ आता है। आपकी सिफारिशों के लिए फिर से धन्यवाद!
अरुण

3

मैं निम्नलिखित दो पुस्तकों की सिफारिश करूंगा:

  1. जैव सूचना विज्ञान के लिए सांख्यिकीय तरीके
  2. सांख्यिकीय सबक के तत्व

ये किताबें अच्छी चीजें समझाती हैं, लेकिन ओपी के बारे में पूछे जाने वाले सामान के बारे में नहीं।
StasK

@StasK, क्या आप बता सकते हैं कि उपरोक्त पुस्तकों में कौन सा सामान नहीं है?
बायोस्टैट

मैंने HTF से पढ़ाया है, और जो सामान मैंने पढ़ाया है वह आधार कार्यों, स्वतंत्रता की प्रभावी डिग्री, मॉडल चयन, लास्सो, क्रॉस-मान्यता, आदि के बारे में था MLE और GLM कि ओपी में रुचि रखते थे, का उल्लेख सबसे अच्छा है। यह या तो यह माना जाता है कि सांख्यिकी छात्र अपने सामान्य सांख्यिकीय प्रशिक्षण से इस सामान से परिचित हैं, या सीएस छात्र लॉजिस्टिक रिग्रेशन के बजाय एसवीएम का उपयोग करेंगे, बाइनरी परिणाम डेटा के लिए घुटने की प्रतिक्रिया के रूप में। बेयसियन सामान का भी केवल इस हद तक उल्लेख किया गया है कि बेयसियन निर्णय नियम कुछ मायने में इष्टतम हैं; कोई MCMC या संयुक्ताक्षर, कहते हैं।
स्टैस्क

क्या आपने "जैव सूचना विज्ञान के लिए सांख्यिकीय तरीके" पुस्तक पढ़ी है?
बायोस्टैट

@ निबोसत, नहीं, मैंने नहीं। मैं जैव सूचना विज्ञान में काम नहीं करता, लेकिन मुझे पता है कि यह थोड़ी अलग दुनिया है। इसलिए मैं कोई उचित सिफारिश नहीं कर सकता। मेरी राय में, जीएलएम, जीईई, अनुदैर्ध्य और उत्तरजीविता मॉडल जैसे मॉडलों के साथ काम करने वाली जैव प्रौद्योगिकी की शाखा अर्थमिति के साथ आम है (इसलिए क्रॉस-अनुभागीय और पैनल डेटा मॉडल पर वोल्ड्रिज की पुस्तक कुछ बायोस्टैट लोगों के लिए एक अच्छी सिफारिश हो सकती है जो काम कर रहे हैं) इन मॉडलों के साथ) सांख्यिकीय आनुवांशिकी के साथ, परिवारवार त्रुटि दर नियंत्रण और डेटा खनन, जो आपकी विशेषज्ञता का क्षेत्र प्रतीत होता है।
स्टैस्क
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.