डेटा को परीक्षण / साबित कैसे किया जाता है शून्य फुलाया जाता है?


9

मुझे एक समस्या है कि मुझे लगता है कि यह सरल होना चाहिए, लेकिन यह पता नहीं लगा सकता। मैं बीज परागण को देख रहा हूं, मेरे पास पौधे (n = 36) हैं जो गुच्छों में फूल हैं, मैं प्रत्येक पौधे से 3 फूल गुच्छों का नमूना लेता हूं, और प्रत्येक क्लस्टर से 6 बीज फली (प्रत्येक पौधे से कुल 18 बीज फली)। एक फली में परागणित 4 से अधिकतम 4 बीज हो सकते हैं। तो, डेटा की गिनती होती है, ऊपरी सीमा के साथ। मैं औसतन पा रहा हूं ~ 10% बीज प्रदूषित हैं, लेकिन कहीं भी दिए गए पौधे पर 1 से 30% के बीच, इसलिए छितरे हुए आंकड़ों पर, और निश्चित रूप से, 3 पौधों पर 4 लापता क्लस्टर प्रतिकृति हैं, इसलिए पूरी तरह से सममित नहीं हैं ।

यह सवाल मैं पूछ रहा हूं कि क्या यह डेटा इस विचार का समर्थन करता है कि इस संयंत्र को बीज सेट के लिए परागणकों की आवश्यकता है।

मैं पा रहा हूँ कि एक फली में बीज की संख्या के लिए वितरण ऐसा लगता है कि अधिक 0 प्रदूषित बीज फली (16 में से 6-9 फली) और 3 और 4 परागित बीज फली (प्रत्येक के लिए 2-4) की तुलना में अधिक है उम्मीद है कि अगर आबादी में बीज बस बेतरतीब ढंग से परागण किया गया था। मूल रूप से, मुझे लगता है कि यह शून्य फुलाया डेटा के लिए क्लासिक उदाहरण है, पहले एक कीट या तो फूल का दौरा नहीं करता है या एक (एक शून्य जनरेटर) पर नहीं जाता है और यदि ऐसा होता है, तो दूसरे वितरण में बीजों के 0-4 का प्रदूषण करता है। वैकल्पिक परिकल्पना संयंत्र आंशिक रूप से स्वफ़ोटो है, और फिर यह उम्मीद की जाएगी कि प्रत्येक बीज के परागित होने की समान संभावना होगी (यह डेटा लगभग 0.1 मौका बताता है, जिसका अर्थ है एक ही फली में दो बीज के लिए 0.01 मौका, आदि) ।

लेकिन मैं केवल डेटा को एक या दूसरे वितरण के लिए सबसे अच्छा फिट दिखाना चाहता हूं, न कि वास्तव में डेटा पर एक ज़िप या ZINB। मुझे लगता है कि मैं जिस भी विधि का उपयोग करता हूं, उसमें परागित बीजों की वास्तविक संख्या और प्रत्येक पौधे पर लगाए गए फली की संख्या को ध्यान में रखना चाहिए। सबसे अच्छी बात यह है कि मैं किसी प्रकार की बूट स्ट्रैप वाली चीज़ करना चाहता हूं, जहाँ मैं किसी पौधे के लिए परागित बीजों की संख्या को बेतरतीब ढंग से बीज अंकुरित करने की संख्या में समनुदेशित करता हूँ, जो कि मैंने १०,००० बार किया है और देखें कि यह कितनी संभावना है। दिए गए संयंत्र के लिए प्रायोगिक डेटा उस यादृच्छिक वितरण से निकला था।

मुझे लगता है कि इस बारे में कुछ ऐसा है जो ब्रूट बल बूटस्ट्रैपिंग की तुलना में बहुत आसान होना चाहिए, लेकिन सोच के दिनों के बाद और खोज के बाद मैं उठ रहा हूं। मैं सिर्फ एक पॉइसन वितरण की तुलना नहीं कर सकता क्योंकि यह ऊपरी बाध्य है, यह द्विपद नहीं है क्योंकि मुझे किसी भी तरह से अपेक्षित वितरण उत्पन्न करने की आवश्यकता है १। कोई विचार? और मैं वहां R सलाह का उपयोग कर रहा हूं (विशेष रूप से सबसे सुरुचिपूर्ण तरीके से n गेंदों के 10,000 यादृच्छिक वितरण को 16 बक्से में उत्पन्न कर सकते हैं जो प्रत्येक 4 गेंदों में हो सकते हैं) सबसे अधिक स्वागत होगा।

ADDED 9/07/2012 सबसे पहले, आप सभी के हित और मदद के लिए धन्यवाद। जवाबों को पढ़कर मुझे अपने सवाल को थोड़ा सा उलझाने का मन बना लिया है। मैं जो कह रहा हूं वह यह है कि मेरी एक परिकल्पना है (जो अब के लिए मैं अशक्त के रूप में सोच रहा हूं) कि फली में बीज बेतरतीब ढंग से परागित होते हैं, और मेरी वैकल्पिक परिकल्पना यह है कि कम से कम 1 परागित बीज के साथ एक बीज की फली अधिक होने की संभावना है एक यादृच्छिक प्रक्रिया से कई परागणित बीजों की अपेक्षा की जाएगी। मैंने तीन पौधों से वास्तविक डेटा प्रदान किया है उदाहरण के लिए कि मैं किस बारे में बात कर रहा हूं। पहला कॉलम एक फली में परागित बीज का # है, दूसरा कॉलम उस बीज की गिनती के साथ फली की आवृत्ति है।

पौधा 1 (कुल 3 बीज: 4% परागण)

num.seeds :: pod.freq

0 :: 16

1 :: 1

2 :: 1

3 :: 0

4 :: 0

पौधा 2 (कुल 19 बीज: 26% परागण)

num.seeds :: pod.freq

0 :: 12

1 :: 1

2 :: 1

3 :: 0

4 :: 4

पौधा 3 (कुल 16 बीज: 22% परागण)

num.seeds :: pod.freq

0 :: 9

1 :: 4

2 :: 3

3 :: 2

4 :: 0

पौधे # 1 में, 18 फली में केवल 3 बीज परागित होते थे, एक फली में एक बीज होता था और एक फली में दो बीज होते थे। यादृच्छिक रूप से फली में एक बीज जोड़ने की प्रक्रिया के बारे में सोचकर, पहले दो बीज प्रत्येक अपनी फली में जाते हैं, लेकिन तीसरे बीज के लिए, फली में 6 धब्बे उपलब्ध होते हैं, जिनमें पहले से एक बीज होता है, लेकिन 16 फली में 64 धब्बे होते हैं। कोई बीज नहीं है, इसलिए यहाँ 2 बीजों के साथ फली की उच्चतम संभावना 6/64 = 0.094 है। यह थोड़ा कम है, लेकिन वास्तव में चरम नहीं है, इसलिए मैं कहूंगा कि यह संयंत्र परागण के ~ 4% संभावना के साथ सभी बीजों में यादृच्छिक परागण की परिकल्पना को फिट करता है। लेकिन पौधे 2 मेरे लिए बहुत अधिक चरम है, 4 फली पूरी तरह से परागण के साथ, फिर भी कुछ नहीं के साथ 12 फली। मुझे पूरा यकीन नहीं है कि इस वितरण की बाधाओं की सीधे गणना कैसे की जाए (इसलिए मेरा बूटस्ट्रैप विचार), लेकिन मुझे लगता है कि इस वितरण की संभावनाएं यादृच्छिक रूप से होती हैं अगर प्रत्येक बीज में परागण की ~ 25% संभावना काफी कम है। प्लांट # 3 मुझे वास्तव में कोई पता नहीं है, मुझे लगता है कि अधिक 0 के हैं और 3 के एक से एक यादृच्छिक वितरण के लिए उम्मीद करनी चाहिए, लेकिन मेरी आंत की भावना यह है कि बीजों की इस संख्या के लिए यह वितरण संयंत्र # 2 के लिए वितरण की तुलना में बहुत अधिक है, और यह संभावना नहीं है कि हो सकता है। लेकिन जाहिर है मैं निश्चित रूप से, और सभी पौधों के लिए जानना चाहता हूं। मुझे लगता है कि अधिक 0 और 3 हैं एक से एक यादृच्छिक वितरण के लिए उम्मीद करनी चाहिए, लेकिन मेरी आंत की भावना यह है कि इस संख्या के बीज के लिए वितरण # 2 संयंत्र के लिए वितरण की तुलना में बहुत अधिक संभावना है, और यह संभावना नहीं हो सकती है। लेकिन जाहिर है मैं निश्चित रूप से, और सभी पौधों के लिए जानना चाहता हूं। मुझे लगता है कि अधिक 0 और 3 हैं एक से एक यादृच्छिक वितरण के लिए उम्मीद करनी चाहिए, लेकिन मेरी आंत की भावना यह है कि इस संख्या के बीज के लिए वितरण # 2 संयंत्र के लिए वितरण की तुलना में बहुत अधिक संभावना है, और यह संभावना नहीं हो सकती है। लेकिन जाहिर है मैं निश्चित रूप से, और सभी पौधों के लिए जानना चाहता हूं।

अंत में मैं एक वक्तव्य लिखना चाह रहा हूं जैसे "बीज की फली में परागित बीजों का वितरण फिट बैठता है (या फिट नहीं है) परिकल्पना है कि पौधे आंशिक रूप से आत्म संगत नहीं हैं, लेकिन बीज सेट करने के लिए परागकण के दौरे की आवश्यकता होती है। (सांख्यिकीय परीक्षण के परिणाम) यह वास्तव में मेरे फॉरवर्ड लुकिंग सेक्शन का हिस्सा है, जहां मैं आगे क्या प्रयोग करना चाहता हूं, इस बारे में बात कर रहा हूं, इसलिए मैं इसके लिए एक चीज या दूसरे के लिए बेताब नहीं हूं, लेकिन अगर संभव हो तो मैं खुद के लिए जानना चाहता हूं। अगर मैं वह नहीं कर पा रहा हूं जो मैं इस डेटा के साथ करने की कोशिश कर रहा हूं, तो मैं यह जानना चाहूंगा!

मैंने पहली बार में एक व्यापक प्रश्न पूछा था, क्योंकि मैं उत्सुक हूं कि क्या यह दिखाने के लिए कोई अच्छा परीक्षण है कि क्या डेटा को पहले स्थान पर शून्य फुलाया हुआ मॉडल में जाना चाहिए। मेरे द्वारा देखे गए सभी उदाहरणों से लगता है - "देखो, यहाँ बहुत सारे शून्य हैं, और इसके लिए एक उचित स्पष्टीकरण है, तो चलो एक शून्य फुलाए हुए मॉडल का उपयोग करें"। मैं अभी इस मंच पर वही कर रहा हूं, लेकिन मुझे अपने पिछले अध्याय पर एक अनुभव था जहां मैंने गणना डेटा के लिए एक पॉइज़न ग्लम का उपयोग किया था और मेरे एक पर्यवेक्षक ने कहा था "नहीं, चमक बहुत जटिल और अनावश्यक हैं, यह डेटा चाहिए एक आकस्मिक तालिका में जाएं ”और फिर मुझे उनके महंगे आँकड़े पैकेज द्वारा उत्पन्न विशाल आकस्मिक तालिका का डेटा डंप दिया जिसने मेरे सभी कारकों + अंतःक्रियाओं को तीन महत्वपूर्ण अंकों के लिए समान p मान दिया !! इसलिए, मैं आँकड़े स्पष्ट और सरल रखने की कोशिश कर रहा हूँ, और सुनिश्चित करें कि मैं उन्हें अपनी पसंदों का दृढ़ता से बचाव करने के लिए अच्छी तरह से समझता हूं, जो मुझे नहीं लगता कि मैं अभी एक शून्य फुलाया मॉडल के लिए कर सकता हूं। मैंने उपचारों की तुलना करने और मेरे मुख्य प्रयोगात्मक सवालों के जवाब देने के लिए उपरोक्त डेटा के लिए एक कैसिबिनोमियल (पूरे पौधों के लिए pesudoreplicaiton से छुटकारा पाने के लिए) और एक मिश्रित मॉडल का उपयोग किया है, या तो एक ही काम करने के लिए लगता है, लेकिन मैं भी जा रहा हूं। आज रात ZINB के साथ खेलें, यह देखने के लिए कि वह कितना अच्छा प्रदर्शन करता है। मैं सोच रहा हूं कि क्या मैं स्पष्ट रूप से प्रदर्शित कर सकता हूं कि यह डेटा पहले से मजबूत है (या शून्य फुलाया गया है), तो उस होने के लिए एक अच्छा जैविक कारण प्रदान करें, मैं बाद में एक ZINB को बाहर निकालने के लिए बहुत बेहतर सेट करूंगा, की तुलना में बस एक क्वासिबिनोमियल / मिश्रित मॉडल की तुलना करें और तर्क दें क्योंकि यह बेहतर परिणाम देता है, यही मुझे उपयोग करना चाहिए। जो मुझे नहीं लगता कि मैं अभी एक शून्य फुलाया मॉडल के लिए कर सकता हूं। मैंने उपचारों की तुलना करने और मेरे मुख्य प्रयोगात्मक सवालों के जवाब देने के लिए उपरोक्त डेटा के लिए एक quasibinomial (पूरे पौधों के लिए pesudoreplicaiton से छुटकारा पाने के लिए) और एक मिश्रित मॉडल का उपयोग किया है, या तो एक ही काम करने के लिए लगता है, लेकिन मैं भी जा रहा हूं। आज रात ZINB के साथ खेलें, यह देखने के लिए कि वह कितना अच्छा प्रदर्शन करता है। मैं सोच रहा हूं कि क्या मैं स्पष्ट रूप से यह प्रदर्शित कर सकता हूं कि यह डेटा पहले से मजबूत है (या शून्य फुलाया गया है), तो उस होने के लिए एक अच्छा जैविक कारण प्रदान करें, मैं बाद में एक ZINB को बाहर निकालने की तुलना में बहुत बेहतर होगा, की तुलना में बस एक क्वासिबिनोमियल / मिश्रित मॉडल की तुलना करें और तर्क दें क्योंकि यह बेहतर परिणाम देता है, यही मुझे उपयोग करना चाहिए। जो मुझे नहीं लगता कि मैं अभी एक शून्य फुलाया मॉडल के लिए कर सकता हूं। मैंने उपचारों की तुलना करने और मेरे मुख्य प्रयोगात्मक सवालों के जवाब देने के लिए उपरोक्त डेटा के लिए एक quasibinomial (पूरे पौधों के लिए pesudoreplicaiton से छुटकारा पाने के लिए) और एक मिश्रित मॉडल का उपयोग किया है, या तो एक ही काम करने के लिए लगता है, लेकिन मैं भी जा रहा हूं। आज रात ZINB के साथ खेलें, यह देखने के लिए कि वह कितना अच्छा प्रदर्शन करता है। मैं सोच रहा हूं कि क्या मैं स्पष्ट रूप से यह प्रदर्शित कर सकता हूं कि यह डेटा पहले से मजबूत है (या शून्य फुलाया गया है), तो उस होने के लिए एक अच्छा जैविक कारण प्रदान करें, मैं बाद में एक ZINB को बाहर निकालने की तुलना में बहुत बेहतर होगा, की तुलना में बस एक क्वासिबिनोमियल / मिश्रित मॉडल की तुलना करें और तर्क दें क्योंकि यह बेहतर परिणाम देता है, यही मुझे उपयोग करना चाहिए। मैंने उपचारों की तुलना करने और मेरे मुख्य प्रयोगात्मक सवालों के जवाब देने के लिए उपरोक्त डेटा के लिए एक quasibinomial (पूरे पौधों के लिए pesudoreplicaiton से छुटकारा पाने के लिए) और एक मिश्रित मॉडल का उपयोग किया है, या तो एक ही काम करने के लिए लगता है, लेकिन मैं भी जा रहा हूं। आज रात ZINB के साथ खेलें, यह देखने के लिए कि वह कितना अच्छा प्रदर्शन करता है। मैं सोच रहा हूं कि क्या मैं स्पष्ट रूप से यह प्रदर्शित कर सकता हूं कि यह डेटा पहले से मजबूत है (या शून्य फुलाया गया है), तो उस होने के लिए एक अच्छा जैविक कारण प्रदान करें, मैं बाद में एक ZINB को बाहर निकालने की तुलना में बहुत बेहतर होगा, की तुलना में बस एक क्वासिबिनोमियल / मिश्रित मॉडल की तुलना करें और तर्क दें क्योंकि यह बेहतर परिणाम देता है, यही मुझे उपयोग करना चाहिए। मैंने उपचारों की तुलना करने और मेरे मुख्य प्रयोगात्मक सवालों के जवाब देने के लिए उपरोक्त डेटा के लिए एक quasibinomial (पूरे पौधों के लिए pesudoreplicaiton से छुटकारा पाने के लिए) और एक मिश्रित मॉडल का उपयोग किया है, या तो एक ही काम करने के लिए लगता है, लेकिन मैं भी जा रहा हूं। आज रात ZINB के साथ खेलें, यह देखने के लिए कि वह कितना अच्छा प्रदर्शन करता है। मैं सोच रहा हूं कि क्या मैं स्पष्ट रूप से यह प्रदर्शित कर सकता हूं कि यह डेटा पहले से मजबूत है (या शून्य फुलाया गया है), तो उस होने के लिए एक अच्छा जैविक कारण प्रदान करें, मैं बाद में एक ZINB को बाहर निकालने की तुलना में बहुत बेहतर होगा, की तुलना में बस एक क्वासिबिनोमियल / मिश्रित मॉडल की तुलना करें और तर्क दें क्योंकि यह बेहतर परिणाम देता है, यही मुझे उपयोग करना चाहिए।

लेकिन मैं अपने प्राथमिक प्रश्न से बहुत अधिक विचलित नहीं करना चाहता, मैं यह कैसे निर्धारित कर सकता हूं कि मेरा डेटा वास्तव में यादृच्छिक वितरण से अपेक्षित शून्य से अधिक फुलाया गया है? मेरे मामले में इसका जवाब यह है कि मॉडल के औचित्य के लिए संभावित लाभ के साथ मेरे लिए वास्तविक ब्याज क्या है, एक बोनस होने के नाते।

अपने सभी समय के लिए फिर से धन्यवाद और मदद करो!

चीयर्स, BWGIA


आप शून्य फुलाए हुए द्विपद मॉडल को क्यों नहीं फिट करना चाहते हैं?
एटिरेटू -

क्या "आंशिक सेल्फिंग" परिकल्पना "परागणकर्ता" परिकल्पना के लिए विशिष्ट है? यदि ऐसा है, तो आपका दूसरा मॉडल प्रायिकता पी और आकार = 4 के साथ एक द्विपद मॉडल होगा।
एटिरेटू -

जवाबों:


5

यह मेरे लिए एक अपेक्षाकृत सीधा (नॉनलाइनियर) मिश्रित मॉडल जैसा लगता है। आपके पास पौधों में घोंसले में बंटे बीज की फली होती है, और आप प्रत्येक चरण में यादृच्छिक प्रभाव वाले एक द्विपद मॉडल को फिट कर सकते हैं:

    library(lme4)
    binre <- lmer( pollinated ~ 1 + (1|plant) + (1|cluster), data = my.data, family = binomial)

या अगर आपके पास है तो कोवरिएट्स के साथ। यदि फूल आत्म-परागण करते हैं, तो आप प्राकृतिक परिवर्तनशीलता के कारण कुछ हल्के प्रभाव देख सकते हैं कि पौधे अपने आप में कितने व्यवहार्य हैं। हालाँकि यदि प्रतिक्रिया में अधिकांश परिवर्तनशीलता क्लस्टर परिवर्तनशीलता कहती है, तो आपके पास कीटों द्वारा परागण का एक मजबूत सबूत होगा जो केवल एक संयंत्र पर चयनित क्लस्टर पर जा सकता है। आदर्श रूप से, आप गाऊसी के बजाय यादृच्छिक प्रभावों का एक गैर-पैरामीट्रिक वितरण चाहते हैं: शून्य पर एक बिंदु द्रव्यमान, कोई कीट की यात्राओं के लिए, और एक सकारात्मक मूल्य पर एक बिंदु द्रव्यमान - यह अनिवार्य रूप से मिश्रण मॉडल माइकल चेरिक के बारे में सोचा है। आप इसे GLLAMM स्टाटा पैकेज के साथ फिट कर सकते हैं , मुझे आश्चर्य होगा अगर यह आर में संभव नहीं था।

संभवतः एक स्वच्छ प्रयोग के लिए, आप चाहते हैं कि पौधे अंदर हों, या कम से कम उस स्थान पर जहां कोई कीट न पहुंचें, और देखें कि कितने बीजों को परागित किया जाएगा। यह शायद आपके सभी सवालों का जवाब अधिक विधिपूर्वक कठोर तरीके से देगा।


मैं यह कोशिश करने जा रहा हूं, मुझे लगता है कि यह मेरे लिए अपने खुद के सवालों के जवाब देने में मदद करेगा, लेकिन इतना निश्चित नहीं कि यह दूसरों को कैसे मनाएगा। आप दूसरे भाग के साथ हाजिर हैं, मैं यह सोचने की कोशिश कर रहा हूं कि यह डेटा भविष्य के अधिक निर्देशित प्रयोग को कैसे सूचित करता है।
BWGIA

1

मुझे लगता है कि यह प्रत्येक व्यक्ति कीट के लिए एक मिश्रण वितरण है। संभाव्यता p के साथ कीट प्रोबेलिटी के साथ भूमि करता है 1-p यह भूमि और 0 से 4 बीज वितरित करता है। लेकिन अगर आपको इस बात की कोई जानकारी नहीं है कि पौधे पर कीटों की ज़मीन है या नहीं, तो आप दो तरीकों से अंतर नहीं कर सकते। p3, p4) जहां pi को i बीजों की संभावना है, जो कि कीटों को प्रदूषक अवरोधक p1 + P2 + p3 + p4 = 1 के अधीन दिए गए हैं। मॉडल में पांच अज्ञात पी, पी 1, पी 2, पी 3, पी 4 हैं जो बाधा 1 = 0 प्रत्येक के लिए है। पर्याप्त डेटा के साथ आप इन मापदंडों का अनुमान लगाने में सक्षम होना चाहिए शायद एक सीमित अधिकतम संभावना दृष्टिकोण का उपयोग कर।


मैं सहमत हूं, लेकिन सवाल उस मॉडल को फिट करने के लिए नहीं है, बल्कि दो अलग-अलग जैविक परिकल्पनाओं के तहत अनुमानित वितरण उत्पन्न करने के लिए है। शायद इसका उत्तर एक ZIB और "कुछ अन्य मॉडल" को फिट करने के लिए है जो स्व-परिकल्पना से मेल खाता है, और उन लोगों की तुलना करें।
एटिरेटू -

@atiretoo मॉडल आपको प्रदत्त बीजों की संख्या के लिए अनुमानित वितरण प्रदान नहीं करता है जो आप अपने परिकल्पित वितरण से तुलना कर सकते हैं?
माइकल आर। चेरिक

सहमत - अगर आपके पास 2 परिकल्पनाओं के लिए सही मॉडल हैं।
एटिरेटू - मोनिका

1

यह आपके प्रश्न के अंतिम भाग का उत्तर है कि परागकण परिकल्पना के लिए इच्छित डेटा को कैसे जल्दी से उत्पन्न करें:

n = 16
max = 4
p1 = 0.1
p2 = 0.9
Y1 = rbinom(10000*n,1,p1)
Y2 = matrix(Y1*rbinom(10000*n,4,p2),ncol=16)

आप rzibinom()पैकेज वीजीएएम में भी उपयोग कर सकते हैं । हालांकि मुझे यकीन नहीं है कि आप इसके साथ क्या करना चाहते हैं। आपके पास 2 मुफ़्त पैरामीटर, पी 1 और पी 2 हैं, जिन्हें अनुमान लगाने की आवश्यकता है। डेटा से उनका अनुमान लगाने के लिए शून्य फुलाए गए द्विपद मॉडल का उपयोग क्यों नहीं किया जाता है?

आपको पैकेज वीजीएएम को देखना चाहिए, जो दूसरों के बीच ZIB मॉडल को फिट करता है। वास्तव में, आप वीजीएएम फ़ंक्शन से ZIB के लिए अपेक्षित वितरण प्राप्त कर सकते हैं dzibinom(), जिसका उपयोग आप अपने अवलोकन वितरण की तुलना करने के लिए कर सकते हैं यदि आप यात्रा और परागण के मापदंडों को जानते हैं। फिर, आपको वास्तव में ZIB मॉडल को फिट करना चाहिए।

यदि आपकी आंशिक सेल्फिंग परिकल्पना कीट परागण के लिए विशिष्ट है, तो अपेक्षित वितरण बस द्विपद है, और आप एक द्विपद परिवार की चमक या शायद एक यादृच्छिक प्रभाव के रूप में प्लांट आईडी के साथ एक गोंद के साथ मापदंडों का अनुमान लगा सकते हैं। हालांकि, यदि वे स्वयं को आंशिक रूप से कीट परागण प्राप्त कर सकते हैं, तो आपको दो द्विपद वितरण के मिश्रण की आवश्यकता होगी। उस मामले में मैं MCB का उपयोग करके मॉडल को फिट करने के लिए OpenBUGS या JAGS का उपयोग करके जांच करूंगा।

एक बार जब आपके पास दो मॉडल आपके डेटा के लिए फिट हो जाते हैं, तो आप उन मॉडलों की तुलना करके देखें कि कौन बेहतर फिट बैठता है, एआईसी या बीआईसी या अपनी पसंद के कुछ अन्य मीट्रिक का उपयोग करके।


उस atiretoo के लिए धन्यवाद, लेकिन उस कोड को चलाने से एक यादृच्छिक संख्या के साथ-साथ एक यादृच्छिक वितरण उत्पन्न होता है। मैं सोच रहा था कि मैं चाहता था कि बीजों का न्युबर तय हो जाए (19 बीज कहिए, नीचे देखें) और फिर देखें कि किसी दिए गए डिस्ट्रीब्यूशन की संभावना कितनी सही थी, इसके लिए
BWGIA

विपक्ष, बहुत जल्द पोस्ट मारा और मेरा मतलब है "ऊपर देखें" जैसा कि मैंने अपने प्रश्न में कुछ जानकारी जोड़ी है। मैं मॉडल की तुलना करने के लिए AIC का उपयोग करने के बारे में आपकी टिप्पणी के बारे में साज़िश कर रहा हूं, क्या मैं विभिन्न वितरणों के साथ मॉडल (एक ही प्रतिक्रिया चर के साथ) कर सकता हूं? मैंने सोचा था कि AIC की तुलना केवल तब ही मान्य थी जब आप किसी मॉडल में शब्द जोड़ते / छोड़ते हैं लेकिन समान वितरण परिवार के साथ निर्दिष्ट होता है?
BWGIA

नहीं, कि पिछड़े चयन पर एआईसी का प्रमुख लाभ है। जब तक डेटा समान हैं आप विभिन्न मॉडलों के बीच एआईसी की तुलना कर सकते हैं, भले ही वे नेस्टेड न हों। आपको इस बात से सावधान रहना होगा कि सॉफ्टवेयर निरंतरता छोड़ने के बिना संभावना की गणना कर रहा है, लेकिन एक ही फ़ंक्शन के भीतर आप आसानी से गैर-नेस्टेड मॉडल की तुलना कर सकते हैं।
एटिरेटू -
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.