बेइज़ियन हाइपोथिसिस परीक्षण का मतलब अनुमान और निर्णय सिद्धांत के ढांचे में क्या है?


15

मेरी पृष्ठभूमि मुख्य रूप से मशीन लर्निंग में है और मैं यह जानने की कोशिश कर रहा था कि बायेसियन हाइपोथिसिस परीक्षण का क्या मतलब है। मैं संभाव्यता की द्विअर्थी व्याख्या के साथ ठीक हूं और मैं संभाव्य चित्रमय मॉडल के संदर्भ में इससे परिचित हूं। हालांकि, जो मुझे भ्रमित कर रहा है वह है कि सांख्यिकीय अनुमान के संदर्भ में "हाइपोथीसिस" शब्द का अर्थ क्या है।

मुझे लगता है कि मैं ज्यादातर उस शब्दावली के बारे में भ्रमित हो रहा हूं जिसका उपयोग मैं मशीन लर्निंग में किया जाता हूं। आमतौर पर आंकड़ों और अनुमानों में क्या उपयोग किया जाता है।

के संदर्भ में देखरेख सीखने , मैं सामान्य रूप से भविष्य कहनेवाला समारोह है कि अपने लेबल के लिए उदाहरण के नक्शे यानी के रूप में परिकल्पना के बारे में सोच । हालाँकि, यह मुझे लगता है कि शब्द की परिकल्पना, रीडिंग में जो मैं कर रहा हूं, उसका एक ही अर्थ नहीं है। मेरे द्वारा पढ़ी जा रही रीडिंग का एक पेस्ट पेस्ट करें:h:XY

यहाँ छवि विवरण दर्ज करें

यदि आप ध्यान से पढ़ें तो यह भी कहता है:

देखा गया डेटा के लिए एक अलग मॉडल है ...

क्या वे शब्द मॉडल का उपयोग कर रहे थे। मेरे लिए शब्द मॉडल मुझे लगता है कि कार्यों के एक सेट के लिए हम एक विशिष्ट भविष्य कहनेवाला फ़ंक्शन का चयन कर रहे थे। यानी फ़ंक्शन की एक परिकल्पना कक्षा। उदाहरण के लिए, द्विघात कार्यों की परिकल्पना कक्षा हो सकती है (डिग्री 2 का बहुपद)। हालांकि, यह मुझे लगता है कि वे इस अर्क के पर्याय के रूप में मॉडल और परिकल्पना का उपयोग करते हैं (जहां मेरे लिए वे पूरी तरह से अलग शब्द हैं)।Hd2

फिर यह उल्लेख किया जाता है कि हम पादरियों को परिकल्पना के लिए रख सकते हैं (एक बायसी सेटिंग में पूरी तरह से उचित चीज):

pH(Hm),     m={0,1,...,M1}

इसके अलावा, हम वर्तमान परिकल्पना के साथ डेटा को चिह्नित कर सकते हैं:

py|H(|Hm),     m={0,1,...,M1}

और कुछ डेटा (और बे के नियम) दिए गए हमारे वर्तमान अपडेट को अपडेट करें:

pH|y(Hm|y),     m={0,1,...,M1}

हालांकि, मुझे लगता है कि मैं एक परिकल्पना वर्ग से एक विशेष पैरामीटर (कहना ) के लिए एक बिसियन अनुमान लगाने के लिए अधिक उपयोग किया जाता हूं बजाय पूरे परिकल्पना वर्ग के। मूल रूप से ऐसा लगता है कि ये "परिकल्पनाएं" मशीन लर्निंग के संदर्भ से समान परिकल्पना नहीं हैं, जिनका मैं उपयोग कर रहा हूं, ऐसा लगता है कि ये परिकल्पनाएं हाइपोथीसिस वर्ग की तुलना में विशिष्ट θ पैरामीटर के समान हैं ।θθ

इस बिंदु पर मुझे यकीन था कि "परिकल्पना" का मतलब भविष्यवाणी के कार्य (पैरामीटर ) द्वारा ), उदाहरण के लिए) के समान था, लेकिन मुझे लगता है कि मैं गलत था ...θ

मेरे भ्रम को और भी बदतर बनाने के लिए, बाद में ये वही रीडिंग प्रत्येक प्रशिक्षण उदाहरण के लिए एक विशेष "परिकल्पना" को निर्दिष्ट करने के लिए आगे बढ़ीं जो उन्होंने देखीं। मुझे क्या मतलब है की एक पेस्ट पेस्ट:

यहाँ छवि विवरण दर्ज करें

इसका कारण यह है कि यह मुझे भ्रमित करता है, अगर मैं परिकल्पना को एक पैरामीटर के रूप में व्याख्या करता हूं, तो मेरे लिए यह प्रत्येक नमूना मूल्य के लिए एक विशिष्ट पैरामीटर निर्दिष्ट करने का कोई मतलब नहीं है जो हम देखते हैं। इस बिंदु पर मैंने निष्कर्ष निकाला कि मुझे वास्तव में नहीं पता था कि उनका अर्थ परिकल्पना से था इसलिए मैंने यह प्रश्न पोस्ट किया।

हालांकि, मैंने पूरी तरह से हार नहीं मानी, मैंने शोध किया कि लगातार आंकड़ों में परिकल्पना का क्या अर्थ है और निम्नलिखित खान अकादमी वीडियो मिला । यही कारण है कि वीडियो वास्तव में मेरे लिए भावना का एक बहुत बनाता है (हो सकता है आप एक frequentist कर रहे हैं! :) । हालांकि, ऐसा लगता है कि उन्हें डेटा का एक गुच्छा मिलता है (जैसे कुछ "नमूना सेट") और नमूना सेट के गुणों के आधार पर, वे तय करते हैं कि डेटा के बारे में अशक्त परिकल्पना को स्वीकार या अस्वीकार करना है या नहीं। हालाँकि, मैं जो बायसीयन संदर्भ में पढ़ रहा हूँ, यह मुझे लगता है कि प्रत्येक डेटा [बिंदु] वेक्टर के लिए जो मनाया जाता है, वे "संभावना अनुपात परीक्षण" के साथ एक परिकल्पना के साथ "लेबल" करते हैं:

यहाँ छवि विवरण दर्ज करें

जिस तरह से वे प्रत्येक डेटा नमूने के लिए परिकल्पना दे रहे हैं, यहां तक ​​कि ऐसा लगता है कि एक पर्यवेक्षित सीखने की सेटिंग थी हम प्रत्येक प्रशिक्षण सेट पर एक लेबल संलग्न कर रहे हैं। हालाँकि, मुझे नहीं लगता कि वे इस संदर्भ में क्या कर रहे हैं। वे क्या कर रहे हैं? प्रत्येक डेटा नमूने के लिए एक परिकल्पना निर्दिष्ट करने का क्या मतलब है? परिकल्पना का अर्थ क्या है? मॉडल शब्द का क्या अर्थ है?

मूल रूप से, मेरे भ्रम की इस लंबी व्याख्या के बाद, क्या कोई जानता है कि इस संदर्भ में बेयसियन परिकल्पना परीक्षण का क्या अर्थ है?


यदि आपको मेरे प्रश्न को बेहतर बनाने के लिए किसी स्पष्टीकरण या किसी चीज़ की आवश्यकता है या इसलिए कि यह प्रश्न समझ में आता है, तो मैं मदद करने के लिए अधिक खुश हूँ :)


उत्तर की मेरी खोज में मुझे सांख्यिकीय परिकल्पना परीक्षण से संबंधित कुछ उपयोगी चीजें मिलीं:

यदि आप CS पृष्ठभूमि से आते हैं तो यह विषय मेरे लिए एक अच्छा परिचय देता है (मेरे जैसे):

कंप्यूटर वैज्ञानिकों के लिए सांख्यिकीय परिकल्पना परीक्षण का एक अच्छा परिचय क्या है?

कुछ बिंदु पर मैंने "डिफ़ॉल्ट मापदंडों" के बारे में पूछा (जो मुझे परिभाषित करना चाहिए था कि मेरा क्या मतलब है। मुझे लगा कि यह एक मानक शब्द है लेकिन ऐसा नहीं है, इसलिए यहां मैं इसे संबोधित करूंगा) और मुझे लगता है कि मेरा वास्तव में क्या मतलब है आप प्रत्येक परिकल्पना के लिए पैरामीटर निर्दिष्ट करते हैं जो आपके पास है। उदाहरण के लिए, आप कैसे तय करते हैं कि आपकी अशक्त परिकल्पना और उसके पैरामीटर क्या हैं। इससे संबंधित एक प्रश्न है:

परिकल्पना परीक्षण में अशक्त परिकल्पना को कैसे निर्दिष्ट करें


@ शीआन मैं निम्नलिखित विकिपीडिया लेख पढ़ता हूं: en.wikipedia.org/wiki/Statutic_model यह है कि वे एक मॉडल और एक परिकल्पना से क्या मतलब है? thnx for ur patience btw :)
पिनोचियो

3
मैं इस चर्चा में उतरने में संकोच कर रहा हूं क्योंकि मुझे लगता है कि आपकी समस्या वास्तव में यह है कि सिद्धांत में परिकल्पना परीक्षण का क्या मतलब है, यह समझने के बजाय, विशेष रूप से यह है कि बायेसियन ढांचे में परिकल्पना परीक्षण क्या है। इसकी मदद करने के लिए, मैं सुझाव देता हूं कि गीज़र द्वारा पुस्तक "मोडेम ऑफ़ पैरामीट्रिक स्टैटिस्टिक इन्वेंशन" पर एक नज़र डालें। books.google.ca/...
ROCINANTE

@ अत्याचार मुझे लगता है कि मैं आपसे सहमत हूँ। मैं सामान्य रूप से परिकल्पना परीक्षण के बारे में निश्चित रूप से उलझन में हूं (और बायेसियन फ्रेमवर्क बिल्कुल भी मदद नहीं करता है)। मैं निश्चित रूप से उस पर एक नज़र डालूंगा। आपके धैर्य और समझ के लिए धन्यवाद, इसकी बहुत सराहना की।
पिनोचियो

यह समझना आसान बात नहीं है क्योंकि संक्षिप्त तरीके से व्यक्त करना आसान बात नहीं है। अमूर्त शब्दों (जैसे नक्शों) में इस बारे में सोचने के बजाय, यदि आप इसके बारे में एक सरल उदाहरण के साथ सोचते हैं तो शायद यह मदद करेगा।
1/2

1
2/2 मान लीजिए कि आपके पास एक सिक्का है और आप देखना चाहते हैं कि क्या यह उचित है, इसलिए आप इसे 50 बार फ्लिप करते हैं। अब आपके पास एक डेटा सेट है जिसके बारे में आप कुछ अनुमान लगाना चाहते हैं (यानी सिक्का पक्षपाती है या नहीं)। तार्किक रूप से, यदि सिक्का उचित है, तो लगभग आधे टॉस्क प्रमुख होने चाहिए। (ध्यान दें कि यह एक आँकड़े व्युत्पत्ति नहीं है, बल्कि आपका अपना तार्किक तर्क है)। वह तुम्हारी परिकल्पना है। आप इस परिकल्पना को 2 तरीकों से परख सकते हैं: बायेसियन तरीका और लगातार तरीका।
रसाकांटे

जवाबों:


10

θ

F={f(|θ); θΘ}
θH0:θΘ0F
F0={f(|θ); θΘ0}
Mρ0ρaπ0(θ)Θ0πa(θ)Θ
π(m=0|x)=ρ0Θ0f(x|θ)π0(θ)dθρ0Θ0f(x|θ)π0(θ)dθ+(1ρ0)Θf(x|θ)πa(θ)dθ
केविन मर्फी की तरह

XN(θ,1)H0:θ=0θ=0N(0,1)θθN(0,10)ρ0=1/2

π(m=0|x)=12πexp{x2/2}12πexp{x2/2}+R12πexp{(xθ)2/2}12π×10exp{θ2/20}dθ=exp{x2/2}exp{x2/2}+111exp{x2/22}

pH(H0)F0θF0py|H(y|H0)H0H0

HmθFmHm=(θ,Fm)θFm

ϱ0H0F0ϱ0=0π0(θ) is the prior distribution on the parameter θ of the model under H0.
Xi'an

so if the a hypothesis is a tuple of a proposed statistical model and a default parameter, how is the default parameter chosen?
Pinocchio

I do not understand what you mean by "default parameter": an hypothesis is either a model with all parameters fixed to known values (like θ=0 in the above example) or with some parameters unknown. In the later case, a Bayesian approach implies putting prior distributions on those unknowns.
Xi'an

4

Excellent question. I think your confusion may result from some of the basic differences between the "frequentist" and "Bayesian" perspectives. I have a lot of experience with the former and am new to the later so attempting a few simple observations might help me too. I edited your question to make a few distinctions clear - at least, as I understand them. I hope you don't mind! If I got something wrong, you could re-edit your question or add a comment on this response.

1) At the risk of sounding somewhat too elementary: A model is any statement that attempts an explanation of reality like "If I had pancakes for breakfast, it must be Tuesday." As such, a model is an hypothesis. A famous quote by George Box: "All models are wrong, some models are useful." For a model to be useful there must be some way to test it. Enter the concept of competing hypotheses and the answer to one of your questions. I would suggest that "...in the context of statistical inference," an hypothesis is any model that may be useful and can be tested mathematically. So hypothesis testing is a means of making a decision about whether a model is useful of not. In summary, an hypothesis is a model under consideration. It could be different parameter values of the same function or different functions. I think your lecture notes are showing that different outcomes (measurements) in the sample space would make different hypotheses (Is the intercept parameter zero? Do I need a cube in that polynomial? Maybe it's really exponential?), more or less likely.

2) Your Kahn video is an example of what Bayesian's call the "Frequentist" approach to hypothesis testing so it may have confused you when trying to apply it to your lecture notes which are Bayesian. I have been trying to come up with a simple distinction between application of the two approaches (which may be dangerous). I think I understand the philosophical distinction reasonably well. From what I have seen, the "Frequentist" assumes a random component to the data and tests how likely the observed data are given non-random parameters. The "Bayesian" assumes the data are fixed and determines the most likely value of random parameters. This difference leads to different testing methods.

In "Frequentist" hypothesis testing, a model that may be useful is one which explains some effect so it is compared with the "null hypothesis" - the model of no effect. The attempt is made to set up a useful model that is mutually exclusive to the model of no effect. The test is then on the probability of observing the data under the assumption of no effect. If that probability is found to be low, the null hypothesis is rejected and the alternative is all that's left. (Note that a purist would never "accept" the null hypothesis, only "fail to reject" one. It may sound like angels dancing on the head of a pin but the distinction is a fundamental philosophical one) Intro statistics usually starts with what may be the simplest example: "Two groups are different." The null hypothesis that they are not different is tested by calculating how likely it would be to observe differences as great or greater as measured by a random experiment given that they are not different. This is usually a t-test where the null hypothesis is that the difference of the means is zero. So the parameter is the mean at a fixed value of zero.

The Bayesian says, "Hold on a minute, we made those measurements and they are different, so how likely is that?" They calculate the probability for every value of the (now) random parameter and pick the one that is highest as the most likely. So in a sense, every possible value of the parameter is a separate model. But now they need a way to make a decision about whether the model with the highest probability is different enough to matter. That's why your lecture notes introduced the cost function. To make a good decision, some assumption of the consequences of making the wrong decision is needed.

3) "What does it mean to assign a hypothesis to each data sample?" I don't think they are. Be careful with what is meant by "sample point." I believe they are referring to a particular sample vector and want to know how likely each hypothesis is for all sample vectors in the sample space. Equations (14) and (15) show how to compare two hypotheses for a particular sample vector. So they are simplifying a general argument of comparing multiple hypotheses by showing how to compare only two.


0

Say you have data from a set of boxes. The data consists of Length (L), Width (W), Height (H), and Volume (V).

If we don't know much about boxes/geometry we might try the model:

V = a*L + b*W + c*H + e

This model has three parameters (a, b, c) that could be varied, plus an error/cost term (e) describing how well the hypothesis fits the data. Each combination of parameter values would be considered a different hypothesis. The "default" parameter value chosen is usually zero, which in the above example would correspond to "no relationship" between V and L, W, H.

लोग क्या करते हैं यह "डिफ़ॉल्ट" परिकल्पना का परीक्षण कर रहा है अगर ई कुछ कटऑफ मूल्य से परे है, आमतौर पर मॉडल फिट के आसपास त्रुटि के एक सामान्य वितरण मान एक पी-मूल्य की गणना करके। यदि उस परिकल्पना को खारिज कर दिया जाता है, तो वे एक, बी, सी मापदंडों के संयोजन को ढूंढते हैं जो संभावना को अधिकतम करता है और यह सबसे अधिक संभावना परिकल्पना है। यदि वे बायेसियन हैं तो वे पैरामीटर मानों के प्रत्येक सेट के लिए पूर्व की तुलना में गुणा करते हैं और उस समाधान को चुनते हैं जो पश्चगामी संभावना को अधिकतम करता है।

स्पष्ट रूप से यह रणनीति गैर-इष्टतम है कि मॉडल में संवेदनशीलता को माना जाता है, और याद आएगा कि सही परिकल्पना है:

V = L*W*H + e

संपादित करें: @Pinocchio

शायद कोई इस दावे से असहमत था कि परिकल्पना परीक्षण गैर-इष्टतम है जब एक / कुछ कार्यों को चुनने का कोई तर्कसंगत कारण नहीं है (या जैसा कि आप इसे डालते हैं: "परिकल्पना कक्षाएं") असीम रूप से कई संभव हैं। बेशक यह तुच्छ रूप से सच है, और "इष्टतम" का उपयोग सीमित अर्थों में किया जा सकता है "सबसे अच्छा फिट दिया गया लागत फ़ंक्शन और पसंद की आपूर्ति"। उस टिप्पणी ने इसे मेरे उत्तर में बदल दिया क्योंकि मुझे नापसंद था कि आपके वर्ग के नोटों में मॉडल विनिर्देश का मुद्दा कैसे चमक गया। अधिकांश वैज्ञानिक श्रमिकों के सामने यह मुख्य समस्या है, जिसके लिए afaik कोई एल्गोरिथ्म नहीं है।

इसके अलावा, मैं इतिहास को समझने तक पी-वैल्यूज़, परिकल्पना परीक्षण आदि को समझ नहीं पाया, इसलिए शायद इससे आपको भी मदद मिलेगी। लगातार परिकल्पना परीक्षण के आसपास भ्रम के कई स्रोत हैं (मैं बायेसियन संस्करण के इतिहास से परिचित नहीं हूं)।

नेमन-पियर्सन अर्थ में मूल रूप से "परिकल्पना परीक्षण" कहा जाता है, रोनाल्ड फिशर द्वारा विकसित "महत्व परीक्षण", और एक बीमार परिभाषित, कभी भी उचित रूप से उचित नहीं ठहराए गए "हाइब्रिड" इन दो रणनीतियों का व्यापक रूप से विज्ञान में उपयोग किया जाता है (जो हो सकता है कि आकस्मिक रूप से उपरोक्त शब्द या "शून्य परिकल्पना महत्व परीक्षण" का उपयोग करके संदर्भित किया जाए)। हालांकि मैं आधिकारिक रूप से विकिपीडिया पृष्ठ लेने की सलाह नहीं दूंगा, लेकिन इन मुद्दों पर चर्चा करने वाले कई स्रोत यहां मिल सकते हैं । कुछ मुख्य बिंदु:

  1. एक "डिफ़ॉल्ट" परिकल्पना का उपयोग मूल परिकल्पना परीक्षण प्रक्रिया का हिस्सा नहीं है, बल्कि उपयोगकर्ता को विचार के तहत मॉडल निर्धारित करने के लिए पूर्व ज्ञान का उपयोग करना चाहिए। मैंने इस मॉडल के समर्थकों द्वारा कभी भी स्पष्ट सिफारिश नहीं देखी है कि क्या करना है अगर हमारे पास तुलना करने के लिए दिए गए परिकल्पना के सेट को चुनने का कोई विशेष कारण नहीं है। यह अक्सर कहा जाता है कि यह दृष्टिकोण गुणवत्ता नियंत्रण के लिए उपयुक्त है, जब कुछ माप की तुलना करने के लिए ज्ञात सहिष्णुता होती है।

  2. फिशर के "महत्व परीक्षण" प्रतिमान के तहत कोई वैकल्पिक परिकल्पना नहीं है, केवल एक अशक्त परिकल्पना है, जिसे अस्वीकार्य माना जा सकता है यदि डेटा को नहीं दिया गया है। मेरे पढ़ने से, फिशर स्वयं डिफ़ॉल्ट अशक्त परिकल्पनाओं के उपयोग पर समान था। मैं उसे इस मामले पर स्पष्ट रूप से टिप्पणी करते हुए कभी नहीं पाया, हालांकि उसने निश्चित रूप से यह सिफारिश नहीं की थी कि यह एकमात्र नीरस परिकल्पना होनी चाहिए।

  3. डिफ़ॉल्ट अशक्त परिकल्पना का उपयोग कभी-कभी परिकल्पना परीक्षण के "दुरुपयोग" के रूप में माना जाता है, लेकिन यह उल्लिखित लोकप्रिय संकर विधि के लिए केंद्रीय है। तर्क यह जाता है कि यह अभ्यास अक्सर "बेकार प्रारंभिक" होता है:

    "शोधकर्ता एक सैद्धांतिक भविष्यवाणी करता है, आम तौर पर एक प्रभाव की दिशा ... जब वास्तव में डेटा पूर्वानुमानित दिशात्मक परिणाम दिखाते हैं, तो यह परिकल्पना की पुष्टि करता है। शोधकर्ता एक 'पुआल व्यक्ति' शून्य परिकल्पना का परीक्षण करता है कि वास्तव में प्रभाव क्या है। शून्य। यदि उत्तरार्द्ध .05 स्तर (या कुछ संस्करण) पर अस्वीकार नहीं किया जा सकता है, तो सिद्धांत की स्पष्ट पुष्टि का दावा नहीं किया जा सकता है ... इस प्रकार के परीक्षण में एक सामान्य त्रुटि वास्तव में प्राप्त होने वाले महत्व स्तर को भ्रमित करने के लिए है (के लिए) मूल सिद्धांत के लिए प्राप्त पुष्टिकरण स्तर के साथ पुआल-व्यक्ति नल) को अस्वीकार करना ... पुष्टिकरण की ताकत वास्तव में [एक शोधकर्ता की संख्यात्मक भविष्यवाणियों की तीक्ष्णता] पर निर्भर करती है, न कि एक पुआल-व्यक्ति अशक्त के लिए प्राप्त महत्व स्तर पर। "

    मनोविज्ञान में निरर्थक अवधारणा परीक्षण विवाद। डेविड एच क्रांतिज़। अमेरिकन स्टैटिस्टिकल एसोसिएशन का जरनल; दिसंबर 1999; 94, 448; 1372-1381

खान अकादमी वीडियो इस हाइब्रिड विधि का एक उदाहरण है, और उस उद्धरण में उल्लिखित त्रुटि करने के लिए दोषी है। उस वीडियो में उपलब्ध जानकारी से हम केवल यह निष्कर्ष निकाल सकते हैं कि इंजेक्शन वाले चूहे गैर-इंजेक्शन से भिन्न होते हैं, जबकि वीडियो का दावा है कि हम यह निष्कर्ष निकाल सकते हैं कि "दवा निश्चित रूप से कुछ प्रभाव डालती है"। थोड़ा सा प्रतिबिंब हमें इस बात पर विचार करने के लिए प्रेरित करेगा कि शायद परीक्षण किए गए चूहे गैर-इंजेक्शन से पुराने थे, आदि हमें अपने सिद्धांत के लिए साक्ष्य का दावा करने से पहले प्रशंसनीय वैकल्पिक स्पष्टीकरण पर शासन करने की आवश्यकता है। सिद्धांत की भविष्यवाणी जितनी कम विशिष्ट होगी , इसे पूरा करना उतना ही मुश्किल होगा।

2 संपादित करें:

शायद एक चिकित्सा निदान के अपने नोट्स से उदाहरण लेने से मदद मिलेगी। एक मरीज को "सामान्य" या "उच्च रक्तचाप से ग्रस्त संकट" कहा जा सकता है।

हमारे पास पूर्व सूचना है कि केवल 1% लोग उच्च रक्तचाप से ग्रस्त संकट में हैं। उच्च रक्तचाप से ग्रस्त लोगों में सिस्टोलिक रक्तचाप होता है जो औसत = 180 और एसडी = 10 के साथ एक सामान्य वितरण का अनुसरण करता है। इस बीच, सामान्य लोगों को माध्य = 120, एसडी = 10 के साथ एक सामान्य वितरण से रक्तचाप होता है। किसी व्यक्ति के सामान्य होने पर उसे शून्य करने की लागत, एक निदान को याद करने की लागत 1 है, और उपचार के कारण दुष्प्रभाव के कारण लागत 0.2 है, भले ही वे संकट में हों या नहीं। फिर निम्नलिखित आर कोड थ्रेशोल्ड (एटा) और संभावना अनुपात की गणना करता है। यदि हम जिस सीमा का इलाज करने की ठान लेते हैं उससे अधिक होने की संभावना अनुपात से कम है, यदि हम इससे कम नहीं हैं:

#Prior probabilities
P0=.99 #Prior probability patient is normal
P1=1-P0 #Prior probability patient is in crisis

#Hypotheses
H0<-dnorm(x=50:250, mean=120, sd=10) #H0: Patient is normal
H1<-dnorm(x=50:250, mean=180, sd=10) #H1: Patient in hypertensive crisis

#Costs
C00=0 #Decide normal when normal
C01=1 #Decide normal when in crisis
C10=.2 #Decide crisis when normal
C11=.2 #Decide crisis when in crisis

#Threshold
eta=P0*(C10-C00)/ P1*(C01-C11)

#Blood Pressure Measurements
y<-rnorm(3, 150, 20)

#Calculate Likelihood of Each Datapoint Given Each Hypothesis
L0vec=dnorm(x=y, mean=120, sd=10) #Vector of Likelihoods under H0
L1vec=dnorm(x=y, mean=180, sd=10) #Vector of Likelihoods under H1

#P(y|H) is the product of the likelihoods under each hypothesis
L0<-prod(L0vec)
L1<-prod(L1vec)

#L(y) is the ratio of the two likelihoods
LikRatio<-L1/L0


#Plot
plot(50:250, H0, type="l", col="Green", lwd=4, 
     xlab=" Systolic Blood Pressure", ylab="Probability Density Given Model",
     main=paste0("L=",signif(LikRatio,3)," eta=", signif(eta,3)))
lines(50:250, H1, col="Red", lwd=4)
abline(v=y)

#Decision
if(LikRatio>eta){
  print("L > eta  ---> Decision: Treat Patient")
}else{
  print("L < eta  ---> Do Not Treat Patient")
}

उपरोक्त परिदृश्य में दहलीज एटा = 15.84। यदि हम तीन रक्तचाप माप लेते हैं और 139.9237, 125.2278, 190.3765 प्राप्त करते हैं, तो संभावना अनुपात 27.6 एच 1 के पक्ष में है: उच्च रक्तचाप से ग्रस्त संकट में रोगी। चूंकि 27.6 उस दहलीज से अधिक है जिसका हम इलाज करना चाहते हैं। ग्राफ हरे रंग में सामान्य परिकल्पना और लाल रंग में उच्च रक्तचाप से बचाता है। ऊर्ध्वाधर काली रेखाएं अवलोकनों के मूल्यों को दर्शाती हैं।

यहाँ छवि विवरण दर्ज करें


क्या वह व्यक्ति जिसने इस मत को समझाया है? इस उत्तर के साथ गलत है? : एस
पिनोच्चियो

@Pinocchio मैंने उत्तर में कुछ इतिहास के साथ चीजों को स्पष्ट करने का प्रयास किया है, "परिकल्पना परीक्षण" इसके कारण स्पष्ट रूप से चर्चा करने के लिए एक कठिन विषय है। मुझे लगता है कि मैंने इस सवाल का जवाब दिया है कि शब्दों के मॉडल / परिकल्पना का उपयोग कैसे किया जाता है, लेकिन इसे समझें नहीं: 'प्रत्येक डेटा नमूने के लिए एक परिकल्पना निर्दिष्ट करने का क्या मतलब है?'
नाराज

मुझे समझ नहीं आ रहा है कि इस उत्तर को क्यों अस्वीकृत किया गया, और इसे और अधिक क्यों नहीं उकेरा गया। यह वास्तव में उत्कृष्ट है। यह सैद्धांतिक परिभाषाओं का थोड़ा अधिक उपयोग कर सकता है, लेकिन यह स्पष्ट रूप से सांख्यिकीविदों की तुलना में व्यापक दर्शकों की ओर उन्मुख है। GLM का उपयोग करने वाला पहला उदाहरण विशेष रूप से ज्ञानवर्धक था और पूरी तरह से मेरी (कई) अकादमिक रीडिंग के अनुरूप था। लब्बोलुआब यह है कि लगातार और बायेसियन परिकल्पना परीक्षण के बीच मुख्य अंतर एमएपी की गणना करने के लिए पूर्व का लेखांकन है (केवल एमएलई के बजाय)।
विशाल

मैं जोड़ सकता हूं कि जीएलएम के साथ पहले उदाहरण का एक चित्रमय प्रतिनिधित्व भयानक और बहुत ज्ञानवर्धक होगा, शायद एक तरह के लीवरेज प्लॉट का उपयोग करके ?
गाबोरस
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.