आइए डेटा को प्लॉट करके शुरू करें और उस पर एक नज़र डालें। यह बहुत सीमित मात्रा में डेटा है, इसलिए यह कुछ मान्यताओं के साथ कुछ हद तक तदर्थ होने जा रहा है ।
rotten <- c(0,1,1,0,0,0,1,1,1,1,0,0,0)
rotten <- as.factor(rotten)
mass <- c(139.08,
91.48,
74.23,
129.8,
169.22,
123.43,
104.93,
103.27,
169.01,
83.29,
157.57,
117.72,
128.63)
diam <- c(17.28,
6.57,
7.12,
16.52,
14.58,
6.99,
6.63,
6.75,
15.38,
7.45,
13.06,
6.61,
7.19)
plot(mass,diam,col=rotten,lwd=2)
title("Fruits")
तो यह डेटा है, लाल डॉट्स सड़े हुए फलों का प्रतिनिधित्व करते हैं:
आप यह मानने में सही हैं कि दो प्रकार के फल लगते हैं। मेरे द्वारा की जाने वाली धारणाएँ निम्नलिखित हैं:
- व्यास फलों को दो समूहों में विभाजित करता है
- 10 से अधिक व्यास वाले फल एक समूह में होते हैं, दूसरे छोटे समूह में।
- बड़े फल समूह में केवल एक सड़ा हुआ फल होता है। मान लेते हैं कि यदि कोई फल बड़े समूह में है, तो सड़े हुए होने से वजन प्रभावित नहीं होता है। यह आवश्यक है, क्योंकि हमारे पास उस समूह में केवल एक डेटा बिंदु है।
- यदि फल एक छोटा फल है, तो सड़ा हुआ होने से द्रव्यमान प्रभावित होता है।
- मान लेते हैं कि चर डायम और द्रव्यमान आम तौर पर वितरित किए जाते हैं।
क्योंकि यह दिया जाता है कि व्यास का योग 64.2 सेमी है, तो यह सबसे अधिक संभावना है कि दो फल बड़े हैं और चार छोटे हैं। अब वजन के लिए 3 मामले हैं। 2, 3 या 4 छोटे फल सड़े हुए हैं, (सड़ा हुआ एक बड़ा फल धारणा से द्रव्यमान को प्रभावित नहीं करता है )। तो अब आप इन मूल्यों की गणना करके अपने द्रव्यमान पर सीमा प्राप्त कर सकते हैं।
हम अनुभव कर सकते हैं कि छोटे फलों के सड़ने की संभावना के बारे में अनुमान लगाया जा सकता है। हम सड़े हुए फलों की संख्या के आधार पर, द्रव्यमान के हमारे अनुमानों के वजन की संभावनाओं का उपयोग करते हैं:
samps <- 100000
stored_vals <- matrix(0,samps,2)
for(i in 1:samps){
numF <- 0 # Number of small rotten
numR <- 0 # Total number of rotten
# Pick 4 small fruits
for(j in 1:4){
if(runif(1) < (5/8)){ # Empirical proportion of small rotten
numF <- numF + 1
numR <- numR + 1
}
}
# Pick 2 large fruits
for(j in 1:2){
if(runif(1) < 1/5){# Empirical proportion of large rotten
numR <- numR + 1
}
}
stored_vals[i,] <- c(numF,numR)
}
# Pick out samples that had 4 rotten
fourRotten <- stored_vals[stored_vals[,2] == 4,1]
hist(fourRotten)
table(fourRotten)
# Proportions
props <- table(fourRotten)/length(fourRotten)
massBig <- mean(mass[diam>10])
massSmRot <- mean(mass[diam<10 & rotten == 1])
massSmOk <- mean(mass[diam<10 & rotten == 0])
weights <- 2*massBig + c(2*massSmOk+2*massSmRot,1*massSmOk+3*massSmRot,4*massSmRot)
Est_Mass <- sum(props*weights)
हमें 691.5183 जी का अंतिम अनुमान देते हुए । मुझे लगता है कि आपको किसी निष्कर्ष पर पहुंचने के लिए मेरे द्वारा की गई अधिकांश धारणाएं बनानी होंगी, लेकिन मुझे लगता है कि हो सकता है कि यह संभव हो। इसके अलावा मैं सड़े हुए छोटे फलों की संख्या की संभावना पाने के लिए अनुभवजन्य रूप से नमूना लेता हूं, जो कि सिर्फ आलस्य है और इसे "विश्लेषणात्मक" किया जा सकता है।