ठीक है, आप एक नमूना है, तो पैरामीट वितरण से पैरामीटर्स के साथ m > 0 और α > 0 (जहां m निचला बाउंड पैरामीटर है और α शेप पैरामीटर है) उस नमूने की लॉग-लाइबिलिटी है:X1,...,Xnm>0α>0mα
nlog(α)+nαlog(m)−(α+1)∑i=1nlog(Xi)
यह में एक नीरस रूप से बढ़ रहा है , इसलिए अधिकतम मान सबसे बड़ा मान है जो अवलोकन किए गए डेटा के अनुरूप है। चूंकि पैरामीटर एम पेरेटो वितरण के लिए समर्थन की निचली सीमा को परिभाषित करता है, इसलिए इष्टतम हैmm
m^=miniXi
जो पर निर्भर नहीं करता है । अगला, साधारण कैलकुलस ट्रिक्स का उपयोग करके, MLE for α को संतुष्ट करना होगाαα
nα+nlog(m^)−∑i=1nlog(Xi)=0
कुछ सरल बीजगणित हमें का MLE बताता हैα
α^=n∑ni=1log(Xi/m^)
कई महत्वपूर्ण इंद्रियों में (जैसे कि इसमें इष्टतम विषम दक्षता, यह क्रैमर-राव लोअर बाउंड को प्राप्त करता है), यह एक पारेटो वितरण के लिए डेटा को फिट करने का सबसे अच्छा तरीका है। गणना किसी दिए गए डेटा सेट के लिए MLE नीचे आर कोड, X
।
pareto.MLE <- function(X)
{
n <- length(X)
m <- min(X)
a <- n/sum(log(X)-log(m))
return( c(m,a) )
}
# example.
library(VGAM)
set.seed(1)
z = rpareto(1000, 1, 5)
pareto.MLE(z)
[1] 1.000014 5.065213
संपादित करें: @cardinal द्वारा टीका के आधार पर और मैं नीचे, हम भी है कि नोट कर सकते हैं α का नमूना माध्य का पारस्परिक है लॉग ( एक्स मैं / मीटर ) की है, जो भी हो एक घातीय वितरण के लिए। इसलिए, अगर हमारे पास ऐसे सॉफ़्टवेयर हैं, जो एक घातीय वितरण (जो अधिक संभावना है, क्योंकि यह कई सांख्यिकीय समस्याओं में उत्पन्न होता है) में फिट हो सकता है, तो इस तरह से सेट किए गए डेटा को बदलकर और इसे फिटिंग करके एक परेतो वितरण को पूरा किया जा सकता है। तब्दील पैमाने पर एक घातीय वितरण के लिए। α^log(Xi/m^)