आंकड़ों में, मुझे लगता है चाहिए


18

मैं आँकड़ों का अध्ययन कर रहा हूँ और अक्सर सूत्रों से युक्त logहोता हूँ और मैं हमेशा उलझन में रहता हूँ अगर मुझे यह व्याख्या करनी चाहिए कि मानक अर्थ के रूप में log, अर्थात आधार 10, या यदि आँकड़ों में प्रतीक log को आमतौर पर प्राकृतिक लॉग माना जाता है ln

विशेष रूप से मैं एक उदाहरण के रूप में गुड-ट्यूरिंग फ्रिक्वेंसी अनुमान का अध्ययन कर रहा हूं , लेकिन मेरा प्रश्न सामान्य है।


2
"कई अनुप्रयोगों के लिए, संभावना फ़ंक्शन के प्राकृतिक लघुगणक , जिसे लॉग-लाइबिलिटी कहा जाता है, के साथ काम करना अधिक आसान है।" en.wikipedia.org/wiki/Likelihood_function#Log-likelihood आंकड़ों में हम अक्सर संभावना समारोह के साथ काम करते हैं, यह आमतौर पर lnमाना जाता है। हालाँकि, दोनों संबंधित हैं: log(x) = ln(x) / ln(10) = ln(x) / 2.303और ln -likelihood फ़ंक्शन log10 -likelihood फ़ंक्शन के समान बिंदु पर चरम पर पहुंचता है ।
जॉन_वेस्ट

5
कुछ विशेष अनुप्रयोग क्षेत्रों में, जब का उल्लेख किया जाता है, बेस 10 का इरादा होता है, लेकिन जैसा कि अक्सकल इंगित करता है, अन्यथा यह गणित में उपयोग किया जाने वाला सम्मेलन है - यह कि अनडॉर्नड लॉग का मतलब है प्राकृतिक लॉग। loglog
Glen_b -Reinstate मोनिका

2
जैसा कि @ जॉन_वेस्ट कहता है कि और एल जी ( एक्स ) स्केलिंग फैक्टर के समान हैं। इसलिए वे केवल वही हैं जो आप किसी अन्य इकाई में मापते हैं। ln(x)loga(x)

1
@Aksakal; आप जो कहते हैं वह कहता है कि इकाई महत्वपूर्ण है (मेरी टिप्पणी देखें), जिससे मैं सहमत हूं। मैंने स्पष्ट रूप से आधार को इंगित करने के लिए भी लिखा था । अधिकतम संभावना की तरह आँकड़ों में (कुछ) अनुप्रयोगों के लिए, यह स्केलिंग फैक्टर हालांकि बेमतलब है। स्केलिंग फैक्टर जोड़ने के बाद अधिकतम नहीं बदलेगा। ओपी के संदर्भ (अच्छा-ट्यूरिंग ...) में वे साजिश करना चाहते एल जी ( एन आर ) (या एल जी ( जेड आर ) ) बनाम एल जी ( आर )logalog(Nr)log(Zr)log(r)। इसका मतलब यह है कि इकाई भूखंड के दोनों अक्षों पर बदलती है इसलिए प्लॉट '' वक्र '' नहीं बदलता है।

1
जब तक आप एक कागज़ नहीं लिख रहे हैं, तब भी जब लॉग-लाइबिलिटी का उपयोग पैमाने (लॉगरिथम का आधार) आमतौर पर मायने रखता है। उदाहरण के लिए, लॉग संभावना अनुपात परीक्षण आँकड़े का उपयोग करता है , आपको महत्वपूर्ण मानों का उपयोग करने के लिए अन्य आधार से समायोजित करना होगा। यदि आप सॉफ़्टवेयर लिख रहे हैं, तो कागजों से लॉग लाइबिलिटी फ़ंक्शंस का उपयोग करते समय आधार को प्राप्त करना महत्वपूर्ण है। बस बहुत सारे मामले हैं जहां आधार यह बताना महत्वपूर्ण है कि यह कोई फर्क नहीं पड़ता। ln
अक्कल

जवाबों:


20

यह मान लेना सुरक्षित है कि स्पष्ट आधार लॉग के बिना = lnlog=ln आंकड़ों में , क्योंकि आधार 10 लॉग का उपयोग अक्सर आंकड़ों में नहीं किया जाता है। हालांकि, अन्य पोस्टर एक बिंदु लाते हैं कि या अन्य आधार कुछ अन्य क्षेत्रों में सामान्य हो सकते हैं, जहां आँकड़े लागू होते हैं, जैसे सूचना सिद्धांत। इसलिए, जब आप अन्य क्षेत्रों में पेपर पढ़ते हैं, तो यह कई बार भ्रमित हो जाता है।log10

विकिपीडिया का एन्ट्रापी पृष्ठ उपयोग को भ्रमित करने का एक अच्छा उदाहरण है । एक ही पृष्ठ में उनका मतलब आधार 2, और किसी भी आधार से है। आप संदर्भ के आधार पर यह पता लगा सकते हैं कि कौन सा अर्थ है, लेकिन इसके लिए पाठ को पढ़ने की आवश्यकता है। यह सामग्री प्रस्तुत करने का एक अच्छा तरीका नहीं है। इसकी तुलना लॉगरिदम पेज से करें जहाँ आधार को प्रत्येक सूत्र में स्पष्ट रूप से दिखाया गया है या ln का उपयोग किया गया है। मुझे व्यक्तिगत रूप से लगता है कि यह जाने का तरीका है: लॉग साइन का उपयोग करने पर हमेशा आधार दिखाएं । यह भी मानक के लिए आईएसओ अनुरूप होगा जो लॉग ऑन के साथ अनिर्दिष्ट आधार के उपयोग को परिभाषित नहीं करता है क्योंकि @ हेनरी ने बताया है।logelnloglog

अंत में, आईएसओ 31-11 मानक निर्धारित करता और एलजी आधार 2 और 10 लघुगणक के लिए संकेत। इन दिनों दोनों का उपयोग बहुत कम किया जाता है। मुझे याद है कि हमने lg का उपयोग किया थाlblglg हाई स्कूल में का था, लेकिन वह दूसरी दुनिया में दूसरी शताब्दी में था। मैंने इसे एक सांख्यिकीय संदर्भ में उपयोग करने के बाद से कभी नहीं देखा है। LaTeX में लिए टैग भी नहीं है ।lb


1
बेस 2 लघुगणक भी कुछ क्षेत्रों में काफी सामान्य हैं। Unadorned लॉग शायद ही कभी बेस 10 है, लेकिन यह हमेशा बेस ई नहीं है
नाभिकीय वांग

सहायक, लेकिन मुझे लगता है कि "शायद ही कभी" बहुत मजबूत है। ऐसे आधारभूत क्षेत्र हैं जिनमें लोग केवल 10 आधारों के आधार पर सबसे अधिक परिचित महसूस कर सकते हैं, या सबसे अच्छे से महसूस कर सकते हैं। ध्यान दें कि कई ग्राफ 10. की शक्तियों का उपयोग करते हुए लॉगरिदमिक तराजू दिखाते हैं। किसी को प्राकृतिक लॉगरिदम पसंद करते हैं, इस तरह के तराजू को डिकोड करने में कोई कठिनाई नहीं होती है, लेकिन अनुमान 10 आधार का है
निक कॉक्स

@NickCox, ओपी विशेष रूप से "सांख्यिकी" को एक क्षेत्र के रूप में बताता है, और मुझे अक्सर आंकड़ों में प्रयुक्त आधार 10 लघुगणक नहीं दिखता है।
अक्कल

ISO 31-11 लॉग ई के लिए निर्दिष्ट करता है , और एक अनियंत्रित लॉग को अपरिभाषित छोड़ देता हैlnlogelog
हेनरी

1
@ नाइकॉक्स, मैंने भाषा को नरम किया, आप एक उचित बिंदु लाते हैं
अक्षल

14

निर्भर करता है।

कुछ संदर्भों के बाहर, जैसे एक मान को डेसीबल में परिवर्तित करने के लिए, आधार 10 लघुगणक समीकरणों में बहुत दुर्लभ हैं। हालांकि, लॉग-स्केल प्लॉट अक्सर बेस -10 में होते हैं, हालांकि कुल्हाड़ियों पर लेबल से सत्यापित करना बहुत आसान होना चाहिए।

गणितीय संदर्भ में, अनडॉर्नड प्राकृतिक लॉग (यानी, लॉग या एलएन ) होने की संभावना है । दूसरी ओर, कंप्यूटर विज्ञान अक्सर बेस -2 लॉगरिथम ( लॉग 2 ) का उपयोग करता है , और वे हमेशा स्पष्ट रूप से इस तरह के रूप में चिह्नित नहीं होते हैं। अच्छी खबर यह है कि आप आधारों के बीच तुच्छ रूप से परिवर्तित कर सकते हैं और "गलत" आधार का उपयोग करके केवल एक स्थिर कारक द्वारा आपके उत्तर को बंद कर देंगे।loglogelnlog2

गेल 1995 में "आंसू बिना गुड ट्यूरिंग" कागज, पाठ में लघुगणक वास्तव में कर रहे (यह पृष्ठ 5 पर इतना कहते हैं), लेकिन आर / परिशिष्ट में एस + कोड का उपयोग करता समारोह, जो वास्तव में है लॉग इन करें या ln । जैसा कि @ हेनरी नीचे बताते हैं, इससे कोई व्यावहारिक अंतर नहीं पड़ता है।log10loglogeln

अगर मुझे अनुमान लगाने के लिए मजबूर किया गया, तो यहां कुछ अनुमान हैं:

  • यदि 2, , या 10 की शक्तियां भी मौजूद हैं, तो लॉग के पास आधार होने की संभावना है।e

  • यदि यह (या, आमतौर पर, पथरी को शामिल करता है) को एकीकृत करने से उत्पन्न होता है , तो यह एक प्राकृतिक लॉग होने की संभावना है।1/x

  • यदि यह बार-बार किसी चीज़ को आधे में विभाजित करता है (जैसा कि द्विआधारी खोज में), तो यह होने की संभावना है । आम तौर पर, कुछ को एन लगभग एन लॉग एन द्वारा विभाजित किया जा सकता है ।log2nlogn

  • सूचना-सिद्धांत संबंधी गणना आमतौर पर उपयोग करती है , विशेष रूप से आधुनिक कार्यों में। हालाँकि, आप यह सुनिश्चित करने के लिए इकाइयों की जाँच कर सकते हैं: बिट्सलॉग 2 , नेट्सएलएन , और बैन्सलॉगlog2bitslog2natslnbanslog10

  • उस बिंदु को खोजना जहां कोई फ़ंक्शन गिरता है या बढ़ जाता है 1e or 11eप्रारंभिक मूल्य का , (37% और 63%, क्रमशः) एक प्राकृतिक लॉग का सुझाव देता है।


5
+1। एक छोटी सी टिप यह है कि अगर घातीय पास में पाए जाते हैं तो प्राकृतिक लघुगणक 10 या 2. की शक्तियों के साथ अधिक संभावना है और इसके विपरीत है। यदि आधार का उपयोग किया जा रहा है तो अस्पष्ट बनी हुई है, लेखकों के उदाहरण गणनाओं को पुन: पेश करने का प्रयास करें। exp()
निक कॉक्स

2
blog(Nr)=a+blog(r)Nr=Arb

2
base10

3

अपने प्रश्न का उत्तर देने के लिए: नहीं, आप लघुगणक के लिए एक सामान्य निश्चित अंकन नहीं मान सकते हैं।

log10

lnएक्स (लगभग) स्वाभाविक रूप से प्राकृतिक लघुगणक को दर्शाता है लॉगएक्स (लैटिन: लॉगरिथमस नेचुरलिस), या बेस में लॉगरिथम । संकेतनलॉगएक्स should be the adopted notation for the natural logarithm, and it is so in mathematics. However, it often represents the "most natural" depending on the field: I learned it as the base-10 logarithm (log10) at school, and it is often used this way in engineering (for instance in the definition of decibels)

Quite often, if you are not concerned with the meaning of physical units (like decibels @Matt Krause), nor interested in specific rates of change (in biostatistics, the log-ratio for fold-change often denotes the base-2 logarithm log2), it is likely that the natural logarithm (loge) is used.

For instance, in power or Box-Cox transforms (for variance stabilization), the natural logarithm appears as a limit when the exponent tends to 0.

Going back to your initial motivation, the Good-Turing Frequency Estimation, it is interesting to read The Population Frequencies of Species and the Estimation of Population Parameters, I. J. Good, Biometrika, 1953. Here, he used logarithmms in different contexts: variable transformation for variance stabilisation (mentioning Bartlett and Anscombe), sum of harmonic series, entropy. We see that he generally uses log as the natural logarithm, and once in a while in the paper specifies loge or log10, when the context requires it. For variance stabilization, or basic entropy estimation, a factor on the logarithm does not change much the result, as the outcome allows a linear change.


0

In the Akaike Information Criterion the base is e, and ln(L^) of the maximum likelihood L^ is being compared additively to the number of parameters k:

AIC=2(kln(L)).

Thus it seems that if you use any other base for the logarithm in the AIC, you may end up drawing the wrong conclusion and selecting the wrong model.

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.