मैं एक निश्चित प्रकार के दोहराया माप डेटा के सबसे उपयुक्त विशेषता वितरण को खोजने की कोशिश कर रहा हूं।
अनिवार्य रूप से, भूविज्ञान की मेरी शाखा में, हम अक्सर नमूनों (चट्टान के टुकड़े) से खनिजों के रेडियोमेट्रिक डेटिंग का उपयोग करते हैं ताकि यह पता लगाया जा सके कि कितनी देर पहले एक घटना हुई (चट्टान एक दहलीज तापमान से नीचे ठंडा हो गई)। आमतौर पर, प्रत्येक नमूने से कई (3-10) माप किए जाएंगे। फिर, माध्य और मानक विचलन लिया जाता है। यह भूविज्ञान है, इसलिए स्थिति के आधार पर नमूनों की शीतलन उम्र से वर्ष तक हो सकती है।
हालांकि, मेरे पास यह विश्वास करने का कारण है कि माप गौसियन नहीं हैं: 'आउटलेयर', या तो मनमाने ढंग से घोषित किए गए हैं, या कुछ मानदंडों के माध्यम से जैसे कि पीयरस की कसौटी [रॉस, 2003] या डिक्सन के क्यू-टेस्ट [डीन और डिक्सन, 1951] , काफी हैं। आम (कहते हैं, 30 में 1) और ये लगभग हमेशा पुराने होते हैं, यह दर्शाता है कि ये मापें सही ढंग से तिरछी हैं। खनिज अशुद्धियों के साथ ऐसा करने के कई कारण हैं।
इसलिए, अगर मैं एक बेहतर वितरण पा सकता हूं, जिसमें वसा पूंछ और तिरछा शामिल है, तो मुझे लगता है कि हम अधिक सार्थक स्थान और पैमाने के मापदंडों का निर्माण कर सकते हैं, और आउटलेर्स को इतनी जल्दी से दूर नहीं करना है। Ie यदि यह दिखाया जा सकता है कि इस प्रकार के माप तार्किक, या लॉग-लाप्लासियन हैं, या जो भी हो, तो अधिकतम संभावना के अधिक उपयुक्त उपायों का उपयोग और तुलना में किया जा सकता है , जो गैर-मजबूत हैं और शायद मामले में पक्षपाती हैं। व्यवस्थित रूप से दाएं तिरछा डेटा।
मैं सोच रहा हूं कि ऐसा करने का सबसे अच्छा तरीका क्या है। अब तक, मेरे पास लगभग 600 नमूनों के साथ एक डेटाबेस है, और 2-10 (या तो) प्रति नमूना माप दोहराता है। मैंने माध्य या माध्यिका द्वारा प्रत्येक को विभाजित करके नमूनों को सामान्य करने की कोशिश की है, और फिर सामान्यीकृत डेटा के हिस्टोग्राम को देख रहा हूं। यह उचित परिणाम उत्पन्न करता है, और यह इंगित करता है कि डेटा वर्णात्मक रूप से लॉग-लाप्लासियन की तरह है:
हालांकि, मुझे यकीन नहीं है कि यह इस बारे में जाने का उपयुक्त तरीका है, या अगर वहाँ कि मैं इस बात से अनजान हूं कि मेरे परिणामों को पूर्वाग्रहित किया जा सकता है तो वे इस तरह दिखते हैं। क्या किसी को इस तरह की चीज़ के साथ अनुभव है, और सर्वोत्तम प्रथाओं के बारे में पता है?