क्या विमान पर एक नमूने के मध्य के लिए एक स्वीकृत परिभाषा है, या उच्चतर रिक्त स्थान हैं?


33

यदि ऐसा है तो क्या? यदि नहीं, तो क्यों नहीं?

लाइन पर एक नमूना के लिए, माध्य कुल निरपेक्ष विचलन को कम करता है। यह परिभाषा को R2 तक विस्तारित करना स्वाभाविक होगा, आदि, लेकिन मैंने इसे कभी नहीं देखा है। लेकिन फिर, मैं लंबे समय से बाएं क्षेत्र में रहा हूं।


जवाबों:


19

मुझे यकीन नहीं है कि एक बहुभिन्नरूपी मंझला के लिए एक स्वीकृत परिभाषा है। जिस से मैं परिचित हूं, वह ओजा की औसत बिंदु है , जो अंकों के सबसेट पर गठित सरलता के संस्करणों के योग को कम करता है। (तकनीकी परिभाषा के लिए लिंक देखें।)

अपडेट: ऊपर दी गई ओजा परिभाषा के लिए संदर्भित साइट में एक अच्छा पेपर भी है जिसमें बहुभिन्नरूपी मेड की परिभाषाएँ हैं:


1
अच्छा संदर्भ: धन्यवाद। यह व्यापक रूप से यहां बताई गई सभी चीजों को शामिल करता है।
whuber

उसी वेबसाइट में html में एक nive ओवरव्यू भी है: cgm.cs.mcgill.ca/~athens/Geometric-Estimators/intro.html
आदित्य

15

जैसा कि @Ars ने कहा कि कोई स्वीकृत परिभाषा नहीं है (और यह एक अच्छी बात है)। वहाँ के तरीके के सामान्य विकल्प परिवार हैं, जो मैथिल्स पर , मुझे लगता है कि सबसे महत्वपूर्ण हैं:Rd

  • सामान्य मात्रात्मक प्रक्रिया देंअनुभवजन्य माप (=में टिप्पणियों का अनुपात) हो। फिर,के साथ Borel सेट का एक अच्छा चुना हुआ सबसेटऔरएक वास्तविक मूल्यवान उपाय है, आप अनुभवजन्य मात्रात्मक फ़ंक्शन को परिभाषित कर सकते हैं:Pn(A)AARdλ

    Un(t)=inf(λ(A):Pn(A)tAA)

    मान लीजिए कि आप एक पा सकते हैं जो आपको न्यूनतम प्रदान करता है। फिर सेट (या सेट का एक तत्व) आपको देता है जब काफी छोटा हो जाता है। माध्यिका की परिभाषा और का उपयोग करते समय पुनर्प्राप्त की जाती है । Ars उत्तर उस फ्रेमवर्क में आता है, जो मुझे लगता है ... tukey का आधा स्थान स्थान का उपयोग करके प्राप्त किया जा सकता है और (with , )।AtA1/2ϵA1/2+ϵϵA=(],x]xR)λ(],x])=xA(a)=(Hx=(tRd:a,tx)λ(Hx)=xxRaRd

  • परिवर्तनशील परिभाषा और एम-अनुमान यहां विचार यह है किमेंएक यादृच्छिक चरके क्‍वांटाइलAlphaको एक वैरिएबलसमानता के माध्यम से परिभाषित किया जा सकता है।αQαYR

    • सबसे सामान्य परिभाषा क्वांटल रिग्रेशन फंक्शन (पिनबॉल लॉस के रूप में भी जानी जाती है, इसका अनुमान क्यों?) । केस देता हैऔर आप उस का उपयोग कर उच्च आयाम करने के लिए सामान्य कर सकते हैं दूरी के रूप में में किया @Srikant जवाब । यह सैद्धांतिक मंझला है, लेकिन यदि आप अनुभवजन्य अपेक्षा (माध्य) द्वारा अपेक्षा को प्रतिस्थापित करते हैं तो आपको अनुभवजन्य मंझला देता है।ραQα=arginfxRE[ρα(Yx)]α=1/2ρ1/2(y)=|y|l1

    • लेकिन कोलशिन्स्की ने लीजेंड्रे- फ़ेंशेल ट्रांसफ़ॉर्म का उपयोग करने का प्रस्ताव किया है: जहाँ के लिए । वह उसके लिए बहुत सारे गहरे कारण देता है (कागज देखें;))। उच्च आयामों के लिए इसे सामान्य बनाने के लिए एक सदिशियल साथ काम करने की आवश्यकता होती है और को बदलने की आवश्यकता होती है लेकिन आप ।Qα=Argsups(sαf(s))f(s)=12E[|sY||Y|+s]sRαsαs,αα=(1/2,,1/2)

  • आंशिक आदेश आपजैसे ही आंशिक ऑर्डर (समतुल्यता वर्गों के साथ) बना सकते हैं, आपमें क्वांटाइल्स की परिभाषा को सामान्यकर सकते हैं।Rd

जाहिर है कि विभिन्न योगों के बीच सेतु हैं। वे सभी स्पष्ट नहीं हैं ...


अच्छा जवाब, रॉबिन!
आर्स

12

उच्च आयामों के लिए माध्य की अवधारणा को सामान्य बनाने के अलग-अलग तरीके हैं। एक अभी तक उल्लेख नहीं किया गया है, लेकिन जो बहुत पहले प्रस्तावित किया गया था, एक उत्तल पतवार का निर्माण करना है, इसे छीलना है, और जब तक आप यह कर सकते हैं, तब तक पुनरावृति करें: अंतिम पतवार में जो बचा है वह उन सभी बिंदुओं का एक सेट है जो सभी उम्मीदवारों के लिए हैं " माध्यिकाओं। "

"हेड-बैंगिंग" एक और अधिक हालिया प्रयास (सी। 1980) है जो 2 डी पॉइंट क्लाउड के लिए एक मजबूत केंद्र का निर्माण करता है। (लिंक यूएस नेशनल कैंसर इंस्टीट्यूट में उपलब्ध प्रलेखन और सॉफ्टवेयर के लिए है।)

मुख्य कारण क्यों कई विशिष्ट सामान्यीकरण हैं और कोई भी स्पष्ट समाधान नहीं है कि आर 1 का आदेश दिया जा सकता है लेकिन आर 2, आर 3, ... नहीं हो सकता है।


कोई भी उपाय जो सामान्य माध्यिका के साथ मेल खाता है जब R1 तक सीमित है, एक उम्मीदवार सामान्यीकरण है। उनमें से बहुत कुछ होना चाहिए।
phv3773

phv:> कोई 'औसतन (उच्च आयामों में) के सामान्यीकरण के लिए माध्य के कुछ रोचक गुणों के बारे में पूछ सकता है। यह उम्मीदवारों की संख्या को
गंभीर रूप से

@Whuber:> तब आदेश की धारणा को असमान वितरण के लिए R ^ n के लिए सामान्यीकृत किया जा सकता है (नीचे मेरा उत्तर देखें)।
user603

@kwak: क्या आप थोड़ा विस्तृत कर सकते हैं? किसी स्थान के आदेश की सामान्य गणितीय परिभाषा किसी भी प्रकार की संभाव्यता वितरण से स्वतंत्र है, इसलिए आपको स्पष्ट रूप से कुछ अतिरिक्त मान्यताओं को ध्यान में रखना चाहिए।
whuber

1
@Whuber:> आप कहते हैं: "R1 का आदेश दिया जा सकता है लेकिन R2, R3, ... नहीं हो सकता"। R2, R, R3 को Rn से R तक मैप करके कई तरह से ऑर्डर किया जा सकता है। ऐसा ही एक रास्ता है तुकी गहराई। इसमें कई महत्वपूर्ण गुण हैं (कुछ विस्तार, गैर पैरामीट्रिक, इनवेरियन, ... की मजबूती) लेकिन ये केवल असमान वितरण के मामले के लिए हैं। यदि आप अधिक विवरण चाहते हैं तो मुझे बताएं।
user603


6

Tukey हाफस्पेस माध्य को DEEPLOC का उपयोग करके> 2 आयामों तक बढ़ाया जा सकता है, Struyf और Rousseeuw के कारण एक एल्गोरिथ्म; देखने के लिए यहाँ जानकारी के लिए।

एल्गोरिथ्म का उपयोग सबसे बड़ी गहराई के बिंदु को कुशलतापूर्वक करने के लिए किया जाता है; भोली विधियाँ जो इसे ठीक से निर्धारित करने का प्रयास करती हैं, वे आमतौर पर (आयाम का अभिशाप) "जहां आयाम के अभिशाप" की गणना करती हैं, जहां अंतरिक्ष के आयामों की संख्या के साथ एक सांख्यिकीय वृद्धि की गणना करने के लिए आवश्यक रनटाइम होता है।



0

मुझे नहीं पता कि ऐसी कोई परिभाषा मौजूद है या नहीं, लेकिन मैं कोशिश करूंगा और माध्यिका की मानक परिभाषा को बढ़ाऊंगा । मैं निम्नलिखित संकेतन का उपयोग करूंगा:R2

X , : दो आयामों के साथ जुड़े यादृच्छिक चर।Y

mx , : संबंधित ।my

f(x,y) : हमारे यादृच्छिक चर के लिए संयुक्त पीडीएफ

माध्यिका की परिभाषा को तक विस्तारित करने के लिए , हम निम्नलिखित को कम करने के लिए और चुनते हैं :R2mxmy

E(|(x,y)(mx,my)|

अब समस्या यह है कि हमें इसके लिए एक परिभाषा की आवश्यकता है:

|(x,y)(mx,my)|

ऊपर एक अर्थ में एक दूरी मीट्रिक है और कई संभावित उम्मीदवार परिभाषाएं संभव हैं।

यूसीलडन मेट्रिक

|(x,y)(mx,my)|=(xmx)2+(ymy)2

यूक्लिडियन मीट्रिक के तहत माध्यिका की गणना करने के लिए संयुक्त घनत्व संबंध में उपरोक्त की अपेक्षा की गणना की आवश्यकता होगी ।f(x,y)

टेक्सीक मेट्रिक

|(x,y)(mx,my)|=|xmx|+|ymy|

टेक्सी मीट्रिक के मामले में मंझला कम्प्यूटिंग की औसत कंप्यूटिंग शामिल है और अलग रूप में मीट्रिक में वियोज्य है और ।XYxy


श्रीकांत:> नहीं। परिभाषा में एकतरफा माध्यिका की दो महत्वपूर्ण विशेषताएं हैं। ए) डेटा के मोनोटोन परिवर्तन के लिए अनैच्छिक, बी) आउटलेर्स द्वारा संदूषण के लिए मजबूत। आपके द्वारा प्रस्तावित कोई भी सीमा इनमें से नहीं है। तुकी गहराई में ये गुण हैं।
user603

@kwak आप जो कहते हैं वह समझ में आता है।

@ उत्तर:> ऊपर गैरी कैंपबेल द्वारा उद्धृत आर एंड एस पेपर की जांच करें;)। सर्वश्रेष्ठ,
18:60 पर user603

@kwak कुछ और सोचने पर, टेक्सी मैट्रिक में आपके द्वारा बताई गई विशेषताएं हैं जो मूल रूप से अनियंत्रित मध्यस्थों को कम करती हैं। नहीं?

2
@ श्रीकांत:> phv के सवालों का कोई गलत जवाब नहीं है क्योंकि 'अच्छे जवाब' भी नहीं हैं; अनुसंधान का यह क्षेत्र अभी भी विकास के अधीन है। मैं केवल यह बताना चाहता था कि यह अभी भी एक खुली समस्या क्यों है।
20:60 बजे user603
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.