पूर्ण विचलन के योग को कम करना (


15

मैं एक डेटा सेट और पैरामीटर लगाना चाहते मीटर ऐसी है कि वह राशि को कम करता है कश्मीर Σ मैं = 1 | m - x i | अर्थात्x1,x2,,xkm

i=1k|mxi|.

minmi=1k|mxi|.

2
क्या आप थोड़ा विस्तार कर सकते हैं?
ज्यॉफ ऑक्सबेरी

उस मामले में, समाधान नहीं तो अधिकतम और न्यूनतम मूल्यों के बीच मध्यबिंदु होगा?
पॉल

@Paul माध्यिका राशि को कम कर सकती है, लेकिन जानना चाहती है कि यह विश्लेषणात्मक रूप से कैसे किया जा सकता है, विशेष रूप से
l1-न्यूनतमकरण

@kadu यह सही है, माध्य समाधान है। औसत दर्जे का कम्प्यूटेशनल तुच्छ है; बस क्रमबद्ध करें और फिर मध्य मान लें।
डेविड केचेसन

जवाबों:


22

संभवत: आप इस बात का प्रमाण मांगते हैं कि मंझला समस्या हल करता है? खैर, यह इस तरह किया जा सकता है:

उद्देश्य टुकड़ा रेखीय रैखिक है और इसलिए अंक को छोड़कर भिन्न है । उद्देश्य का ढलान कुछ बिंदु ? खैर, ढलान mappings के ढलानों का योग हैऔर यह या तो ( ) या ( ) है। इसलिए, ढलान इंगित करता है कि कितने के से छोटे हैं । आप देखते हैं कि ढलान शून्य है यदि समान रूप से कई छोटे हैं और तुलना में बड़ा है ( की संख्या के लिए भी )। यदि की विषम संख्या हैm=ximxim|mxj|+1m>xj1m<xjximximxixi'तो ढलान है एस "middlest" एक और के लिए छोड़ दिया इसके बारे में सही है, इसलिए middlest एक न्यूनतम है।1+1


16

कई आयामों के लिए इस समस्या के सामान्यीकरण को ज्यामितीय औसत समस्या कहा जाता है । जैसा कि डेविड बताते हैं, मंझला 1-डी मामले का समाधान है; वहां, आप मध्य-खोज चयन एल्गोरिदम का उपयोग कर सकते हैं , जो छंटाई की तुलना में अधिक कुशल हैं। S जबकि चयन एल्गोरिदम ; सॉर्ट केवल अधिक कुशल हैं यदि कई चयन आवश्यक हैं, जिस स्थिति में आप एक बार (महंगे) सॉर्ट कर सकते हैं, और फिर बार-बार सॉर्ट सूची से चयन कर सकते हैं।O(nlogn)O(n)

ज्यामितीय मध्ययुगीन समस्या की कड़ी में बहुआयामी मामलों के समाधान का उल्लेख है।


6

माध्यिका के संदर्भ में स्पष्ट समाधान सही है, लेकिन मेयन्यू की एक टिप्पणी के जवाब में, यहां एक और दृष्टिकोण है।

यह सर्वविदित है कि आम तौर पर न्यूनतम समस्याएँ, और विशेष रूप से पोस्ट की गई समस्या, रैखिक प्रोग्रामिंग द्वारा हल की जा सकती है।1

निम्नलिखित एलपी फॉर्मूलेशन अज्ञात साथ दिए गए अभ्यास के लिए करेंगे :zi,m

minzi
ऐसा:
zimxi
zixim

स्पष्ट रूप से को बराबर होना चाहिएन्यूनतम पर, इसलिए यह त्रुटियों के पूर्ण मूल्यों के योग को न्यूनतम करने के लिए कहता है।zi|xim|


2

यह दिखाने के लिए ओवर-पावर्ड उत्तल विश्लेषण तरीका सिर्फ सबग्रेडिएंट्स हैं। वास्तव में यह ढलानों से जुड़े कुछ अन्य उत्तरों में प्रयुक्त तर्क के बराबर है।

अनुकूलन समस्या उत्तल है (क्योंकि उद्देश्य उत्तल है और कोई अड़चन नहीं है।) इसके अलावा, उप-भाग _-है|mxi|

-1 अगरm<xi

[-1,1] यदिm=xi

+1 अगर ।m>xi

के बाद से एक उत्तल समारोह तभी यह subgradient शून्य होता है, तो कम से कम है, और उत्तल कार्यों की राशि का subgradient (सेट) subgradients का योग है, तो आप उस 0 subgradient में है मिलता है यदि और केवल यदि मंझला है की ।mx1,xk


0

हम मूल रूप से उसके बाद हैं:

argminmi=1N|mxi|

एक को ध्यान देना चाहिए कि (अधिक कठोर होने के कारण यह गैर चिकनी नॉर्मल फंक्शन का सब-ग्रेड है)। इसलिए, पैदावार से अधिक राशि प्राप्त करने के लिए । यह तभी शून्य के बराबर होता है जब धनात्मक वस्तुओं की संख्या ऋणात्मक की संख्या के बराबर होती है जो तब होती है जब ।एल1Σ एन मैं = 1 संकेत(मीटर-एक्समैं)मीटर=मंझला{x1,एक्स2,,xएन}d|x|dx=sign(x)L1
i=1Nsign(mxi)
m=median{x1,x2,,xN}

एक को ध्यान देना चाहिए कि medianएक असतत समूह को विशिष्ट रूप से परिभाषित नहीं किया गया है।
इसके अलावा, यह जरूरी नहीं है कि समूह के भीतर एक आइटम हो।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.