'की बात हो रही 99 % एक hypercube में अंकों की ' थोड़ा भ्रामक के बाद से एक hypercube असीम कई बिंदुओं होता है। इसके बजाय वॉल्यूम के बारे में बात करते हैं।
एक हाइपरक्यूब का आयतन इसकी लम्बाई का गुणनफल है। 50 आयामी इकाई hypercube के लिए हम प्राप्त कुल मात्रा = 1 × 1 × ⋯ × 150 बार= 150= 1।
अब हमें हाइपरक्यूब की सीमाओं को छोड़ दें और ' इंटीरियर ' देखें (मैंने इसे उद्धरण चिह्नों में रखा है क्योंकि गणितीय शब्द का आंतरिक अर्थ बहुत अलग है)। हम केवल अंक x = ( x)1, एक्स2, ... , एक्स50) जो 0.05 < x 1 < 0.95 को संतुष्ट करते हैं
0.05 < x1< 0.95 तथा 0.05 < x2< 0.95 तथा ... तथा 0.05 < x50< 0.95।
इस 'आंतरिक'का आयतन क्या है? खैर, 'इंटीरियर' फिर से एक हाइपरक्यूब है, और प्रत्येक पक्ष की लंबाई0.9 (= 0.95 - 0.05 ... यह दो और तीन आयामों में यह कल्पना करने में मदद करता है)। तो मात्रा हैआंतरिक मात्रा = 0.9 × 0.9 × ⋯ × 0.950 बार= 0.950≈ 0.005।
यह मान लें कि 'सीमा'की मात्रा(बिना इकाई हाइपरक्यूब के रूप में परिभाषित की गई है) आंतरिक ' 1 है)1 - 0.950≈ 0.995।
इससे पता चलता है कि 50-आयामी हाइपरक्यूब की मात्रा का 99.5 % इसकी ' सीमा ' पर केंद्रित है ।
अनुवर्ती: इग्नाटियस ने एक दिलचस्प सवाल उठाया कि यह कैसे संभावना से जुड़ा है। यहाँ एक उदाहरण है।
मान लें कि आप एक (मशीन लर्निंग) मॉडल के साथ आए हैं जो 50 इनपुट मापदंडों के आधार पर आवास की कीमतों की भविष्यवाणी करता है। सभी 50 इनपुट पैरामीटर स्वतंत्र और समान रूप से 0 और 1 बीच वितरित किए जाते हैं ।
यदि हम कहते हैं कि यदि कोई भी इनपुट पैरामीटर चरम नहीं है, तो आपका मॉडल बहुत अच्छा काम करता है : जब तक कि हर इनपुट पैरामीटर 0.05 और 0.95 बीच रहता है , आपका मॉडल आवास की कीमत की पूरी तरह से भविष्यवाणी करता है। लेकिन अगर एक या एक से अधिक इनपुट पैरामीटर चरम हैं ( 0.05 से छोटा या 0.95 से बड़ा ), तो आपके मॉडल की भविष्यवाणियां बहुत भयानक हैं।
किसी भी दिए गए इनपुट पैरामीटर केवल 10 % की संभावना के साथ चरम है । तो स्पष्ट रूप से यह एक अच्छा मॉडल है, है ना? नहीं! संभावना है कि कम से कम 50 मापदंडों में से एक चरम है - 1 - 0.950≈ 0.995।
तो 99.5 % मामलों में, आपके मॉडल की भविष्यवाणी भयानक है।
अंगूठे का नियम: उच्च आयामों में, चरम अवलोकन नियम हैं और अपवाद नहीं।