जवाबों:
वीसी आयाम बाइनरी क्लासिफायरियर की क्षमता के लिए एक अनुमान है। यदि आप अंक का एक सेट पा सकते हैं , ताकि इसे क्लासिफायर द्वारा बिखर दिया जा सके (अर्थात सभी संभव लेबलिंग को सही ढंग से वर्गीकृत करें ) और आप अंक के किसी भी सेट को नहीं ढूंढ सकते हैं जो बिखर सकता है (अर्थात किसी भी सेट के लिए की अंक वहाँ कम से कम एक लेबलिंग क्रम ताकि वर्गीकारक सभी बिंदुओं को सही ढंग से अलग नहीं कर सकते हैं), तो कुलपति आयाम है ।2 n n + 1 n + 1 n
अपने मामले में, पहले दो बिंदुओं पर विचार करें और , जैसे कि । फिर संभव लेबलिंग हैंx 2 x 1 < x 2 2 2 = 4
सभी लेबलिंग क्लासिफायर माध्यम से प्राप्त किया जा सकता है मापदंडों इस तरह सेट करकेएक < ख ∈ आर
क्रमशः। (वास्तव में, को माना जा सकता है, लेकिन यह एक सेट को खोजने के लिए पर्याप्त है जो बिखर सकता है।)
अब, तीन मनमाना (!) अंक , , और मान लें कि , तो आप लेबलिंग (1,0,1) प्राप्त नहीं कर सकते। जैसा कि ऊपर 3 के मामले में, लेबल : 1 और : 0 का अर्थ । जिसका अर्थ है > b और इसलिए के लेबल को 0. होना चाहिए। इस प्रकार, वर्गीकरणकर्ता तीन बिंदुओं के किसी भी सेट को चकनाचूर नहीं कर सकता है और इसलिए VC आयाम 2 है।
-
शायद यह अधिक उपयोगी क्लासिफायरियर के साथ स्पष्ट हो जाता है। चलो हाइपरप्लेन (2 डी में लाइनें) पर विचार करें।
तीन बिंदुओं का एक सेट खोजना आसान है, जिन्हें सही तरीके से वर्गीकृत किया जा सकता है, चाहे वे कैसे भी हों:
सभी संभावित लेबलिंग के लिए हम एक हाइपरप्लेन पा सकते हैं जो उन्हें पूरी तरह से अलग करता है।
हालाँकि, हमें 4 बिंदुओं का कोई सेट नहीं मिल सकता है ताकि हम सभी संभावित लेबलिंग को सही ढंग से वर्गीकृत कर सकें । एक औपचारिक प्रमाण के बजाय, मैं एक दृश्य तर्क प्रस्तुत करने की कोशिश करता हूं:
अभी के लिए मान लें, कि 4 अंक 4 पक्षों के साथ एक आकृति बनाते हैं। फिर एक हाइपरप्लेन ढूंढना असंभव है जो एक ही लेबल के साथ विपरीत कोनों को लेबल करने पर बिंदुओं को सही ढंग से अलग कर सकता है:
यदि वे 4 पक्षों के साथ एक आकृति नहीं बनाते हैं, तो दो "सीमा मामले" हैं: "बाहरी" बिंदुओं को या तो एक त्रिकोण बनाना चाहिए या सभी एक सीधी रेखा बनाते हैं। त्रिकोण के मामले में, यह देखना आसान है कि लेबलिंग जहां "इनर" बिंदु (या दो कोनों के बीच का बिंदु) को लेबल किया जाता है, दूसरों से अलग नहीं किया जा सकता है:
एक पंक्ति खंड के मामले में, एक ही विचार लागू होता है। यदि अंतिम बिंदुओं को अन्य बिंदुओं में से एक से अलग तरीके से लेबल किया जाता है, तो उन्हें हाइपरप्लेन द्वारा अलग नहीं किया जा सकता है।
चूंकि हमने 2 डी में 4 बिंदुओं के सभी संभावित फॉर्मूलेशन को कवर किया है, इसलिए हम यह निष्कर्ष निकाल सकते हैं कि कोई 4 बिंदु नहीं हैं जो बिखर सकते हैं। इसलिए, कुलपति आयाम 3 होना चाहिए।
किसी क्लासिफायर का वीसी आयाम निम्नलिखित तरीके से निर्धारित किया जाता है:
VC = 1
found = False
while True:
for point_distribution in all possible point distributions of VC+1 points:
allcorrect = True
for classdist in every way the classes could be assigned to the classes:
adjust classifier
if classifier can't classify everything correct:
allcorrect = False
break
if allcorrect:
VC += 1
continue
break
इसलिए तीन बिंदुओं को रखने का केवल एक ही तरीका है कि इस बिंदु-प्लेसमेंट के बीच सभी संभावित वर्ग वितरण को सही तरीके से वर्गीकृत किया जा सके।
यदि आप तीन बिंदुओं को एक पंक्ति में नहीं रखते हैं, तो धारणा सही हो जाती है। लेकिन धारणा का कोई तरीका नहीं है कि आप 4 बिंदुओं के सभी संभावित वर्ग वितरणों को वर्गीकृत करें, चाहे आप बिंदुओं को कैसे रखें
आपकी सुविधाएँ । हर वर्गीकरण में कम से कम 1 आयाम है।
VC-Dimension 2: यह सभी चार स्थितियों को सही ढंग से वर्गीकृत कर सकता है।
VC-Dimension 3: नहीं, यह काम नहीं करता है। कक्षाओं की कल्पना करें true
और false
जैसा आदेश दिया जा रहा है True False True
। आपका क्लासिफायर उस से नहीं निपट सकता। इसलिए इसमें 2 का VC-Dimension है।