छवि रिज़ॉल्यूशन के आधार पर सुविधाओं की संख्या की गणना कैसे करें?


18

बस तंत्रिका Netowrks के एंड्रयू एनजी के गैर रेखीय हाइपोथीसिस कवर, और हम निर्धारित करने के लिए एक बहु विकल्प प्रश्न था सुविधाओं की संख्या संकल्प की एक छवि के लिए 100x100 का grescale तीव्रता।

और उत्तर 50 मिलियन, x5107

हालांकि, पहले 50 x 50 पिक्सेल, ग्रे स्केल छवि के लिए। सुविधाओं की संख्या 50x50 (2500) है

यह 10,000 के बजाय x क्यों होगा ?510710,000

हालाँकि वे सभी द्विघात शब्दों ( xixj ) को सुविधाओं के रूप में कहते हैं

मान लीजिए आप 100 × 100 पिक्सेल छवियों (ग्रेस्केल, आरजीबी नहीं) से कारों को पहचानना सीख रहे हैं। फीचर्स को पिक्सल इंटेंसिटी वैल्यू होने दें। यदि आप सुविधाओं के रूप में सभी द्विघात ( ) शब्दों के साथ लॉजिस्टिक रिग्रेशन को प्रशिक्षित करते हैं , तो आपके पास कितनी सुविधाएँ होंगी?xixj

और 100x100 के बारे में पहले की स्लाइड में, कि द्विघात विशेषताएं ( x ) = 3 मिलियन विशेषताएं हैं, लेकिन मैं अभी भी कनेक्शन पर उंगली नहीं डाल सकता हूं।x jxixj

जवाबों:


16

शायद एक सरल मामला चीजों को स्पष्ट कर देगा। कहते हैं कि हम 100x100 के बजाय पिक्सेल का 1x2 नमूना चुनते हैं।

छवि से नमूना पिक्सेल

+----+----+
| x1 | x2 |
+----+----+

कल्पना कीजिए कि जब हमारे प्रशिक्षण सेट की साजिश रच रहे थे, तो हमने देखा कि इसे रैखिक मॉडल के साथ आसानी से अलग नहीं किया जा सकता है, इसलिए हम डेटा को बेहतर ढंग से फिट करने के लिए बहुपदीय शब्दों को जोड़ना चुनते हैं।

मान लीजिए, हम पिक्सेल के सभी तीव्रता और सभी संभावित गुणकों को शामिल करके अपने बहुपदों का निर्माण करने का निर्णय लेते हैं।

चूँकि हमारा मैट्रिक्स छोटा है, आइए इनकी गणना करें:

एक्स1, एक्स2, एक्स12, एक्स22, एक्स1×एक्स2, एक्स2×एक्स1

सुविधाओं के उपरोक्त अनुक्रम की व्याख्या करते हुए देख सकते हैं कि एक पैटर्न है। पहले दो पद, समूह 1, केवल पिक्सेल तीव्रता से युक्त विशेषताएं हैं। उसके बाद के दो शब्द, समूह 2, उनकी तीव्रता के वर्ग से मिलकर बनी हुई विशेषताएँ हैं। अंतिम दो शब्द, समूह 3, युग्मक (दो) पिक्सेल तीव्रता के सभी संयोजनों के उत्पाद हैं।

समूह 1: एक्स1, एक्स2

समूह 2: एक्स12, एक्स22

समूह 3: एक्स1×एक्स2, एक्स2×एक्स1

लेकिन रुकिए, एक समस्या है। यदि आप अनुक्रम में समूह 3 शब्द को देखते हैं ( और x 2 × x 1 ) तो आप देखेंगे कि वे समान हैं। हमारे आवास का उदाहरण याद रखें। एक ही घर के लिए दो सुविधाओं X1 = वर्ग फुटेज, और x2 = वर्ग फुटेज होने की कल्पना करो ... इसका कोई मतलब नहीं है! ठीक है, इसलिए हमें डुप्लिकेट सुविधा से छुटकारा पाने की आवश्यकता है, जो मनमाने ढंग से x 2 × x 1 कहता है । अब हम समूह तीन की सूची को फिर से लिख सकते हैं:एक्स1×एक्स2एक्स2×एक्स1एक्स2×एक्स1

समूह 3: एक्स1×एक्स2

हम सभी तीन समूहों में सुविधाओं की गणना करते हैं और 5 प्राप्त करते हैं।

लेकिन यह एक खिलौना उदाहरण है। चलो सुविधाओं की संख्या की गणना के लिए एक सामान्य सूत्र प्राप्त करते हैं। आइए सुविधाओं के हमारे मूल समूहों को शुरुआती बिंदु के रूप में उपयोग करें।

sizegroup1+sizegroup2+sizegroup3=m×n+m×n+m×n=3×m×n

आह! लेकिन हमें समूह 3 में डुप्लिकेट उत्पाद से छुटकारा पाना था।

इसलिए समूह 3 के लिए सुविधाओं को ठीक से गिनने के लिए हमें मैट्रिक्स में सभी अद्वितीय जोड़ीदार उत्पादों को गिनने के तरीके की आवश्यकता होगी। जो कि द्विपद गुणांक के साथ किया जा सकता है, जो आकार n के बराबर या बड़े समूह से आकार k के सभी संभव अद्वितीय उपसमूह को गिनने के लिए एक विधि है। तो समूह 3 में सुविधाओं को ठीक से गिनने के लिए गणना करें ।C(m×n,2)

तो हमारा सामान्य सूत्र होगा:

m×n+m×n+C(m×n,2)=2m×n+C(m×n,2)

हमारे खिलौना उदाहरण में सुविधाओं की संख्या की गणना करने के लिए इसका उपयोग करें:

2×1×2+C(1×2,2)=4+1=5

बस!


2
काश यह व्याख्या व्याख्यान में दी गई होती!
इयान वॉकर-स्पैम्बर

मैं सोच रहा हूँ कि बिना समझाए हम इसे किस तरह से जानना चाहते हैं
मोहम्मद नौरेल्डिन

6

यदि आप सभी रैखिक और द्विघात सुविधाओं का उपयोग कर रहे हैं, तो कुल संख्या माना जाता है:

100*100 + 100*100 + C(100*100,2) = 50015000
10000   + 10000   + 49995000     = 50015000
xi         xi^2       xixj

1
क्या आप इसे थोड़ा और समझा सकते हैं? क्या आप xi + xi ^ 2 + xixi कह रहे हैं? क्या xi = 100, और xj = 100 है? क्यों xi और xi ^ 2 दोनों 100 * 100 हैं? C (100 * 100,2) क्या है?
इकोनोविसी

4
(1) पूरी तरह से 100 * 100 पिक्सेल हैं, यदि आप सुविधाओं के रूप में तीव्रता का उपयोग कर रहे हैं, तो कुल मिलाकर 100 * 100 सुविधाएँ होंगी, यह xi है; और (ii) आप एक शक्ति के रूप में शक्ति घनत्व का उपयोग भी कर सकते हैं, यह (xi, xi) या xi है। ^ 2, अभी भी कुल मिलाकर 100 * 100; अंत में (iii) यदि आप दो पिक्सेल के बीच संबंध का उपयोग करते हैं, तो कुल मिलाकर पिक्सेल के C जोड़े होंगे, वह (xi, xj), C गणित में संयोजन है ( mathworld.wolfram.com/Combination.html )
lennon1010

धन्यवाद, एक अंतिम प्रश्न इस संदर्भ में xi = xi ^ 2 क्यों है?
इकोनोविसी

मैंने एकल पिक्सेल का प्रतिनिधित्व करने के लिए xi का उपयोग किया है, और xi ^ 2 का अर्थ है एक ही पिक्सेल (xi, xi) के जोड़े का उपयोग करें। एकल पिक्सेल की संख्या समान पिक्सेल के जोड़े के समान है। इसका पिक्सेल की तीव्रता से कोई लेना-देना नहीं है। गलतफहमी के लिए खेद है।
lennon310

वही सवाल, कुछ साल बाद। क्या हमें संभव तीव्रता मूल्यों (0 से 255 तक) को भी ध्यान में नहीं रखना चाहिए?
अल्बूस_सी

0

के विचार (एक्स2) / 2 द्विघात सुविधाओं को प्राप्त करने के लिए भी काम कर सकता है। इसलिए यदि n = 2500 है, तो हम जानते हैं कि सूत्र में x (i) = 2500 और प्रतिस्थापन x 50 मिलियन देगा


2
मुझे मिला 25002/23 मिलियन, नहीं 50दस लाख।
whuber

0

जब आप 100 * 100 पिक्सेल छवि रखते हैं तो @ 50 मिलियन आता है। जहाँ वर्ग (100 * 100) = 100000000 (10 मिलियन) और वर्ग (100 * 100) / 2 = 5 मिलियन। उम्मीद है कि यह जवाब


यह एक टिप्पणी की प्रतिक्रिया है और इस प्रश्न का उत्तर नहीं है।
माइकल आर। चेर्निक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.