मशीन लर्निंग में आयाम-होपिंग

10

मशीन लर्निंग में समस्या को रोकने का आयाम क्या है (कन्वेन्शनल न्यूरल नेटवर्क और इमेज रिकॉग्निशन में)? मैं इसके बारे में गुगली कर चुका हूं, लेकिन मुझे जो कुछ भी मिला है वह भौतिक आकार विकृति के भौतिकी पर जानकारी है। यह मेरे लिए अधिक उपयोगी होगा यदि कोई इसे मशीन सीखने से संबंधित उदाहरण के साथ समझाए। किसी को भी इस के साथ मेरी मदद कर सकते हैं या मुझे लगता है कि संसाधनों की ओर इशारा कर सकते हैं?

machine-learning image-recognition

— sdream
स्रोत

7

DataScience.SE में आपका स्वागत है! मैंने इस समस्या के बारे में कभी नहीं सुना था इसलिए मैंने इसे देखा। यह इस प्रस्तुति की तीसरी स्लाइड पर समझाया गया है ज्योफ हिंटन:

अधिक चीजें जो वस्तुओं को पहचानना कठिन बनाती हैं

• दृष्टिकोण में बदलाव से उन छवियों में परिवर्तन होता है जो मानक शिक्षण विधियों का सामना नहीं कर सकते हैं।

- इनपुट आयामों के बीच सूचना हॉप्स (यानी पिक्सेल)

• एक मेडिकल डेटाबेस की कल्पना करें, जिसमें एक मरीज की उम्र कभी-कभी इनपुट आयाम तक पहुंच जाती है जो सामान्य रूप से वजन के लिए कोड होता है!

- मशीन लर्निंग को लागू करने के लिए हम सबसे पहले इस आयाम को रोकना चाहते हैं।

दूसरे शब्दों में, यह वैचारिक विशेषताओं के बारे में है जो एक इनपुट फीचर आयाम से दूसरे स्थान पर माइग्रेट या हॉपिंग करते हैं जबकि एक ही चीज का प्रतिनिधित्व करते हैं। कोई व्यक्ति इनपुट के आयाम को कैप्चर करना या निकालना पसंद कर सकता है, जबकि वह इनपुट डायमेंशन पर इनकोडेड है।

— Emre
स्रोत

मैं समझता हूं कि कंप्यूटर विज़न में कोई व्यक्ति छवि के स्थानों के लिए आक्रामक होना चाहता है, लेकिन मुझे उम्र का उदाहरण नहीं मिलता है।

— मार्टिन थोमा

मुझे लगता है कि इसका मतलब है कि उम्र और वजन निर्भर हैं, लेकिन मुझे यकीन नहीं है; यह मेरी प्रस्तुति नहीं है! या शायद उनका मतलब था कि वे सचमुच गलत कॉलम का उपयोग करते हैं और हम इसका पता लगाना चाहते हैं।

— एम्रे

@sdream मैंने केवल एक टिप्पणी की; एमरे ने जवाब दिया। (लेकिन आपको शायद इसे अभी भी स्वीकार करना चाहिए)। CNNs के साथ मुद्दा यह है कि न केवल एक विशेषता तब बदलती है जब कोई वस्तु कहीं और होती है, लेकिन एक पूर्ण पैटर्न एक अलग इनपुट पर होता है।

— मार्टिन थोमा

@ इमर, मुझे आपके उत्तर से जो मिल रहा है, वह यह है कि कोई बात नहीं, जिस दिशा से एक विशिष्ट संपत्ति इनपुट है, वह विशेषता जिसके कारण यह विशिष्ट संपत्ति इस संपत्ति के इनपुट आयाम के लिए अपरिवर्तनीय होनी चाहिए। धन्यवाद! :)। अभी भी कुछ और विशिष्ट उत्तरों की प्रतीक्षा कर रहे हैं, अन्यथा आपके उत्तर को उत्तर के रूप में चिह्नित करेंगे।

— 27'16

3

उम्र का उदाहरण एक डेटासेट को हाइलाइट करने के लिए माना जाता है, जिसमें आयाम-हॉपिंग नहीं है। उम्र और वजन उदाहरणों के बीच यादृच्छिक रूप से "हॉप" या स्वैप मूल्यों को नहीं करते हैं - वे विनिमेय नहीं हैं और उदाहरण दिखा रहा है कि यह कितना अजीब होगा (और यह रेखीय प्रतिगमन जैसे सरल कार्यों को कितना मुश्किल बना देगा)। छवियों में पिक्सेल मान (और कई सिग्नल प्रोसेसिंग कार्यों में समान डेटा) समस्या की प्रकृति के कारण इंटरचेंज या आसानी से चलते हैं।

— नील स्लेटर

7

जहां तक मैं समझता हूं कि समस्या निम्नलिखित है: छवि मान्यता में आपके नेटवर्क के इनपुट पिक्सेल (ग्रेस्केल या केवल 1 और 0 काले और सफेद के लिए) हो सकते हैं। यदि आप चाहते हैं, उदाहरण के लिए हस्तलिखित संख्याओं को पहचानें तो केवल ऐसे मूल्यों के साथ काम करना बहुत मुश्किल है क्योंकि आप कभी नहीं जानते हैं कि वास्तव में संख्या (यानी काले मूल्य) कहां होगी।

क्या पिक्सेल 140 काला या 142 काला है? दोनों ही मामलों में यह अच्छी तरह से एक तीन हो सकता है। उम्र / वजन के उदाहरण में ये इनपुट अच्छी तरह से परिभाषित हैं। फीचर 2 वजन है। फीचर 3 उम्र है। ये "आयाम" आपके डेटासेट में "हॉप" नहीं होना चाहिए।

तो: आपके चित्र प्रशिक्षण में "थ्रीज़" या "कार" या "हाउस" को चित्र में अपने स्थान से स्वतंत्र माना जाना है, अर्थात पिक्सेल मान, अर्थात फीचर / इनपुट वेक्टर, अर्थात आयामों को स्पष्ट रूप से परिभाषित करने के विपरीत। इनपुट जैसे कि रोगी डेटा।

आप इसे छवि मान्यता में कैसे हल करते हैं? आप अतिरिक्त ट्रिक्स का उपयोग करते हैं, उदाहरण के लिए कन्वेंशन।

— डी। एगर्ट
स्रोत

2

मैंने पिछले जवाबों को पढ़ा, और नील स्लेटर ने एमरे की पोस्ट पर टिप्पणी की, नीचे फिर से कॉपी की गई, कील को हिट करता है। "डायमेंशन होपिंग" एक शब्द है जिसे डॉ। हिंटन ने व्यू पॉइंट के संदर्भ में मशीन लर्निंग अग्रणी प्रसिद्धि के लिए बनाया है। डॉ। हिंटन को उद्धृत करने के लिए "तो, आमतौर पर इनपुट आयामों के अनुरूप होते हैं पिक्सल, और, अगर कोई वस्तु दुनिया में चलती है और आप इसे देखने के लिए अपनी आंखों को स्थानांतरित नहीं करते हैं, तो वस्तु के बारे में जानकारी विभिन्न पिक्सल पर होगी।" आयु और वजन इनपुट आयाम हैं जो आसानी से भ्रमित नहीं होते हैं। डॉ। हिंटन ने इस बात का स्पष्ट रूप से उपयोग नहीं किया है कि रोगियों की आयु और वजन की स्थिति के आयाम की संभावना नहीं है, इसका मतलब है कि हम निश्चित रूप से इन प्रकार के डेटा के बीच किसी भी तरह की गलत स्थिति को ठीक कर पाएंगे और यह ध्यान रखना मुश्किल होगा कि अधिकांश वयस्क 100 वर्ष से अधिक उम्र के नहीं हैं। 100 पाउंड से अधिक)। आयाम हॉपिंग की संभावित समस्या, जिसे डॉ। हिंटन संबोधित कर रहे थे, पिक्सल को विस्थापित किया जा सकता है क्योंकि हमारे पास एक अलग दृष्टिकोण है (जैसे वस्तु स्थानांतरित हो सकती थी या हम इसे एक अलग कोण से देख रहे हैं)। रैखिक तंत्रिका नेटवर्क इसका पता लगाने में सक्षम नहीं होंगे, जबकि डिजाइन द्वारा दृढ़ तंत्रिका नेटवर्क।

"उम्र का उदाहरण एक डेटासेट को हाइलाइट करने के लिए माना जाता है जिसमें आयाम-होपिंग नहीं है। उम्र और वजन" हॉप "या उदाहरणों के बीच बेतरतीब ढंग से स्वैप नहीं करते हैं - वे विनिमेय नहीं हैं और उदाहरण दिखा रहा है कि कितना अजीब होगा (और कैसे) मुश्किल यह सरल कार्यों जैसे कि लीनियर रिग्रेशन) को बनायेगा। छवियों में पिक्सेल मान (और कई सिग्नल प्रोसेसिंग कार्यों में समान डेटा) समस्या की प्रकृति के कारण इंटरचेंज या आसानी से चलते हैं। - नील स्लेटर 29 मई '16 '18:01 पर। "

— उत्साहित
स्रोत

1

मशीन लर्निंग के लिए न्यूरल नेटवर्क्स पर हिंटन के पाठ्यक्रम से स्पष्टीकरण सीधे तौर पर ....

"आयाम hopping तब होता है जब कोई व्यक्ति कुछ इनपुट के आयामों में निहित जानकारी ले सकता है, और लक्ष्य को नहीं बदलते हुए आयामों के बीच इसे स्थानांतरित कर सकता है । विहित उदाहरण ले रहा है। एक हस्तलिखित अंक की छवि और इसे छवि के भीतर अनुवाद करना। जिन आयामों में "स्याही" होती है, वे अब अलग हैं (उन्हें अन्य आयामों में स्थानांतरित कर दिया गया है), हालांकि हम जिस लेबल पर अंक देते हैं, वह नहीं बदला है। ध्यान दें कि यह कुछ नहीं है। यह संपूर्ण डेटासेट में लगातार होता है, अर्थात हमारे पास दो हस्तलिखित अंकों वाला एक डेटासेट हो सकता है, जहां एक दूसरे का अनुवादित संस्करण है, हालांकि यह फिर भी अंकों के संबंधित लेबल को नहीं बदलता है। "

— yottabytt
स्रोत

0

होपिंग केवल छवि के कुछ हिस्सों या आयामों (ज्यादातर) और कुछ समय के भीतर अन्य मंद (अलग ग्रहणशील क्षेत्र) में बढ़ने वाले मुद्दों के बारे में है, लेकिन आउटपुट समान रहता है।

इस मुद्दे को इंवेरियन या इक्विवेरियन से निपटा जाता है और ऐसा लगता है कि वजन और उम्र का उदाहरण राज्य के लिए आसान तरीका है। मान लीजिए अगर हमें इस वजन और उम्र के बढ़ने के बारे में पता है तो हम आसानी से एल्गो में बदलाव करेंगे और सही परिणाम प्राप्त करेंगे। लेकिन जैसे डेटा / सूचना hopping, छवि hopping भी होता है, अगर हम एक '4' पर विचार किया और '4' अलग-अलग वर्गों होने के लिए बाईं ओर कई पिक्सेल स्थानांतरित कर दिया, जिसमें अलग-अलग लक्ष्य हैं।

ट्रांसलेशन इंवेरियनस या बेहतर इक्विवेरियन थ्रॉघ फिल्टर के साथ यह मूवमेंट या हॉपिंग ज्यादा मुद्दा नहीं है, हालांकि यह जटिलता को बढ़ाता है और जानकारी को फेंकने की कीमत पर, जैसे स्थान।

Pls मुझे पता है अगर आप और अधिक स्पष्टता की जरूरत है मैं करने की कोशिश करेंगे।

— प्रादि केएल
स्रोत