मैट्रिक्स में पैटर्न को पहचानने के लिए तंत्रिका नेटवर्क का उपयोग करना


10

मैं एक तंत्रिका नेटवर्क विकसित करने की कोशिश कर रहा हूं जो सीएडी मॉडल (यानी स्लॉट्स, बॉस, होल, पॉकेट, स्टेप्स) में डिजाइन सुविधाओं की पहचान कर सकता है।

इनपुट डेटा जिसे मैं नेटवर्क के लिए उपयोग करने का इरादा रखता हूं, वह है चिंतित मैट्रिक्स (जहां सीएडी मॉडल में n चेहरे की संख्या है)। मैट्रिक्स में शीर्ष दाएं त्रिकोण में एक '1' दो चेहरों के बीच एक उत्तल संबंध का प्रतिनिधित्व करता है और नीचे बाएं त्रिकोण में एक '1' अवतल संबंध का प्रतिनिधित्व करता है। दोनों स्थितियों में एक शून्य का मतलब है कि चेहरे आसन्न नहीं हैं। नीचे दी गई छवि ऐसे मैट्रिक्स का एक उदाहरण देती है। यहाँ छवि विवरण दर्ज करें

आइए कहते हैं कि मैं अधिकतम मॉडल का आकार 20 चेहरों पर सेट करता हूं और नेटवर्क से इनपुट को स्थिर आकार देने के लिए उससे छोटे किसी भी चीज के लिए पैडिंग लगाता हूं।

मैं 5 अलग-अलग डिज़ाइन विशेषताओं को पहचानने में सक्षम होना चाहता हूँ और इसलिए इसमें 5 आउटपुट न्यूरॉन्स होंगे - [स्लॉट, पॉकेट, होल, बॉस, स्टेप]

क्या मैं यह कहना सही होगा कि यह एक प्रकार की 'पैटर्न मान्यता' समस्या है? उदाहरण के लिए, यदि मैं कई प्रशिक्षण मॉडल के साथ नेटवर्क की आपूर्ति करता हूं - लेबल के साथ जो कि मॉडल में मौजूद डिज़ाइन विशेषता का वर्णन करता है, तो क्या नेटवर्क मैट्रिक्स में प्रतिनिधित्व किए गए विशिष्ट आसन्न पैटर्न को पहचानना सीखेगा जो कुछ डिज़ाइन सुविधाओं से संबंधित हैं?

मैं मशीन लर्निंग में एक पूर्ण शुरुआत हूं और मैं इस बात पर ध्यान देने की कोशिश कर रहा हूं कि यह दृष्टिकोण काम करेगा या नहीं - यदि समस्या को समझने के लिए किसी और जानकारी की आवश्यकता है तो टिप्पणी छोड़ दें। किसी भी इनपुट या मदद की सराहना की जाएगी, धन्यवाद।


1
यह वास्तव में दिलचस्प लग रहा है। लेकिन आप किस त्रिकोण की बात कर रहे हैं? क्या आप इसे स्पष्टता के लिए आकर्षित कर सकते हैं?
फेलिसिटी

जवाबों:


1

क्या मैं यह कहना सही होगा कि यह एक प्रकार की 'पैटर्न मान्यता' समस्या है?

तकनीकी रूप से, हाँ। व्यवहार में: नहीं।

मुझे लगता है कि आप "पैटर्न मान्यता" शब्द की व्याख्या थोड़ा सा शाब्दिक रूप से कर सकते हैं। भले ही विकिपीडिया पैटर्न मान्यता को "मशीन लर्निंग की एक शाखा के रूप में परिभाषित करता है जो डेटा में पैटर्न और नियमितता की मान्यता पर केंद्रित है", यह उन समस्याओं को हल करने के बारे में नहीं है जो तार्किक तर्क द्वारा "आसानी से" कटौती कर सकते हैं।

जैसे आप कहें कि

मैट्रिक्स में शीर्ष दाएं त्रिकोण में एक '1' दो चेहरों के बीच एक उत्तल संबंध को दर्शाता है और नीचे बाएं त्रिकोण में एक '1' अवतल संबंध को दर्शाता है।

यह हमेशा सच है । एक ठेठ मशीन सीखने की स्थिति में, आप (आमतौर पर) यह पूर्व ज्ञान नहीं होगा। कम से कम इस हद तक नहीं कि वह "हाथ से हल" करने के लिए ट्रैक्टेबल हो।

पैटर्न मान्यता पारंपरिक रूप से समस्याओं को हल करने के लिए एक सांख्यिकीय दृष्टिकोण है जब वे पारंपरिक तार्किक तर्क और सरल प्रतिगमन मॉडल के साथ विश्लेषण करने के लिए बहुत जटिल हो जाते हैं। विकिपीडिया भी (एक स्रोत के साथ) बताता है कि पैटर्न मान्यता "कुछ मामलों में जिसे मशीन सीखने का पर्याय माना जाता है"।

यह कहा जा रहा है: आप इस समस्या पर पैटर्न मान्यता का उपयोग कर सकते हैं। हालांकि, यह इस मामले में ओवरकिल जैसा लगता है। आपकी समस्या, जहाँ तक मैं समझ सकता हूँ, एक वास्तविक "विश्लेषणात्मक" समाधान है। वह यह है: आप तर्क से, हर समय 100% सही परिणाम प्राप्त कर सकते हैं। मशीन लर्निंग एल्गोरिदम, सिद्धांत रूप में, यह भी कर सकता है, और उस स्थिति में, और एमएल की इस शाखा को मेटा मॉडलिंग [1] के रूप में जाना जाता है।

उदाहरण के लिए, यदि मैं कई प्रशिक्षण मॉडल के साथ नेटवर्क की आपूर्ति करता हूं - लेबल के साथ जो कि मॉडल में मौजूद डिज़ाइन विशेषता का वर्णन करता है, तो क्या नेटवर्क मैट्रिक्स में प्रतिनिधित्व किए गए विशिष्ट आसन्न पैटर्न को पहचानना सीखेगा जो कुछ डिज़ाइन सुविधाओं से संबंधित हैं?

एक शब्द में: शायद। सबसे अच्छा तरीका है जाने के लिए? शायद ऩही। क्यों नहीं, आप पूछें?

इस बात की संभावना हमेशा रहती है कि आपका मॉडल वही नहीं सीखे जो आप चाहते हैं। इसके अलावा आप की तरह कई चुनौतियों है overfitting है कि आप चिंता करने के लिए अपने बारे में लिखना होगा। जैसा कि मैंने कहा, यह एक सांख्यिकीय दृष्टिकोण है। यहां तक ​​कि अगर यह आपके सभी परीक्षण डेटा को 100% सही के रूप में वर्गीकृत करता है, तो भी कोई रास्ता नहीं है (जब तक कि आप पूरी तरह से अयोग्य गणित की जांच न करें) 100% सुनिश्चित करें कि यह हमेशा सही ढंग से वर्गीकृत करेगा। मुझे और संदेह है कि आप अपने मॉडल पर काम करने में अधिक समय खर्च करने की संभावना रखते हैं, फिर तर्क को कम करने में जो समय लगेगा।

मैं @ बाइटेल से भी असहमत हूं: मैं इस पर सीएनएन (कन्वेन्शनल न्यूरल नेटवर्क) नहीं करूंगा। CNN का उपयोग तब किया जाता है जब आप मैट्रिक्स के विशिष्ट भागों को देखना चाहते हैं, और पिक्सेल के बीच संबंध और जुड़ाव महत्वपूर्ण हैं - उदाहरण के लिए छवियों के लिए। चूँकि आपके पास केवल 1s और 0s हैं, मुझे दृढ़ता से संदेह है कि CNN बहुत अधिक मात्रा में होगा। और सभी स्पार्सिटी (कई शून्य) के साथ आप संकल्पों में बहुत सारे शून्य के साथ समाप्त हो जाएंगे।

मैं वास्तव में एक प्लेन वेनिला (आगे फ़ीड) तंत्रिका नेटवर्क का सुझाव देता हूं, जो कि स्पार्सिटी के बावजूद, मुझे लगता है कि इस वर्गीकरण को बहुत आसानी से करने में सक्षम होगा।


1
बहुत गहन उत्तर। एक लघु संस्करण यह है कि ऐसे प्रश्नों के लिए जिनमें विश्लेषणात्मक समाधान है, आमतौर पर एमएल सही दृष्टिकोण नहीं है।
अमरिंदर अरोरा

0

जहां तक ​​मैं समझता हूं, हां आपकी समस्या पैटर्न मान्यता से संबंधित है। चूंकि दृष्टिकोण लेबल के साथ इनपुट को वर्गीकृत करने के लिए है जो आप पहले तंत्रिका जाल के लिए प्रदान करते हैं, मुझे लगता है कि एक प्रशंसनीय तंत्रिका नेटवर्क आपके लिए समस्या का काम कर सकता है।


0

समस्या

प्रस्तावित प्रणाली के लिए प्रशिक्षण डेटा इस प्रकार है।

  • एक बूलियन मैट्रिक्स एक ठोस ज्यामितीय डिजाइन की सतह के आसन्न का प्रतिनिधित्व करता है
  • मैट्रिक्स में भी प्रतिनिधित्व किनारों के आंतरिक और बाहरी कोणों के बीच भेदभाव है
  • लेबल (नीचे वर्णित)

उत्तल और अवतल सतह के क्रमिक विक्षेप का वर्णन करने के लिए सही शब्द नहीं हैं। एक आंतरिक किनारा, जैसे कि एक अंत चक्की द्वारा बनाया गया है, वास्तव में अवतल सतह नहीं है। सतह के ढाल असंतोष, आदर्श ठोस मॉडल के दृष्टिकोण से, एक शून्य त्रिज्या है। एक बाहरी किनारा समान कारण के लिए सतह का उत्तल भाग नहीं है।

प्रस्तावित प्रणाली का प्रस्तावित आउटपुट एक बूलियन सरणी है जो विशिष्ट ठोस ज्यामितीय डिजाइन सुविधाओं की उपस्थिति का संकेत देता है।

  • एक या अधिक स्लॉट
  • एक या एक से अधिक बॉस
  • एक या एक से अधिक छेद
  • एक या एक से अधिक जेब
  • एक या एक से अधिक कदम

बुलियन मूल्यों की इस सरणी का उपयोग प्रशिक्षण के लिए लेबल के रूप में भी किया जाता है।

दृष्टिकोण में संभावित कैविट्स

इस दृष्टिकोण में मानचित्रण असंगतियाँ हैं। वे चार श्रेणियों में से एक में आते हैं।

  • मैट्रिक्स में सीएडी मॉडल में टोपोलॉजी के मानचित्रण द्वारा बनाई गई अस्पष्टता - प्रस्तावित ज्यामिति में जिन ठोस ज्यामिति को कैप्चर किया गया है, वे मैट्रिक्स में प्रस्तावित नहीं हैं।
  • सीएडी मॉडल जिसके लिए कोई मैट्रिक्स मौजूद नहीं है - ऐसे मामले जहां किनारे आंतरिक से बाहरी कोण में बदलते हैं या वक्रता से निकलते हैं
  • मैट्रिक्स से सुविधाओं की पहचान में अस्पष्टता - उन विशेषताओं के बीच ओवरलैप करना जो मैट्रिक्स में पैटर्न की पहचान कर सकते हैं
  • उन विशेषताओं का वर्णन करने वाले मैट्रिसेस जो पाँच में से नहीं हैं - यह विकास में डेटा हानि का मुद्दा बन सकता है

ये टोपोलॉजी मुद्दों के कुछ उदाहरण हैं जो कुछ मैकेनिकल डिज़ाइन डोमेन में आम हो सकते हैं और डेटा मैपिंग को बाधित कर सकते हैं।

  • एक छेद में आंतरिक रेडिए के साथ एक फ्रेम के समान मैट्रिक्स होता है।
  • बाहरी त्रिज्या मैट्रिक्स में ओवरसिम्प्लीफिकेशन को जन्म दे सकती है।
  • किनारों के साथ प्रतिच्छेद करने वाले छेद मैट्रिक्स के रूप में अन्य टोपोलॉजी से अप्रभेद्य हो सकते हैं।
  • छिद्रों के माध्यम से दो या अधिक प्रतिच्छेदन आसन्न अस्पष्टता पेश कर सकते हैं।
  • केंद्र छिद्रों के साथ गोल मालिकों का समर्थन करने वाले नुकीले और पसलियां अप्रभेद्य हो सकती हैं।
  • एक गेंद और एक टोरस में एक ही मैट्रिक्स होता है।
  • हेक्सागोनल क्रॉस के साथ 180 डिग्री के मोड़ के साथ एक डिस्क और बैंड में एक ही मैट्रिक्स होता है।

प्रश्न में परिभाषित परियोजना के लिए ये संभावित चेतावनी हो सकती है या नहीं।

विश्वसनीयता के साथ एक चेहरे के आकार की क्षमता को सेट करना दक्षता को सीमित करता है। ऐसे दृष्टिकोण हो सकते हैं जो आरएनएन के किसी एक संस्करण का लाभ उठाते हैं, जो सरल ज्यामितीयों के लिए दक्षता से समझौता किए बिना मनमाने मॉडल आकारों के कवरेज की अनुमति दे सकता है। इस तरह के दृष्टिकोण में प्रत्येक उदाहरण के लिए एक अनुक्रम के रूप में मैट्रिक्स को विभाजित करना शामिल हो सकता है, प्रत्येक मैट्रिक्स के लिए एक अच्छी तरह से कल्पना सामान्यीकरण रणनीति लागू कर सकता है। पैडिंग प्रभावी हो सकती है यदि प्रशिक्षण दक्षता पर कोई तंग बाधाएं नहीं हैं और चेहरे की संख्या के लिए एक व्यावहारिक अधिकतम मौजूद है।

काउंट और निश्चितता को आउटपुट के रूप में देखते हुए

[0.0,1.0]

एक गैर-नकारात्मक पूर्णांक आउटपुट का उपयोग करने की संभावना, एक बाइनरी आउटपुट कोशिकाओं को एकत्र करने के द्वारा बनाई गई एक अहस्ताक्षरित बाइनरी प्रतिनिधित्व के रूप में, एक बूलियन प्रति सुविधा के बजाय कम से कम माना जाना चाहिए। डाउनस्ट्रीम, सुविधाओं को गिनने की क्षमता महत्वपूर्ण हो सकती है।

यह विचार करने के लिए पांच यथार्थवादी क्रमबद्धता की ओर जाता है, जिसे प्रत्येक ठोस ज्यामिति मॉडल की प्रत्येक विशेषता के लिए प्रशिक्षित नेटवर्क द्वारा उत्पादित किया जा सकता है।

  • बूलियन अस्तित्व का संकेत है
  • गैर-नकारात्मक पूर्णांक उदाहरण की संख्या को इंगित करता है
  • एक या अधिक उदाहरण की बूलियन और वास्तविक निश्चितता
  • गैर-नकारात्मक पूर्णांक एक या अधिक उदाहरणों की सबसे संभावित आवृत्ति गणना और वास्तविक निश्चितता का प्रतिनिधित्व करता है
  • गैर-नकारात्मक वास्तविक माध्य और मानक विचलन

पैटर्न मान्यता या क्या?

एक्सY

(एक्स)Y

यदि नेटवर्क द्वारा कार्यात्मक रूप से अनुमानित अवधारणा वर्ग को प्रशिक्षण के लिए उपयोग किए गए नमूने में पर्याप्त रूप से दर्शाया गया है और प्रशिक्षण के उदाहरणों का नमूना उसी तरह से तैयार किया गया है जैसे कि लक्ष्य अनुप्रयोग बाद में आकर्षित करेगा, तो अनुमान पर्याप्त होने की संभावना है।

सूचना सिद्धांत की दुनिया में, पैटर्न मान्यता और कार्यात्मक सन्निकटन के बीच अंतर का एक धुंधलापन है, क्योंकि उस उच्च स्तर एआई वैचारिक अमूर्तता में होना चाहिए।

साध्यता

क्या नेटवर्क डिजाइन सुविधाओं के [बुलियन [संकेतक] के सरणी के लिए मैट्रिसेस को मैप करना सीखेगा?

यदि उपरोक्त सूचीबद्ध कार्य परियोजना हितधारकों के लिए स्वीकार्य हैं, तो उदाहरणों को अच्छी तरह से लेबल किया गया है और पर्याप्त संख्या में प्रदान किया गया है, और डेटा सामान्यीकरण, हानि फ़ंक्शन, हाइपर-पैरामीटर और परत की व्यवस्था को अच्छी तरह से सेट किया गया है, यह संभवतः अभिसरण के दौरान होगा। प्रशिक्षण और एक उचित स्वचालित सुविधा पहचान प्रणाली। फिर, इसकी प्रयोज्यता नई ठोस ज्यामितीयताओं पर आधारित है जिसे प्रशिक्षण के उदाहरणों की तरह अवधारणा वर्ग से खींचा जा रहा था। सिस्टम विश्वसनीयता प्रशिक्षण पर निर्भर करती है जो बाद के उपयोग के मामलों का प्रतिनिधि है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.