अव्यक्त सुविधाओं का अर्थ?


24

मैं एडवेंचर सिस्टम के लिए मैट्रिक्स फैक्टराइजेशन के बारे में सीख रहा हूं और मैं इस शब्द को latent featuresबहुत बार देख रहा हूं लेकिन मैं इसका मतलब नहीं समझ पा रहा हूं। मुझे पता है कि एक विशेषता क्या है, लेकिन मैं अव्यक्त सुविधाओं के विचार को नहीं समझता। कृपया इसे समझा सकते हैं? या कम से कम मुझे एक कागज / जगह पर इंगित करें जहां मैं इसके बारे में पढ़ सकता हूं?


अव्यक्त चर मॉडल को मॉडल के रूप में अधिक शक्तिशाली प्रस्तुत करने की अनुमति देते हैं जो कि मॉडल किए जा सकते हैं। यह उनके मूल्य को परिभाषित करने के लिए डेटा और एल्गोरिदम तक है। दूसरे शब्दों में, अव्यक्त चर "चरण" की तरह होते हैं जो आपके देखे गए चर और इच्छित भविष्यवाणी के बीच की खाई को पाट देते हैं। यह "गैप" जितना व्यापक है, अव्यक्त चर उतने ही उपयोगी हैं।
व्लादिस्लाव्स डोवलगेक्स

जवाबों:


25

अति-सरलीकरण की कीमत पर, अव्यक्त विशेषताएं उन्हें छिपी हुई विशेषताओं से अलग करने के लिए 'छिपी हुई' विशेषताएं हैं। मैट्रिक्स फैक्टराइजेशन का उपयोग करके अव्यक्त विशेषताओं से अव्यक्त विशेषताओं की गणना की जाती है। एक उदाहरण पाठ दस्तावेज़ विश्लेषण होगा। दस्तावेजों से निकाले गए 'शब्द' विशेषताएं हैं। यदि आप शब्दों के डेटा को फैक्टर करते हैं, तो आप 'विषय' पा सकते हैं, जहाँ 'विषय' शब्द का अर्थ प्रासंगिकता के साथ है। निम्न-श्रेणी मैट्रिक्स फैक्टराइजेशन कई पंक्तियों (अव्यक्त सुविधाओं) के एक छोटे सेट के लिए कई पंक्तियों (प्रेक्षित विशेषताओं) को मैप करता है। विस्तृत करने के लिए, दस्तावेज़ में [पाल-नाव, स्कूनर, यच, स्टीमर, क्रूजर] जैसे फीचर (शब्द) देखे जा सकते थे जो 'जहाज' और 'नाव' की तरह अव्यक्त सुविधा (विषय) के लिए 'कारक' होंगे।

[पाल-नाव, स्कूनर, नौका, स्टीमर, क्रूजर, ...] -> [जहाज, नाव]

अंतर्निहित विचार यह है कि अव्यक्त विशेषताएं पर्यवेक्षी सुविधाओं के शब्दार्थ रूप से प्रासंगिक 'समुच्चय' हैं। जब आपके पास बड़े पैमाने पर, उच्च-आयामी और शोर पर्यवेक्षित विशेषताएं होती हैं, तो यह अव्यक्त सुविधाओं पर आपके क्लासिफायर बनाने के लिए समझ में आता है।

यह निश्चित रूप से अवधारणा को स्पष्ट करने के लिए एक सरलीकृत विवरण है। आप सटीक विवरण के लिए अव्यक्त डिरिचलेट आवंटन (LDA) या संभाव्य लतात्मक शब्दार्थ विश्लेषण (pLSA) मॉडल पर विवरण पढ़ सकते हैं।


"अव्यक्त विशेषताओं का उपयोग मैट्रिक्स फैक्टराइज़ेशन का उपयोग करके देखी गई विशेषताओं से किया जाता है।" क्या अव्यवस्थित मानी जाने वाली मात्रा के लिए मैट्रिक्स फैक्टराइजेशन का उपयोग करना संगणना है?
flow2k

5

(MxN)MNएक्समैंj

फिर आपके मैट्रिक्स को K"अव्यक्त कारक" के माध्यम से "फैक्टराइज्ड" किया जा सकता है , ताकि एक मैट्रिक्स के बजाय आपके पास दो: (MxK)- के लिए उपयोगकर्ता हों, और (KxN)- आइटम के लिए, मैट्रिक्स का गुणन जिसमें मूल मैट्रिक्स का उत्पादन होता है।

अंत में, आपके प्रश्न के लिए: मैट्रिक्स फैक्टराइजेशन में अव्यक्त विशेषताएं क्या हैं? वे Kउपयोगकर्ता के स्वाद और अनुशंसित वस्तुओं में अज्ञात विशेषताएं ( ) हैं, ताकि जब ये दोनों मैट्रिसेज़ गुणा हो जाएं, तो वे ज्ञात सिफारिशों के मैट्रिक्स का उत्पादन करते हैं। विशेष भार (किसी विशेष सुविधा के लिए उपयोगकर्ता की प्राथमिकताएँ और किसी विशेष आइटम में किसी विशेषता की मात्रा) को तथाकथित प्रत्यावर्ती वर्ग चौकों के माध्यम से परिभाषित किया जाता है, जिसके बारे में आप यहां पढ़ सकते हैं


3

यह मुझे प्रतीत होता है कि अव्यक्त विशेषताएं एक शब्द है जिसका उपयोग संस्थाओं को उनकी संरचना द्वारा वर्गीकृत करने के लिए मानदंड का वर्णन करने के लिए किया जाता है , दूसरे शब्दों में, उन विशेषताओं (लक्षणों) द्वारा , जिनमें वे शामिल हैं, कक्षाओं के बजाय । यहाँ "अव्यक्त" शब्द का अर्थ सामाजिक विज्ञानों में इसके अर्थ के समान है, जहाँ बहुत लोकप्रिय शब्द अव्यक्त चर ( http://en.wikipedia.org/wiki/Latent_variable ) का अर्थ है अप्रतिष्ठित चर (अवधारणा)।

निम्नलिखित पेपर में धारा "परिचय" अव्यक्त सुविधाओं के एक अच्छे विवरण का अर्थ प्रदान करता है और सामाजिक विज्ञान घटना के मॉडलिंग में उपयोग : http://paper.nips.cc/paper/3846-nonparametric-latent-feature-models-for- लिंक-prediction.pdf


मैंने आपके द्वारा संदर्भित पेपर में परिचय पढ़ा लेकिन अव्यक्त सुविधाओं की अवधारणा को समझने में यह बहुत उपयोगी नहीं पाया।
विल

@ बेहतर अनुभव के साथ स्रोत (सूत्रों) का सुझाव देने के लिए स्वतंत्र महसूस करें।
अलेक्जेंडर ब्लेक

1
मैं काफी इस तरह: tcts.fpms.ac.be/asr/project/sprach/report97/node162.html
विल

@ धन्यवाद। मैं सहमत हूं - यह एक बहुत अच्छा परिचय / स्पष्टीकरण है (हालांकि, मुझे यकीन है कि वहाँ कई अन्य अच्छे बिखरे हुए हैं)।
अलेक्सांद्र ब्लेक

1

एक अन्य उदाहरण, नेटफ्लिक्स सेटअप जैसे मूवी रेटिंग मैट्रिक्स के लिए उपयोगकर्ताओं के मामले पर विचार करें। यह एक विशाल विरल मैट्रिक्स होगा जिसे संसाधित करना मुश्किल है।

ध्यान दें कि प्रत्येक उपयोगकर्ता की विशिष्ट प्राथमिकताएं होंगी जैसे कि विज्ञान-फाई फिल्में या रोमांस फिल्में आदि। इसलिए, सभी मूवी रेटिंग्स को संग्रहीत करने के बजाय हम फिल्म श्रेणी की तरह एक अव्यक्त विशेषता को संग्रहीत कर सकते हैं, जो विभिन्न शैलियों के उदाहरण के लिए है: Sci-Fi या रोमांस, जो भी प्रत्येक श्रेणी के लिए अपने स्वाद की मात्रा निर्धारित करता है। इन्हें लेटेंट फीचर्स कहा जाता है , जो पूरी फिल्म सूची को संग्रहीत करने के बजाय उसके स्वाद के सार को पकड़ लेता है।

बेशक यह एक सन्निकटन होगा, लेकिन फ्लिप-साइड पर, आपके पास स्टोर करने के लिए बहुत कम है।

एन*एनएन*11*एनएन22एन

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.