मैं एक बायेसियन श्रेणीबद्ध रैखिक मॉडल के साथ काम कर रहा हूं , यहां नेटवर्क इसका वर्णन कर रहा है।
सुपरमार्केट में किसी उत्पाद की दैनिक बिक्री का प्रतिनिधित्व करता है (देखा गया)।
कीमतों, प्रचार, सप्ताह के दिन, मौसम, छुट्टियों सहित रजिस्टरों का एक ज्ञात मैट्रिक्स है।
प्रत्येक उत्पाद का अज्ञात अव्यक्त इन्वेंट्री स्तर है, जो सबसे अधिक समस्याओं का कारण बनता है और जिसे मैं द्विआधारी चर के वेक्टर के रूप में मानता हूं, प्रत्येक उत्पाद के लिए स्टॉकआउट और उत्पाद की अनुपलब्धता का संकेत देता है। यहां तक कि अगर सिद्धांत रूप में अज्ञात मैंने इसे प्रत्येक उत्पाद के लिए एक एचएमएम के माध्यम से अनुमान लगाया है, तो इसे एक्स के रूप में जाना जाता है। मैंने सिर्फ उचित औपचारिकता के लिए इसे अनसुना करने का फैसला किया।
किसी भी एकल उत्पाद के लिए एक मिश्रित प्रभाव पैरामीटर है जहां मिश्रित प्रभाव माना जाता है उत्पाद की कीमत, प्रचार और स्टॉकआउट।
बी 1 बी 2 निश्चित प्रतिगमन गुणांक का वेक्टर है, जबकि और मिश्रित प्रभाव गुणांक के वैक्टर हैं। एक समूह ब्रांड को इंगित करता है और दूसरा स्वाद को इंगित करता है (यह एक उदाहरण है, वास्तव में मेरे पास कई समूह हैं, लेकिन मैं यहां स्पष्टता के लिए सिर्फ 2 रिपोर्ट करता हूं)।
Σ ख 1 Σ ख 2मिश्रित प्रभावों पर , और हैं।
चूँकि मेरे पास आंकड़ें हैं, मान लीजिए कि मैं प्रत्येक उत्पाद की बिक्री का इलाज करता हूं क्योंकि पोइसन ने रजिस्टरों पर सशर्त वितरित किए (भले ही कुछ उत्पादों के लिए रैखिक सन्निकटन हो और दूसरों के लिए एक शून्य फुलाया मॉडल बेहतर है)। इस तरह के एक मामले में मेरे पास एक उत्पाद लिए होगा ( यह सिर्फ उस व्यक्ति के लिए है जिसे बायेसियन मॉडल में दिलचस्पी है, सवाल को छोड़ दें यदि आपको यह अप्रतिष्ठित या गैर तुच्छ लगता है :) ):
, ज्ञात।
Σ बीटा , जाना जाता है।
,
जे ∈ 1 , ... , मीटर 1 कश्मीर ∈ 1 , ... , मी 2 , ,
एक्स पी पी एस मैं मैं डब्ल्यू जेड मैं जेड मैं = एक्स मैं σ मैं जे मैं j2 समूहों के लिए मिश्रित प्रभावों के मैट्रिक्स, उत्पाद की कीमत, प्रचार और दर्शाता है। उलटा विसारस वितरण को इंगित करता है, आमतौर पर सामान्य बहुभिन्नरूपी पादरियों के सहसंयोजक मैट्रिक्स के लिए उपयोग किया जाता है। लेकिन यह यहाँ महत्वपूर्ण नहीं है। एक संभावित का उदाहरण सभी कीमतों का मैट्रिक्स हो सकता है, या हम भी कह सकते हैं । जैसा कि मिश्रित-प्रभाव वाले विचरण-सह-संवेदी मैट्रिक्स के लिए के संबंध में, मैं सिर्फ प्रविष्टियों के बीच सहसंबंध को संरक्षित करने की कोशिश करूंगा, ताकि और एक ही ब्रांड के उत्पाद हों या दोनों में से कोई भी हो तो सकारात्मक होगा । एक ही स्वाद।
इस मॉडल के पीछे अंतर्ज्ञान यह होगा कि किसी दिए गए उत्पाद की बिक्री उसकी कीमत, उसकी उपलब्धता या नहीं, बल्कि अन्य सभी उत्पादों की कीमतों और अन्य सभी उत्पादों के स्टॉकआउट पर निर्भर करती है। चूंकि मैं सभी गुणांक के लिए एक ही मॉडल (पढ़ें: एक ही प्रतिगमन वक्र) नहीं चाहता हूं, इसलिए मैंने मिश्रित प्रभाव पेश किए जो पैरामीटर डेटा साझा करने के माध्यम से मेरे डेटा में कुछ समूहों का शोषण करते हैं।
मेरे प्रश्न हैं:
- क्या इस मॉडल को एक तंत्रिका नेटवर्क वास्तुकला में स्थानांतरित करने का एक तरीका है? मुझे पता है कि बायेसियन नेटवर्क, मार्कोव रैंडम फ़ील्ड्स, बायेसियन हायरार्चिकल मॉडल और न्यूरल नेटवर्क के बीच संबंधों की तलाश में कई सवाल हैं, लेकिन मुझे बायेसियन पदानुक्रमित मॉडल से न्यूरल नेट्स तक कुछ भी नहीं मिला। मैं तंत्रिका नेटवर्क के बारे में सवाल पूछता हूं, क्योंकि मेरी समस्या की उच्च आयामीता है (विचार करें कि मेरे पास 340 उत्पाद हैं), MCMC के माध्यम से पैरामीटर का अनुमान सप्ताह लगता है (मैंने रनजैग में समानांतर चेन चलाने वाले सिर्फ 20 उत्पादों के लिए प्रयास किया और इसमें समय लगा) । लेकिन मैं रैंडम नहीं जाना चाहता और सिर्फ ब्लैक बॉक्स के रूप में एक न्यूरल नेटवर्क को डेटा देना चाहता हूं। मैं अपने नेटवर्क की निर्भरता / स्वतंत्रता संरचना का फायदा उठाना चाहूंगा।
यहाँ मैंने सिर्फ एक तंत्रिका नेटवर्क का चित्रण किया है। जैसा कि आप देखते हैं, शीर्ष पर ( और क्रमशः उत्पाद की कीमत और दर्शाते हैं ) को छिपी हुई परत पर किया जाता है क्योंकि वे उत्पाद विशिष्ट हैं (यहां मैंने कीमतों और स्टॉकआउट पर विचार किया है)। S i i (नीले और काले किनारों का कोई विशेष अर्थ नहीं है, यह सिर्फ आंकड़ा अधिक स्पष्ट करने के लिए था)। इसके अलावा और अत्यधिक जबकि सहसंबद्ध किया जा सकता हैY 1 Y 2 Y 3एक पूरी तरह से अलग उत्पाद हो सकता है (2 ऑरेंज जूस और रेड वाइन के बारे में सोचें), लेकिन मैं तंत्रिका नेटवर्क में इस जानकारी का उपयोग नहीं करता हूं। मुझे आश्चर्य है कि अगर समूह की जानकारी का उपयोग केवल वजन के औचित्य में किया जाता है या यदि कोई समस्या के लिए नेटवर्क को अनुकूलित कर सकता है।
संपादित करें, मेरा विचार:
मेरा विचार कुछ इस तरह होगा: पहले की तरह, और सहसंबद्ध उत्पाद हैं, जबकि पूरी तरह से अलग है। यह एक प्राथमिकताओं को जानने के बाद मैं 2 चीजें करता हूं:Y 2 Y 3
- मैं किसी भी समूह के लिए छिपी हुई परत में कुछ न्यूरॉन्स का इस मामले में मेरे पास 2 समूह {( ), ( )} हैं।वाई 3
- मैं इनपुट और आवंटित नोड्स (बोल्ड किनारों) के बीच उच्च भार को प्रारंभिक करता हूं और निश्चित रूप से मैं डेटा में शेष 'यादृच्छिकता' को पकड़ने के लिए अन्य छिपे हुए नोड का निर्माण करता हूं।
आपकी मदद के लिए अग्रिम धन्यवाद