एक वेबसाइट के माध्यम से यात्रा के लिए एक पथ संभाव्यता वृक्ष का निर्माण करें


10

मैं वर्तमान में एक वेबसाइट पर विश्लेषण कर रहा हूं जिसके लिए आवश्यक है कि मैं एक निर्णय ट्री आरेख बनाऊं जिसमें यह संभावना हो कि लोग जब भी वेबसाइट पर आते हैं, तो वे मार्ग दिखाते हैं। मैं एक ऐसे से निपट रहा हूं data.frameजो मुखपृष्ठ से शुरू होकर साइट के सभी ग्राहकों के मार्ग दिखाता है। उदाहरण के लिए, कोई ग्राहक निम्न पथ ले सकता है:

Homepage - pg 1
Kitchen Items page - pg 2
Pots and Pans page - pg 3

इसलिए इस ग्राहक के पास 3 पेज की यात्रा होगी। मैं R में क्या करने का प्रयास करना चाहता हूं वह सभी ग्राहकों के रास्तों को मिला देता है और इस तरह साइट पर एक निश्चित पथ का अनुसरण करते हुए ग्राहक को एक संभावना प्रदान करता है। उदाहरण के लिए, अगर मैं सभी रास्तों की जांच करूं तो मुझे पता चला कि मुखपृष्ठ पर आने वाले 34% लोग 'किचन आइटम पेज' पर जाते हैं। क्या R में यह सुविधा है?

मैंने अलग-अलग तरीकों से राउटर और पार्टीकिट पैकेज के माध्यम से देखा है, लेकिन वे किसी भी मदद के लिए प्रतीत नहीं हुए।

इसके लिए सही दिशा में किसी भी स्टीयर की बहुत सराहना की जाती है!


1
मैं इस क्षेत्र के बारे में ज्यादा नहीं जानता, लेकिन igraphपैकेज काफी व्यापक प्रतीत होता है।
रिचमीमोर्रोसियो

3
हाँ, igraph विज़ुअलाइज़ेशन के लिए जाने का रास्ता है। आपको पहले से ही संक्रमण संभावनाओं की गणना करनी होगी। सामान्य तौर पर, मैंने मार्कोव चेन
स्टीफन

1
क्या आप कुछ नमूना डेटा पोस्ट कर सकते हैं? यह हमें स्थिति को बेहतर ढंग से समझने में मदद करेगा।
जिज्ञासु_कैट

जवाबों:


1

प्रारंभ करने का एक तरीका नहीं है, एक मैट्रिक्स है ( ) जहां पृष्ठों की संख्या है। फिर जब भी आपके पास पेज से पेज तक उपयोगकर्ता हो, तो अपने कच्चे डेटा वृद्धि मैट्रिक्स तत्व आधार पर । यह आपको संक्रमण की संभावनाएं देता है।n×nMn×nnMrcrc

आपके पहले प्रश्न का उत्तर पहले से ही दिया गया है: "मुखपृष्ठ पर कितने प्रतिशत उपयोगकर्ता (कहते हैं कि पेज 1), रसोई आइटम (कहें पृष्ठ 2) के बगल में यात्रा करते हैं?"

M12cM1c

या यह बहुत सरल है?


1
नहीं, यह सही नहीं है। हालांकि यहां से - क्या आर में एक पेड़ में गतिशील रूप से प्रत्येक को ग्राफ करने का एक तरीका है? यदि नहीं, तो क्या कोई और उपकरण है जिसका मैं उपयोग कर सकता हूं?
मई को

@ नेलिंगटन: आपके मन में किस तरह का पेड़ है?
जिज्ञासु_काट

1
अधिमानतः एक संभाव्यता का पेड़, रूट नोड का होमपेज होने के साथ (लेकिन अगर मैं रूट नोड को बदल सकता हूं, साइट पर दूसरे पृष्ठ पर - यह एक बड़ी विशेषता होगी), रूट नोड से प्रत्येक शाखा अगले पृष्ठ का प्रतिनिधित्व करने के बाद का प्रतिनिधित्व करेगी रूट नोड। आदर्श रूप से, प्रत्येक शाखा में एक% संभावना जुड़ी होगी। यह इस मायने में गतिशील होगा कि मुझे प्रत्येक उप-नोड पर विस्तार और अनुबंध करने में सक्षम होना चाहिए। क्या आप किसी ऐसे विज़ुअलाइज़ेशन सॉफ़्टवेयर के बारे में जानते हैं जो इसे संभाल सकता है?
मई को 13:30 पर nellington

@ नेलिंगटन: विशुद्ध रूप से कल्पना करने के लिए, आप ग्राफविज़ की कोशिश कर सकते हैं। वह पेड़ एक निर्देशित ग्राफ होगा और इसे संभालने के लिए बहुत सारे ग्राफविज़-उन्मुख उपकरण हैं।
जिज्ञासु_कैट

0

ऐसा लगता है कि आप Google के पेजरैंक एल्गोरिदम को फिर से बनाने की कोशिश कर रहे हैं। मार्कोव चेन के उपयोग से अधिकांश पेजरैंक एल्गोरिथ्म विकसित किया गया था। आप आर में पेजरैंक के तरीकों को विकसित करने के कई उल्लेख पा सकते हैं।

igraph.sourceforge.net/doc/R/page.rank.htm


1
जहां तक ​​मैं देखता हूं, यह पेजरैंक के बारे में नहीं है। IMHO, एकमात्र ओवरलैप यह है कि उपयोगकर्ता पथ साइट डिजाइन (लिंक) के लिए सबसे अधिक संभावना है, लेकिन यह है। एक तरफ, प्रदान की गई लिंक काम नहीं कर रही है।
स्टीफन

1
मुझे लगता है कि मुझे लिंक मिल गया है, यह शायद किसी समय igraph के वेबपेज पर था क्योंकि यह igraph का भारी उपयोग करता प्रतीत होता है। stat.berkeley.edu/users/vigre/undergrad/reports/…
जिनोरमा

ओह, मैं देख रहा हूं ... और पेज.क्रक igraph में एक फ़ंक्शन है। कुछ प्रलेखन: link1 link2 link3
जीनोरमा

पहली रिपोर्ट को संक्षेप में कहने के बाद, मुझे वास्तव में लगता है कि यह एक बहुत अच्छा जवाब है, और मैंने इसे वोट दिया (हालांकि यह कुछ विस्तार का उपयोग कर सकता था!)। पेज रैंक की कार्यक्षमता उत्तर प्रतीत होती है।
जीनोरमा

0

मैं यहां जो देख रहा हूं, उससे मैं सहमत हूं कि इग्राफ / मार्कोव चेन शायद जाने का रास्ता है, हालांकि आप निश्चित रूप से रापर और / या पार्टीकिट का उपयोग कर सकते हैं।

अपने सीमित उदाहरण के साथ एक सरल उत्तर देना मेरे लिए कठिन है, लेकिन मैं आम तौर पर समझा सकता हूं कि आप इसे कैसे करेंगे।

आप यह देखना चाहते हैं कि आपके सभी उपयोगकर्ता कहां थे, और उदाहरण के लिए इसे एक स्ट्रिंग में संक्षेप में प्रस्तुत करें

"Home / product4 / product3 / product4 / buynow"
"Home / product3 / buynow"
"Home / product3 / product4"

आप तब अपने उपयोगकर्ताओं को श्रेणियों में विभाजित कर सकते हैं, वे कहें जो "अब खरीदें" पृष्ठ में समाप्त हो गए, और जो नहीं हुए। फिर आप बस उस टर्मिनल परिणाम पर भविष्यवाणी करना शुरू कर सकते हैं। इस उदाहरण में, शायद आपको पता चलेगा कि जिन लोगों ने सबसे अधिक तुलना की दुकान की थी, उन्होंने कुछ खरीदा / खरीदा नहीं था।

आप अधिक चर भी बना सकते हैं, जैसे "बायफ्रेंड पृष्ठ से पहले पृष्ठ क्या था" "उन्होंने कुछ खरीदने से पहले कितने पृष्ठ देखे" या "जब उन्होंने अपना पहला खाता बनाया था", और आप अपने विश्लेषण में उन मैट्रिक्स को जोड़ सकते हैं।

बहुत सारे अलग-अलग तरीके हैं जिनसे आप जा सकते हैं, और यह अलग-अलग सवालों का जवाब देना शुरू करता है, लेकिन मेरा कहना है कि आप पेड़ों का उपयोग कर सकते हैं और कुछ समस्याओं के लिए यह अंतर्दृष्टि का तेज़ और सरल मार्ग हो सकता है।

वैसे, आप का उपयोग करके गैर-संख्यात्मक चर कारकों बनाने के लिए की आवश्यकता होगी factorया as.factor, आप पार्टी का उपयोग करने जा रहे हैं। पार्टी आपके पास शुरू करने के लिए कुछ अच्छे विगनेट्स हैं।


1
ईमानदार होने के लिए, मैं होमपेज को ऑप्टिमाइज़ करना चाहता हूं, इसलिए यह भविष्यवाणी करना कि लोग होमपेज से पेज 2 पर जाते हैं और फिर पेज 2 से तीसरे पेज पर जाने वाले डेटा का सबसे महत्वपूर्ण खंड है। टर्मिनल पेज में ज्यादा दिलचस्पी नहीं है। मेरे पास यात्रा में पृष्ठ यूआरएल और पृष्ठ संख्याएं हैं इसलिए संक्रमण संभाव्यताएं ऐसा करने का एक तरीका है। इसके बावजूद, यह थोड़ा मैनुअल लगता है और मैं, हालांकि आर अधिक पुनरावृत्त समाधान प्रदान करने में सक्षम हो सकता है ...
nellington

आपके प्रश्न और अंतिम टिप्पणी को पुन: प्रकाशित करने के बाद, मुझे लगता है कि आप बस एक पृष्ठ चाहते हैं जो लोग होम पेज से करते हैं। (शुरू करने के लिए)
जिनोरमा

होमपेज के बाद लोग होमपेज और पेज से क्या करते हैं, यह सबसे महत्वपूर्ण है, लेकिन आर में सभी उपयोगकर्ताओं के डेटा को सम्‍मिलित करना और संभाव्यता को असाइन करना जहां यह सबसे मुश्किल है। शायद एक्सेल जाने का रास्ता है? मैं igraph में कोने / किनारों के मार्ग से नीचे जा रहा हूँ, लेकिन ऐसा लगता है कि यह मदद से अधिक नुकसान पहुँचा रहा है।
nellington

मैंने अपनी प्रोफ़ाइल में कुछ संपर्क जानकारी जोड़ी। शायद हम ऑफ़लाइन बात कर सकते हैं?
जीनोरमा

यह बहुत उपयोगी होगा धन्यवाद - मेल भेजा
nellington
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.