डेटा साइंस में हमारी अंतिम पाठ्यक्रम परियोजना के लिए, हमने निम्नलिखित का प्रस्ताव दिया-
अमेज़ॅन की समीक्षा डेटासैट को दें , हम एक एल्गोरिथ्म के साथ आने की योजना बनाते हैं (जो कि निजीकृत पेजरैंक पर आधारित है) जो अमेज़ॅन पर विज्ञापन रखने के लिए एक रणनीतिक स्थिति निर्धारित करता है। उदाहरण के लिए, अमेज़न पर लाखों उत्पाद हैं। और डेटासेट आपको इस बात का अंदाजा देता है कि कौन से उत्पाद संबंधित हैं, किन उत्पादों को एक साथ लाया गया, एक साथ देखा गया आदि (हम इस जानकारी के साथ एक ग्राफ का निर्माण भी देख सकते हैं और खरीदा भी जा सकता है) यह आपको प्रत्येक उत्पाद से जुड़ी समीक्षा भी देता है। 14 वर्ष। इन सभी जानकारियों का उपयोग करके, हम Amazon पर उत्पादों को रेट / रैंक करेंगे। अब, आप अमेज़न पर एक विक्रेता हैं जो अपने उत्पाद पृष्ठ पर ट्रैफ़िक सुधारना चाहते हैं। हमारा एल्गोरिदम आपको ग्राफ में रणनीतिक पदों की पहचान करने में मदद करता है जहां आप अपना विज्ञापन रख सकते हैं ताकि आप अधिकतम ट्रैफ़िक प्राप्त कर सकें।
अब, हमारे प्रोफेसर का सवाल है, आप वास्तविक उपयोगकर्ताओं के बिना अपने एल्गोरिथ्म को कैसे मान्य करेंगे? हम कहा-
हम उपयोगकर्ताओं का एक निश्चित सेट मॉडल कर सकते हैं। कुछ उपयोगकर्ता पहले या पांचवें हॉप की तुलना में अधिक बार तीसरे हॉप का अनुसरण करते हैं
also_bought
औरalso_viewed
लिंक करते हैं। वहां उपयोगकर्ताओं का व्यवहार सामान्य रूप से वितरित किया जाता है। कुछ अन्य उपयोगकर्ता पहले हॉप से परे शायद ही नेविगेट करते हैं। उपयोगकर्ताओं के व्यवहार का यह सेट तेजी से वितरित किया गया है।
हमारे प्रोफेसर ने कहा - जो भी वितरण उपयोगकर्ताओं का अनुसरण करते हैं, उपयोगकर्ता समान उत्पादों के लिए लिंक का उपयोग करके नेविगेट कर रहे हैं। आपकी रैंकिंग एल्गोरिदम भी उत्पादों को रैंक करने के लिए समानता बी / डब्ल्यू 2 उत्पादों पर विचार करता है। तो इस सत्यापन एल्गोरिथ्म का उपयोग थोड़े है cheating
। कुछ अन्य उपयोगकर्ता व्यवहार के साथ आते हैं, एल्गोरिथ्म के लिए कुछ अधिक यथार्थवादी और ऑर्थोगोनल।
उपयोगकर्ताओं के व्यवहार को मॉडल करने के तरीके पर कोई विचार? मुझे अहंकार के बारे में अधिक जानकारी प्रदान करने में खुशी हो रही है।