Amazon अनुशंसा सुविधा कैसे काम करती है?


144

अमेज़ॅन अनुशंसा तकनीक की स्क्रीन के पीछे कौन सी तकनीक जाती है? मेरा मानना ​​है कि अमेज़ॅन की सिफारिश वर्तमान में बाजार में सबसे अच्छी है, लेकिन वे हमें इस तरह की प्रासंगिक सिफारिशें कैसे प्रदान करते हैं?

हाल ही में, हम इसी तरह की सिफारिश की परियोजना के साथ शामिल हुए हैं, लेकिन निश्चित रूप से एक तकनीकी दृष्टिकोण से अमेज़ॅन सिफारिश प्रौद्योगिकी के अंदर और बाहर के बारे में जानना चाहेंगे।

किसी भी इनपुट अत्यधिक सराहना की जाएगी।

अपडेट करें:

यह पेटेंट बताता है कि व्यक्तिगत सिफारिशें कैसे की जाती हैं लेकिन यह बहुत तकनीकी नहीं है, और इसलिए यह वास्तव में अच्छा होगा यदि कुछ अंतर्दृष्टि प्रदान की जा सकती हैं।

डेव की टिप्पणियों से, एफ़िनिटी विश्लेषण इस तरह के अनुशंसा इंजनों के लिए आधार बनाता है। यहाँ भी Topic पर कुछ अच्छे पढ़े गए हैं

  1. मार्केट बास्केट विश्लेषण का प्रदर्शन करना
  2. मार्केट बास्केट विश्लेषण
  3. आत्मीयता विश्लेषण

सुझाया गया पढ़ना:

  1. डाटा माइनिंग: कॉन्सेप्ट एंड टेक्नीक

3
क्या आपने उनके पेटेंट के ढेर से गुजरने की कोशिश की? google.com/patents
डॉल्फ

हाँ, मैं पेटेंट के माध्यम से जा रहा था, लेकिन यह बहुत तकनीकी नहीं है और इसलिए तंत्र के तकनीकी पहलू पर कुछ अंतर्दृष्टि की सराहना करेंगे
राहेल

1
@Dave: यह प्रश्न अब खुला है और मैं वास्तव में सराहना करूंगा कि क्या आप अनुशंसा इंजन वास्तुकला और कार्यक्षमता के पीछे तकनीक पर कुछ और अंतर्दृष्टि दे सकते हैं जो अमेज़ॅन अनुशंसाएं प्रदान करने के लिए उपयोग करता है।
राहेल

1
मैं अमेज़ॅन अनुशंसा प्रणाली को "सर्वश्रेष्ठ" या उपयोगी नहीं कहूंगा। आप एक माउस ऑर्डर करते हैं, यह एक और एक खरीदने के लिए सुझाव देता है। एक सामान्य उपयोगकर्ता को एक साथ दो चूहों की आवश्यकता क्यों होगी ???

1
@ राशेल: यह देखते हुए कि आप जानते हैं कि अमेजन का सिस्टम पेटेंट है और आप कुछ इसी तरह का विकास करना चाहते हैं, मैं उनके पेटेंट पर भी नज़र नहीं डालूंगा --- और निश्चित रूप से उन्हें नहीं देखना आपकी सुरक्षा नहीं करता है, लेकिन यह एक शुरुआत है।

जवाबों:


104

यह एक कला और विज्ञान दोनों है। अध्ययन के विशिष्ट क्षेत्र मार्केट बास्केट विश्लेषण (जिसे आत्मीयता विश्लेषण भी कहा जाता है) के चारों ओर घूमते हैं जो डेटा माइनिंग के क्षेत्र का सबसेट है। ऐसी प्रणाली में विशिष्ट घटकों में प्राथमिक चालक वस्तुओं की पहचान और आत्मीयता वस्तुओं की पहचान (एक्सेसरी अपसेल, क्रॉस सेल) शामिल हैं।

उन डेटा स्रोतों को ध्यान में रखें जो उन्हें मेरे पास हैं ...

  1. खरीदी गई खरीदारी की गाड़ियां = असली वस्तुओं पर खर्च किए गए वास्तविक लोगों से वास्तविक धन = शक्तिशाली डेटा और बहुत सारा।
  2. आइटम कार्ट में जोड़े गए लेकिन छोड़ दिए गए।
  3. मूल्य निर्धारण प्रयोगों ऑनलाइन (ए / बी परीक्षण, आदि) जहां वे विभिन्न कीमतों पर एक ही उत्पाद प्रदान करते हैं और परिणाम देखते हैं
  4. पैकेजिंग प्रयोग (ए / बी परीक्षण, आदि) जहां वे विभिन्न "बंडलों" में विभिन्न उत्पादों की पेशकश करते हैं या वस्तुओं के विभिन्न युग्मों को छूट देते हैं
  5. विशलिस्ट्स - उन पर आपके लिए विशेष रूप से क्या है - और कुल मिलाकर इसे टोकरी विश्लेषण डेटा की एक और धारा के समान माना जा सकता है
  6. रेफरल साइटें (आप कहां से आई हैं इसकी पहचान ब्याज की अन्य वस्तुओं को इंगित कर सकती है)
  7. विदाई का समय (आप कितनी देर पहले वापस क्लिक करें और एक अलग आइटम चुनें)
  8. आपके या आपके सोशल नेटवर्क / सर्किल खरीदने वालों की रेटिंग - यदि आप अपनी पसंद की चीज़ों को रेट करते हैं, तो आपको जो पसंद है वह अधिक मिलता है और यदि आप "मैं पहले से ही इसका मालिक हूं" बटन की पुष्टि करते हैं, तो वे आपकी पूरी प्रोफ़ाइल बनाते हैं
  9. जनसांख्यिकी जानकारी (आपका शिपिंग पता, आदि) - वे जानते हैं कि आपके बच्चों, अपने जीवनसाथी, आदि के लिए आपके सामान्य क्षेत्र में क्या लोकप्रिय है।
  10. उपयोगकर्ता विभाजन = क्या आपने एक बच्चे के लिए अलग-अलग महीनों में 3 किताबें खरीदी थीं? संभावना एक बच्चा है या अधिक .. आदि।
  11. प्रत्यक्ष विपणन डेटा के माध्यम से क्लिक करते हैं - क्या आपको उनसे एक ईमेल मिला और क्लिक करें? वे जानते हैं कि यह कौन सा ईमेल था और आपने इसके माध्यम से क्या क्लिक किया था और क्या आपने इसे परिणामस्वरूप खरीदा था।
  12. सत्र में पथ पर क्लिक करें - आपने अपनी गाड़ी में जाने की परवाह किए बिना क्या देखा
  13. अंतिम खरीद से पहले एक आइटम को देखने की संख्या
  14. यदि आप एक ईंट और मोर्टार स्टोर के साथ काम कर रहे हैं, तो उनके पास आपकी भौतिक खरीद का इतिहास भी हो सकता है (यानी खिलौने आर या कुछ ऐसा है जो ऑनलाइन है और एक भौतिक स्टोर भी है)
  15. आदि आदि।

सौभाग्य से लोग समान रूप से व्यवहार करते हैं, इसलिए जितना अधिक वे बड़े पैमाने पर खरीदने वाली आबादी के बारे में जानते हैं उतना ही बेहतर वे जानते हैं कि वे क्या करेंगे और नहीं बेचेंगे और हर लेनदेन के साथ और हर रेटिंग / इच्छा सूची में जोड़ें / ब्राउज़ करें कि वे जानते हैं कि कैसे अधिक व्यक्तिगत रूप से दर्जी की सिफारिशों के लिए। ध्यान रखें कि यह केवल सिफारिशों, आदि में समाप्त होने वाले प्रभावों के पूर्ण सेट का एक छोटा सा नमूना है।

अब मुझे इस बारे में कोई जानकारी नहीं है कि अमेज़ॅन कैसे व्यापार करता है (कभी वहां काम नहीं किया) और मैं जो कुछ कर रहा हूं वह ऑनलाइन कॉमर्स की समस्या के शास्त्रीय दृष्टिकोण के बारे में बात कर रहा है - मैं पीएम हुआ करता था जो Microsoft के लिए डेटा माइनिंग और एनालिटिक्स पर काम करता था वाणिज्य सर्वर नामक उत्पाद। हमने कॉमर्स सर्वर में शिप किया है, जो लोगों को समान क्षमताओं वाली साइटें बनाने की अनुमति देता है .... लेकिन बिक्री जितनी बड़ी है डेटा उतना ही बेहतर मॉडल - और अमेज़न बड़ा है। मैं केवल कल्पना कर सकता हूं कि एक कॉमर्स संचालित साइट में उस डेटा के साथ मॉडल के साथ खेलना कितना मजेदार है। अब उनमें से कई एल्गोरिदम (जैसे कि कॉमर्स सर्वर में शुरू होने वाले भविष्यवक्ता) सीधे Microsoft SQL के भीतर रहने के लिए चले गए हैं ।

चार बड़े लेने के तरीके आपके पास होने चाहिए:

  1. अमेज़ॅन (या कोई भी रिटेलर) टन के लेन-देन और लोगों के टन के लिए समग्र डेटा को देख रहा है ... यह उन्हें अपनी साइट पर अनाम उपयोगकर्ताओं के लिए बहुत अच्छी तरह से सिफारिश करने की अनुमति देता है।
  2. अमेज़ॅन (या कोई भी परिष्कृत रिटेलर) किसी के भी व्यवहार और खरीद को ट्रैक कर रहा है जो लॉग इन कर रहा है और इसका उपयोग कर रहा है जो बड़े पैमाने पर कुल डेटा के ऊपर शोधन कर सकता है।
  3. अक्सर संचित डेटा की सवारी करने और विशिष्ट लाइनों के उत्पाद प्रबंधकों के लिए सुझावों का "संपादकीय" नियंत्रण लेने का एक साधन होता है (जैसे कुछ व्यक्ति जो 'डिजिटल कैमरों के लंबवत या' रोमांस के उपन्यास 'ऊर्ध्वाधर या समान) के मालिक हैं, जहां वे वास्तव में हैं विशेषज्ञ हैं
  4. अक्सर प्रचार सौदे होते हैं (यानी सोनी या पैनासोनिक या निकॉन या कैनन या स्प्रिंट या वेरिज़न, रिटेलर को अतिरिक्त पैसा देता है, या उन पंक्तियों में बड़ी मात्रा में या अन्य चीजों पर बेहतर छूट देता है) जो कुछ "सुझावों" को जन्म देगा। दूसरों की तुलना में सबसे अधिक बार - प्रत्येक लेन-देन या थोक लागत को कम करने आदि पर लक्षित कुछ व्यावसायिक तर्क और व्यावसायिक कारण हमेशा इसके पीछे होते हैं।

वास्तविक कार्यान्वयन के संदर्भ में? लगभग सभी बड़े ऑनलाइन सिस्टम पाइपलाइनों के कुछ सेट (या एक फिल्टर पैटर्न कार्यान्वयन या एक वर्कफ़्लो, इत्यादि को उबालते हैं, जिसे आप कहते हैं कि आप क्या कहेंगे) जो किसी संदर्भ के लिए मॉड्यूल की एक श्रृंखला द्वारा मूल्यांकन करने की अनुमति देते हैं जो किसी न किसी रूप में लागू होते हैं व्यापार का तर्क।

आमतौर पर पृष्ठ पर प्रत्येक अलग कार्य के साथ एक अलग पाइपलाइन जुड़ी होगी - आपके पास एक ऐसा हो सकता है जो "पैकेज / अपशेल्ट" की सिफारिश करता है (यानी आप जिस वस्तु को देख रहे हैं उसके साथ इसे खरीदें) और एक जो "विकल्प" (यानी खरीदते हैं) यह उस चीज़ के बजाय जो आप देख रहे हैं) और दूसरा जो आपकी इच्छा सूची (उत्पाद श्रेणी या समान) से सबसे अधिक निकटता से संबंधित वस्तुओं को खींचता है।

इन पाइपलाइनों के परिणाम पृष्ठ के विभिन्न भागों (स्क्रॉल पट्टी के ऊपर, स्क्रॉल के नीचे, बाईं ओर, दाईं ओर, अलग-अलग फ़ॉन्ट, विभिन्न आकार के चित्र, आदि) पर रखे जा सकते हैं और यह देखने के लिए परीक्षण किया जाता है कि कौन सा प्रदर्शन श्रेष्ठ। चूँकि आप इन पाइपलाइनों के लिए व्यावसायिक तर्क को प्लग और प्ले करने के लिए अच्छा आसान उपयोग कर रहे हैं, जो कि आप इन पाइपलाइनों के लिए व्यावसायिक तर्क को परिभाषित करते हैं, जो कि लेगो ब्लॉकों के नैतिक समकक्ष के साथ समाप्त होती हैं, जो आपके द्वारा लागू किए गए व्यावसायिक तर्क को चुनना और चुनना आसान होता है जब आप एक और पाइपलाइन का निर्माण करते हैं। जो तेजी से नवाचार, अधिक प्रयोग और अंत में उच्च लाभ की अनुमति देता है।

क्या इससे मदद मिली? आशा है कि आप थोड़ा सा अंतर्दृष्टि दें कि यह सामान्य रूप से किसी भी ईकॉमर्स साइट के लिए कैसे काम करता है - केवल अमेज़ॅन नहीं। अमेज़ॅन (वहां काम करने वाले दोस्तों से बात करने से) बहुत डेटा संचालित है और लगातार उपयोगकर्ता के अनुभव और मूल्य निर्धारण, प्रचार, पैकेजिंग, आदि की प्रभावशीलता को मापता है - वे ऑनलाइन एक बहुत ही परिष्कृत रिटेलर हैं और अग्रणी के किनारे पर होने की संभावना है बहुत सारे एल्गोरिदम वे लाभ का अनुकूलन करने के लिए उपयोग करते हैं - और वे संभावित मालिकाना रहस्य हैं (आप केएफसी के गुप्त मसालों के फार्मूले की तरह जानते हैं) और इस तरह से निर्देशित।


1
हाँ। इसने मुझे बहुत मदद की और मैं वास्तव में इस विषय पर आपके इनपुट की सराहना करता हूं।
राचेल

अद्भुत अंतर्दृष्टि
शोबी

28

यह सीधे अमेज़ॅन की सिफारिश प्रणाली से संबंधित नहीं है, लेकिन यह उन लोगों द्वारा उपयोग किए जाने वाले तरीकों का अध्ययन करने में मददगार हो सकता है, जो नेटफ्लिक्स पुरस्कार में प्रतिस्पर्धा करते हैं , जो नेटफ्लिक्स उपयोगकर्ता डेटा का उपयोग करके एक बेहतर सिफारिश प्रणाली विकसित करने की प्रतियोगिता है। सामान्य रूप से डेटा खनन तकनीकों के बारे में उनके समुदाय में बहुत सारी अच्छी जानकारी मौजूद है ।

जीतने वाली टीम ने विभिन्न मॉडलों / तकनीकों द्वारा उत्पन्न सिफारिशों के मिश्रण का उपयोग किया। मुझे पता है कि मुख्य तरीकों में से कुछ मुख्य घटक विश्लेषण, निकटतम पड़ोसी तरीके और तंत्रिका नेटवर्क थे। विजेता टीम द्वारा यहां कुछ कागजात दिए गए हैं:

आर। बेल, वाई। कोरेन, सी। वोलिंस्की, " द बेल्कोर 2008 सॉल्यूशन टू द नेटफ्लिक्स प्राइज ", (2008)।

ए। टॉशर, एम। जहर, " द बिगचेस सॉल्यूशन टू द नेटफ्लिक्स प्राइज 2008 ", (2008)।

ए। टॉशर, एम। जहर, आर। लेगेनस्टीन, " बड़े-पैमाने की सिफारिश करने वाले सिस्टम के लिए बेहतर पड़ोसी-आधारित एल्गोरिदम ", बड़े पैमाने पर सिफारिश करने वाले सिस्टम पर SIGKDD कार्यशाला और नेटमिक्स पुरस्कार प्रतियोगिता (KDD'08), ACM प्रेस (2008) ।

वाई। कोरेन, " द बेलकॉर सॉल्यूशन टू द नेटफ्लिक्स ग्रैंड प्राइज़ ", (2009)।

ए। टॉशर, एम। जहीर, आर। बेल, " द बिगचेस सॉल्यूशन टू द नेटफ्लिक्स ग्रैंड प्राइज़ ", (2009)।

एम। पियोटे, एम। चेब्बर्ट, " नेटफ्लिक्स ग्रैंड पुरस्कार के लिए व्यावहारिक सिद्धांत ", (2009)।

2008 के पेपर प्रथम वर्ष के प्रगति पुरस्कार से हैं। मैं पहले वाले को पहले पढ़ने की सलाह देता हूं क्योंकि बाद वाले पिछले काम पर बनाते हैं।


2
मुझे इस उत्तर के बारे में क्या पसंद है, यह इस तथ्य की ओर इशारा करता है कि कोई "पूर्ण" उत्तर नहीं है और लोग इस क्षेत्र में नए-नए प्रयोग करते रहते हैं - सुधार के लिए हमेशा कुछ जगह होती है और समय के साथ इसमें बदलाव होते हैं और समस्याओं के लिए नए तरीके लागू होते हैं। अलग तरह से हल करता रहेगा। और यदि आप विस्तृत लिंक पढ़ते हैं, तो आप देख सकते हैं कि पुरस्कार के लिए बड़े दावेदारों में से प्रत्येक के लिए भविष्यवाणी करने के लिए कई अनुमोदन का "मिश्रण" है। महान संदर्भ।
डेव क्विक


20

(विस्मयादिबोधक: मैं अमेज़न पर काम करता था, हालांकि मैंने सिफारिशों पर काम नहीं किया।)

ewernli का जवाब सही होना चाहिए - अमेज़न की मूल अनुशंसा प्रणाली के लिए पेपर लिंक, और जो मैं बता सकता हूं (दोनों व्यक्तिगत अनुभव से अमेज़ॅन दुकानदार के रूप में और अन्य कंपनियों में समान प्रणालियों पर काम कर रहे हैं), बहुत कम बदल गया है: पर इसके मूल, अमेज़ॅन की सिफारिश की सुविधा अभी भी आइटम-से-आइटम सहयोगी फ़िल्टरिंग के आधार पर बहुत भारी है।

बस यह देखें कि सिफारिशें किस रूप में लेती हैं: मेरे सामने वाले पृष्ठ पर, वे "या तो आपको एक्स दिख रहे हैं ... या तो ग्राहकों ने इसे भी देखा है ...", या चीजों के समान वस्तुओं का एक मेलेंज मैंने पहले खरीदा या देखा है। यदि मैं विशेष रूप से मेरे "अनुशंसित आपके लिए" पृष्ठ पर जाता हूं, तो प्रत्येक आइटम का वर्णन है कि यह मेरे लिए अनुशंसित क्यों है: "अनुशंसित क्योंकि आपने खरीदा ...", "अनुशंसित क्योंकि आपने अपनी इच्छा सूची में एक्स को जोड़ा ...", आदि यह है आइटम-से-आइटम सहयोगी फ़िल्टरिंग का एक क्लासिक संकेत।

तो आइटम-से-आइटम सहयोगी फ़िल्टरिंग कैसे काम करता है? मूल रूप से, प्रत्येक आइटम के लिए, आप संबंधित वस्तुओं का एक "पड़ोस" बनाते हैं (उदाहरण के लिए, यह देखते हुए कि लोगों ने किन वस्तुओं को एक साथ देखा है या लोगों ने किन वस्तुओं को एक साथ खरीदा है - समानता का निर्धारण करने के लिए, आप जेकार्ड इंडेक्स जैसे मैट्रिक्स का उपयोग कर सकते हैं ; सहसंबंध) एक और संभावना है, हालांकि मुझे संदेह है कि अमेज़ॅन रेटिंग डेटा का बहुत अधिक उपयोग नहीं करता है)। फिर, जब भी मैं कोई आइटम X देखता हूं या कोई खरीदारी करता हूं Y, अमेज़ॅन मुझे उसी पड़ोस में चीजों का सुझाव देता है जैसे एक्स या वाई।

कुछ अन्य दृष्टिकोण जो अमेज़ॅन संभावित रूप से उपयोग कर सकते हैं, लेकिन संभावना नहीं है, यहां वर्णित हैं: http://blog.echen.me/2011/02/15/an-overview-of-item-to-item-collaborative-filtering -साथ-amazons अनुशंसा-प्रणाली /

डेव का वर्णन बहुत कुछ निश्चित रूप से अमेज़ॅन पर नहीं किया गया है। (मेरे सामाजिक नेटवर्क में उन लोगों द्वारा रेटिंग? नहींं, अमेज़ॅन के पास मेरा कोई भी सामाजिक डेटा नहीं है। यह किसी भी मामले में एक बड़ा गोपनीयता मुद्दा होगा, इसलिए अमेज़ॅन के लिए यह करना मुश्किल होगा, भले ही उनके पास वह डेटा हो: लोग अपने दोस्तों से यह नहीं जानना चाहते हैं कि वे कौन सी किताबें या फिल्में खरीद रहे हैं? जनसांख्यिकीय जानकारी? नहीं, सिफारिशों में कुछ भी ऐसा नहीं है जो वे इसे देख रहे हैं। ।])


अमेज़ॅन ने वर्षों के लिए खरीद मंडलियों को उजागर किया - जो कि कंपनी के डोमेन नाम और ज़िप कोड के आधार पर बेनामी खरीद रुझान थे। खरीद सर्कल में कम से कम 50 अलग-अलग खरीदार होने चाहिए, इससे पहले कि आप इसके बारे में जानकारी प्राप्त कर सकें - इसलिए अमेज़ॅन ने निश्चित रूप से उस जानकारी को रखने, ट्रैक करने और उपयोग करने के लिए खुद को (और अन्य) समझने में मदद की कि क्या लोकप्रिय था। आप अपने क्षेत्र में या अपनी कंपनी में सीडी, इलेक्ट्रॉनिक्स और पुस्तक खरीद को देख सकते हैं। उन्हें 1999-2002 से उजागर किया गया था। forum.dvdtalk.com/archive/t-122436.html यहां तक ​​कि उनका वर्णन करने वाले अमेज़ॅन से पाठ की एक प्रति और पेस्ट भी है।
डेव क्विक

3

मुझे विशेष रूप से अमेज़ॅन के एल्गोरिथ्म का कोई ज्ञान नहीं है, लेकिन इस तरह के एल्गोरिथ्म के एक घटक में संभवतः एक साथ ऑर्डर किए गए आइटमों के ट्रैकिंग समूह शामिल होंगे, और फिर उस डेटा का उपयोग समूह में अन्य वस्तुओं की सिफारिश करने के लिए जब कोई ग्राहक कुछ सबसेट खरीदता है। समूह।

एक और संभावना आइटम ए के आदेश के बाद एन दिनों के भीतर ऑर्डर किए जा रहे आइटम बी की आवृत्ति को ट्रैक करने की होगी, जो एक सहसंबंध का सुझाव दे सकती है।


2

जहाँ तक मुझे पता है, यह इसके लिए इंजन के रूप में केस-बेस्ड रीज़निंग का उपयोग करता है।

आप इस स्रोतों में देख सकते हैं: यहाँ , यहाँ और यहाँ

गूगल में अमेजन और केस-आधारित तर्क के लिए कई स्रोत हैं।


0

किसी ने पिछले सप्ताह कुछ इसी तरह हमारे विश्वविद्यालय में एक प्रस्तुति दी, और अमेज़ॅन सिफारिश प्रणाली का संदर्भ दिया। मेरा मानना ​​है कि यह के-मीन्स क्लस्टरिंग के एक रूप का उपयोग करता है लोगों को उनकी विभिन्न खरीद आदतों में शामिल करने के लिए करता है। उम्मीद है की यह मदद करेगा :)

इसे भी देखें: http://www.almaden.ibm.com/cs/people/dmodha/ml02.ps और HTML के रूप में


0

यदि आप एक हैंड-ऑन ट्यूटोरियल (ओपन-सोर्स आर का उपयोग करके) चाहते हैं तो आप इससे गुजरने से भी बदतर कर सकते हैं: https://gist.github.com/yoshiki146/31d4a46c3d8e906c3cd24fx25568d34e

यह एक अन्य कृति का रन-टाइम अनुकूलित संस्करण है: http://www.salemmarafi.com/code/collaborative-filtering-r/

हालाँकि, पहले लिंक पर कोड की भिन्नता बहुत तेजी से चलती है, इसलिए मैं इसका उपयोग करने की सलाह देता हूं (मैंने पाया कि योशिकी 146 के कोड का एकमात्र धीमा हिस्सा अंतिम रूटीन है जो उपयोगकर्ता स्तर पर सिफारिश उत्पन्न करता है - मेरे डेटा पर लगभग एक घंटे का समय लगता है मेरी मशीन)।

मैंने इस कोड को रिटेलर के लिए सिफारिश करने वाले इंजन के रूप में काम करने के लिए अनुकूलित किया है।

उपयोग किया गया एल्गोरिथ्म है - जैसा कि दूसरों ने ऊपर कहा है - सहयोगी फ़िल्टरिंग। CF की यह विधि एक cosine समानता मैट्रिक्स की गणना करती है और फिर उस समानता से प्रत्येक तत्व के लिए 'निकटतम पड़ोसी' को खोजने के लिए (उदाहरण के लिए, मेरे आवेदन में रिटेल उत्पाद में संगीत बैंड)।

परिणामी तालिका एक अन्य चुने हुए बैंड / उत्पाद के आधार पर एक बैंड / उत्पाद की सिफारिश कर सकती है।

कोड का अगला भाग USER (या ग्राहक) आधारित सहयोगी फ़िल्टरिंग के साथ एक कदम आगे जाता है।

इसका आउटपुट एक बड़ी तालिका है, जिसमें दिए गए उपयोगकर्ता / ग्राहक के लिए अनुशंसित शीर्ष 100 बैंड / उत्पाद हैं


1
हालांकि यह लिंक प्रश्न का उत्तर दे सकता है, लेकिन उत्तर के आवश्यक भागों को शामिल करना और संदर्भ के लिए लिंक प्रदान करना बेहतर है। लिंक-केवल उत्तर अमान्य हो सकते हैं यदि लिंक किए गए पृष्ठ बदल जाते हैं। - समीक्षा से
कोस

सच ... एल्गोरिथ्म का उपयोग किया जाता है - जैसा कि दूसरों ने ऊपर कहा है - सहयोगी फ़िल्टरिंग। CF की यह विधि एक cosine समानता मैट्रिक्स की गणना करती है और फिर उस समानता से प्रत्येक तत्व के लिए 'निकटतम पड़ोसी' को खोजने के लिए (उदाहरण के लिए, मेरे आवेदन में रिटेल उत्पाद में संगीत बैंड)। परिणामी तालिका एक अन्य चुने हुए बैंड / उत्पाद के आधार पर एक बैंड / उत्पाद की सिफारिश कर सकती है। कोड का अगला भाग USER (या ग्राहक) आधारित सहयोगी फ़िल्टरिंग के साथ एक कदम आगे जाता है। इसका उत्पादन एक बड़ी तालिका है, जिसमें दिए गए उपयोगकर्ता / ग्राहक के लिए शीर्ष 100 बैंड / उत्पादों की सिफारिश की गई है
क्रिसड

कृपया आपको उत्तर दें और इस जानकारी को वहां जोड़ें, टिप्पणी अनुभाग में नहीं, धन्यवाद
कोस
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.