यह एक कला और विज्ञान दोनों है। अध्ययन के विशिष्ट क्षेत्र मार्केट बास्केट विश्लेषण (जिसे आत्मीयता विश्लेषण भी कहा जाता है) के चारों ओर घूमते हैं जो डेटा माइनिंग के क्षेत्र का सबसेट है। ऐसी प्रणाली में विशिष्ट घटकों में प्राथमिक चालक वस्तुओं की पहचान और आत्मीयता वस्तुओं की पहचान (एक्सेसरी अपसेल, क्रॉस सेल) शामिल हैं।
उन डेटा स्रोतों को ध्यान में रखें जो उन्हें मेरे पास हैं ...
- खरीदी गई खरीदारी की गाड़ियां = असली वस्तुओं पर खर्च किए गए वास्तविक लोगों से वास्तविक धन = शक्तिशाली डेटा और बहुत सारा।
- आइटम कार्ट में जोड़े गए लेकिन छोड़ दिए गए।
- मूल्य निर्धारण प्रयोगों ऑनलाइन (ए / बी परीक्षण, आदि) जहां वे विभिन्न कीमतों पर एक ही उत्पाद प्रदान करते हैं और परिणाम देखते हैं
- पैकेजिंग प्रयोग (ए / बी परीक्षण, आदि) जहां वे विभिन्न "बंडलों" में विभिन्न उत्पादों की पेशकश करते हैं या वस्तुओं के विभिन्न युग्मों को छूट देते हैं
- विशलिस्ट्स - उन पर आपके लिए विशेष रूप से क्या है - और कुल मिलाकर इसे टोकरी विश्लेषण डेटा की एक और धारा के समान माना जा सकता है
- रेफरल साइटें (आप कहां से आई हैं इसकी पहचान ब्याज की अन्य वस्तुओं को इंगित कर सकती है)
- विदाई का समय (आप कितनी देर पहले वापस क्लिक करें और एक अलग आइटम चुनें)
- आपके या आपके सोशल नेटवर्क / सर्किल खरीदने वालों की रेटिंग - यदि आप अपनी पसंद की चीज़ों को रेट करते हैं, तो आपको जो पसंद है वह अधिक मिलता है और यदि आप "मैं पहले से ही इसका मालिक हूं" बटन की पुष्टि करते हैं, तो वे आपकी पूरी प्रोफ़ाइल बनाते हैं
- जनसांख्यिकी जानकारी (आपका शिपिंग पता, आदि) - वे जानते हैं कि आपके बच्चों, अपने जीवनसाथी, आदि के लिए आपके सामान्य क्षेत्र में क्या लोकप्रिय है।
- उपयोगकर्ता विभाजन = क्या आपने एक बच्चे के लिए अलग-अलग महीनों में 3 किताबें खरीदी थीं? संभावना एक बच्चा है या अधिक .. आदि।
- प्रत्यक्ष विपणन डेटा के माध्यम से क्लिक करते हैं - क्या आपको उनसे एक ईमेल मिला और क्लिक करें? वे जानते हैं कि यह कौन सा ईमेल था और आपने इसके माध्यम से क्या क्लिक किया था और क्या आपने इसे परिणामस्वरूप खरीदा था।
- सत्र में पथ पर क्लिक करें - आपने अपनी गाड़ी में जाने की परवाह किए बिना क्या देखा
- अंतिम खरीद से पहले एक आइटम को देखने की संख्या
- यदि आप एक ईंट और मोर्टार स्टोर के साथ काम कर रहे हैं, तो उनके पास आपकी भौतिक खरीद का इतिहास भी हो सकता है (यानी खिलौने आर या कुछ ऐसा है जो ऑनलाइन है और एक भौतिक स्टोर भी है)
- आदि आदि।
सौभाग्य से लोग समान रूप से व्यवहार करते हैं, इसलिए जितना अधिक वे बड़े पैमाने पर खरीदने वाली आबादी के बारे में जानते हैं उतना ही बेहतर वे जानते हैं कि वे क्या करेंगे और नहीं बेचेंगे और हर लेनदेन के साथ और हर रेटिंग / इच्छा सूची में जोड़ें / ब्राउज़ करें कि वे जानते हैं कि कैसे अधिक व्यक्तिगत रूप से दर्जी की सिफारिशों के लिए। ध्यान रखें कि यह केवल सिफारिशों, आदि में समाप्त होने वाले प्रभावों के पूर्ण सेट का एक छोटा सा नमूना है।
अब मुझे इस बारे में कोई जानकारी नहीं है कि अमेज़ॅन कैसे व्यापार करता है (कभी वहां काम नहीं किया) और मैं जो कुछ कर रहा हूं वह ऑनलाइन कॉमर्स की समस्या के शास्त्रीय दृष्टिकोण के बारे में बात कर रहा है - मैं पीएम हुआ करता था जो Microsoft के लिए डेटा माइनिंग और एनालिटिक्स पर काम करता था वाणिज्य सर्वर नामक उत्पाद। हमने कॉमर्स सर्वर में शिप किया है, जो लोगों को समान क्षमताओं वाली साइटें बनाने की अनुमति देता है .... लेकिन बिक्री जितनी बड़ी है डेटा उतना ही बेहतर मॉडल - और अमेज़न बड़ा है। मैं केवल कल्पना कर सकता हूं कि एक कॉमर्स संचालित साइट में उस डेटा के साथ मॉडल के साथ खेलना कितना मजेदार है। अब उनमें से कई एल्गोरिदम (जैसे कि कॉमर्स सर्वर में शुरू होने वाले भविष्यवक्ता) सीधे Microsoft SQL के भीतर रहने के लिए चले गए हैं ।
चार बड़े लेने के तरीके आपके पास होने चाहिए:
- अमेज़ॅन (या कोई भी रिटेलर) टन के लेन-देन और लोगों के टन के लिए समग्र डेटा को देख रहा है ... यह उन्हें अपनी साइट पर अनाम उपयोगकर्ताओं के लिए बहुत अच्छी तरह से सिफारिश करने की अनुमति देता है।
- अमेज़ॅन (या कोई भी परिष्कृत रिटेलर) किसी के भी व्यवहार और खरीद को ट्रैक कर रहा है जो लॉग इन कर रहा है और इसका उपयोग कर रहा है जो बड़े पैमाने पर कुल डेटा के ऊपर शोधन कर सकता है।
- अक्सर संचित डेटा की सवारी करने और विशिष्ट लाइनों के उत्पाद प्रबंधकों के लिए सुझावों का "संपादकीय" नियंत्रण लेने का एक साधन होता है (जैसे कुछ व्यक्ति जो 'डिजिटल कैमरों के लंबवत या' रोमांस के उपन्यास 'ऊर्ध्वाधर या समान) के मालिक हैं, जहां वे वास्तव में हैं विशेषज्ञ हैं
- अक्सर प्रचार सौदे होते हैं (यानी सोनी या पैनासोनिक या निकॉन या कैनन या स्प्रिंट या वेरिज़न, रिटेलर को अतिरिक्त पैसा देता है, या उन पंक्तियों में बड़ी मात्रा में या अन्य चीजों पर बेहतर छूट देता है) जो कुछ "सुझावों" को जन्म देगा। दूसरों की तुलना में सबसे अधिक बार - प्रत्येक लेन-देन या थोक लागत को कम करने आदि पर लक्षित कुछ व्यावसायिक तर्क और व्यावसायिक कारण हमेशा इसके पीछे होते हैं।
वास्तविक कार्यान्वयन के संदर्भ में? लगभग सभी बड़े ऑनलाइन सिस्टम पाइपलाइनों के कुछ सेट (या एक फिल्टर पैटर्न कार्यान्वयन या एक वर्कफ़्लो, इत्यादि को उबालते हैं, जिसे आप कहते हैं कि आप क्या कहेंगे) जो किसी संदर्भ के लिए मॉड्यूल की एक श्रृंखला द्वारा मूल्यांकन करने की अनुमति देते हैं जो किसी न किसी रूप में लागू होते हैं व्यापार का तर्क।
आमतौर पर पृष्ठ पर प्रत्येक अलग कार्य के साथ एक अलग पाइपलाइन जुड़ी होगी - आपके पास एक ऐसा हो सकता है जो "पैकेज / अपशेल्ट" की सिफारिश करता है (यानी आप जिस वस्तु को देख रहे हैं उसके साथ इसे खरीदें) और एक जो "विकल्प" (यानी खरीदते हैं) यह उस चीज़ के बजाय जो आप देख रहे हैं) और दूसरा जो आपकी इच्छा सूची (उत्पाद श्रेणी या समान) से सबसे अधिक निकटता से संबंधित वस्तुओं को खींचता है।
इन पाइपलाइनों के परिणाम पृष्ठ के विभिन्न भागों (स्क्रॉल पट्टी के ऊपर, स्क्रॉल के नीचे, बाईं ओर, दाईं ओर, अलग-अलग फ़ॉन्ट, विभिन्न आकार के चित्र, आदि) पर रखे जा सकते हैं और यह देखने के लिए परीक्षण किया जाता है कि कौन सा प्रदर्शन श्रेष्ठ। चूँकि आप इन पाइपलाइनों के लिए व्यावसायिक तर्क को प्लग और प्ले करने के लिए अच्छा आसान उपयोग कर रहे हैं, जो कि आप इन पाइपलाइनों के लिए व्यावसायिक तर्क को परिभाषित करते हैं, जो कि लेगो ब्लॉकों के नैतिक समकक्ष के साथ समाप्त होती हैं, जो आपके द्वारा लागू किए गए व्यावसायिक तर्क को चुनना और चुनना आसान होता है जब आप एक और पाइपलाइन का निर्माण करते हैं। जो तेजी से नवाचार, अधिक प्रयोग और अंत में उच्च लाभ की अनुमति देता है।
क्या इससे मदद मिली? आशा है कि आप थोड़ा सा अंतर्दृष्टि दें कि यह सामान्य रूप से किसी भी ईकॉमर्स साइट के लिए कैसे काम करता है - केवल अमेज़ॅन नहीं। अमेज़ॅन (वहां काम करने वाले दोस्तों से बात करने से) बहुत डेटा संचालित है और लगातार उपयोगकर्ता के अनुभव और मूल्य निर्धारण, प्रचार, पैकेजिंग, आदि की प्रभावशीलता को मापता है - वे ऑनलाइन एक बहुत ही परिष्कृत रिटेलर हैं और अग्रणी के किनारे पर होने की संभावना है बहुत सारे एल्गोरिदम वे लाभ का अनुकूलन करने के लिए उपयोग करते हैं - और वे संभावित मालिकाना रहस्य हैं (आप केएफसी के गुप्त मसालों के फार्मूले की तरह जानते हैं) और इस तरह से निर्देशित।