मैं एक सूत्र, विधि, या मॉडल को खोजने की कोशिश कर रहा हूं ताकि संभावना का विश्लेषण किया जा सके कि एक विशिष्ट घटना ने कुछ अनुदैर्ध्य डेटा को प्रभावित किया है। मुझे मुश्किल से पता चल रहा है कि Google पर क्या खोजना है।
यहाँ एक उदाहरण है:
छवि आप एक ऐसे व्यवसाय के मालिक हैं, जिसमें हर दिन औसतन 100 वॉक-इन ग्राहक हैं। एक दिन, आप तय करते हैं कि आप प्रत्येक दिन अपने स्टोर पर आने वाले ग्राहकों की संख्या में वृद्धि करना चाहते हैं, इसलिए आप ध्यान पाने के लिए अपनी दुकान के बाहर एक पागल स्टंट करते हैं। अगले सप्ताह में, आप एक दिन में औसतन 125 ग्राहक देखते हैं।
अगले कुछ महीनों में, आप फिर से निर्णय लेते हैं कि आप कुछ और व्यवसाय प्राप्त करना चाहते हैं, और शायद इसे थोड़ी देर तक बनाए रखना है, इसलिए आप अपने स्टोर में अधिक ग्राहक प्राप्त करने के लिए कुछ अन्य यादृच्छिक चीजों की कोशिश करते हैं। दुर्भाग्य से, आप सबसे अच्छे बाज़ारिया नहीं हैं, और आपकी कुछ रणनीति का बहुत कम या कोई प्रभाव नहीं है, और दूसरों पर भी नकारात्मक प्रभाव पड़ता है।
मैं किस कार्यप्रणाली का उपयोग इस संभावना को निर्धारित करने के लिए कर सकता हूं कि किसी एक व्यक्तिगत घटना ने वॉक-इन ग्राहकों की संख्या को सकारात्मक या नकारात्मक रूप से प्रभावित किया है? मैं पूरी तरह से जानता हूं कि सहसंबंध आवश्यक रूप से समान कार्य नहीं करता है, लेकिन ग्राहक की विशिष्ट घटना के बाद आपके व्यवसाय के दैनिक चलने में संभावित वृद्धि या कमी को निर्धारित करने के लिए मैं किन तरीकों का उपयोग कर सकता हूं?
मुझे इस बात का विश्लेषण करने में कोई दिलचस्पी नहीं है कि वॉक-इन ग्राहकों की संख्या बढ़ाने के आपके प्रयासों के बीच सहसंबंध है या नहीं, बल्कि किसी एक घटना को, जो अन्य सभी से स्वतंत्र है या नहीं, प्रभावकारी था।
मुझे एहसास है कि यह उदाहरण बल्कि आकस्मिक और सरलीकृत है, इसलिए मैं आपको वास्तविक डेटा का संक्षिप्त विवरण भी दूंगा जो मैं हूं:
मैं उस प्रभाव को निर्धारित करने का प्रयास कर रहा हूं जो एक विशेष विपणन एजेंसी के पास अपने ग्राहक की वेबसाइट पर होता है जब वे नई सामग्री प्रकाशित करते हैं, सोशल मीडिया अभियान करते हैं, आदि। किसी एक विशिष्ट एजेंसी के लिए, उनके पास 1 से 500 क्लाइंट तक कहीं भी हो सकते हैं। प्रत्येक ग्राहक में 5 पृष्ठों से लेकर 1 मिलियन से अधिक तक की वेबसाइटें होती हैं। पिछले 5 वर्षों के दौरान, प्रत्येक एजेंसी ने प्रत्येक ग्राहक के लिए अपने सभी कामों की व्याख्या की है, जिसमें काम का प्रकार, किया गया एक वेबसाइट पर वेबपृष्ठों की संख्या, जो प्रभावित हुए थे, खर्च किए गए घंटे की संख्या आदि।
उपरोक्त डेटा का उपयोग करना, जिसे मैंने एक डेटा वेयरहाउस में इकट्ठा किया है (स्टार / स्नोफ्लेक स्कीमा के एक समूह में रखा गया है), मुझे यह निर्धारित करने की आवश्यकता है कि यह कितना संभव था कि किसी एक काम का एक टुकड़ा (समय में किसी एक घटना) पर प्रभाव पड़ा। किसी विशिष्ट कार्य से प्रभावित किसी भी / सभी पृष्ठों को टकराने वाला ट्रैफ़िक। मैंने 40 अलग-अलग प्रकार की सामग्री के लिए मॉडल बनाए हैं जो एक वेबसाइट पर पाए जाते हैं जो विशिष्ट ट्रैफ़िक पैटर्न का वर्णन करता है एक पृष्ठ जिसमें वर्तमान समय तक लॉन्च तिथि से सामग्री प्रकार का अनुभव हो सकता है। उपयुक्त मॉडल के सापेक्ष सामान्यीकृत, मुझे काम के एक विशिष्ट टुकड़े के परिणाम के रूप में प्राप्त एक विशिष्ट पृष्ठ पर बढ़ी हुई या कम आगंतुकों की उच्चतम और निम्नतम संख्या निर्धारित करने की आवश्यकता है।
जबकि मेरे पास बुनियादी डेटा विश्लेषण (रैखिक और कई प्रतिगमन, सहसंबंध, आदि) के साथ अनुभव है, मैं इस समस्या को हल करने के तरीके के लिए एक नुकसान में हूं। जबकि अतीत में मैंने आम तौर पर किसी दिए गए अक्ष के लिए कई मापों के साथ डेटा का विश्लेषण किया है (उदाहरण के लिए तापमान बनाम प्यास बनाम जानवर और प्यास पर प्रभाव को निर्धारित किया है कि जानवरों में वृद्धि हुई है), मुझे लगता है कि ऊपर, मैं प्रभाव का विश्लेषण करने का प्रयास कर रहा हूं एक गैर-रेखीय, लेकिन अनुमानित (या कम से कम मॉडल-सक्षम), अनुदैर्ध्य डेटासेट के लिए कुछ समय में एक ही घटना। मैं स्तब्ध हूं :(
कोई भी मदद, टिप्स, पॉइंटर्स, सिफारिशें, या निर्देश बेहद मददगार होंगे और मैं सदा आभारी रहूंगा!