पिछली घटनाओं के समय के आधार पर, अगली घटना होने पर कैसे भविष्यवाणी करें?


19

मैं एक हाई स्कूल का छात्र हूँ और मैं एक कंप्यूटर प्रोग्रामिंग प्रोजेक्ट पर काम कर रहा हूँ, लेकिन मुझे हाई स्कूल के आँकड़ों से परे आँकड़ों और मॉडलिंग के डेटा का बहुत अनुभव नहीं है इसलिए मैं थोड़े उलझन में हूँ।

मूल रूप से, मेरे पास एक यथोचित बड़ी सूची है (किसी भी सांख्यिकीय परीक्षण या उपायों के लिए मान्यताओं को पूरा करने के लिए यह काफी बड़ा है) कि किसी ने एक दस्तावेज़ मुद्रित करने का फैसला किया। इस सूची के आधार पर, मैं कुछ प्रकार के एक सांख्यिकीय मॉडल का निर्माण करना चाहूंगा जो कि पिछली घटना के समय में दिए गए अगले प्रिंट कार्य के लिए सबसे संभावित समय की भविष्यवाणी करेगा।

मैं पहले से ही पढ़ा है यह , लेकिन जवाब वास्तव में क्या मैं अपने प्रोजेक्ट के लिए मन में है के साथ बाहर की मदद नहीं करते। मैंने कुछ अतिरिक्त शोध किए और पाया कि एक छिपे हुए मार्कोव मॉडल ने मुझे सटीक रूप से ऐसा करने की अनुमति दी होगी, लेकिन मैं केवल एक बार की सूची का उपयोग करके छिपे हुए मार्कोव मॉडल को उत्पन्न करने के तरीके के बारे में लिंक नहीं पा सकता हूं। मैंने यह भी पाया कि सूची में एक कलमन फ़िल्टर का उपयोग करना उपयोगी हो सकता है, लेकिन मूल रूप से, मैं किसी ऐसे व्यक्ति से इसके बारे में कुछ और जानकारी प्राप्त करना चाहूंगा जो वास्तव में उनका उपयोग करता है और बस कुछ करने की कोशिश करने और काम करने की उम्मीद करने से पहले उनकी सीमाओं और आवश्यकताओं को जानता है।

बहुत बहुत धन्यवाद!


1
+1 यह एक सुविचारित, सुविचारित प्रश्न है, अंकुश। मुझे उम्मीद है कि आपको कुछ बेहतरीन प्रतिक्रियाएं मिलेंगी। हमारी साइट पर आपका स्वागत है!
whuber

शीर्षक को ठीक करने के लिए धन्यवाद - मैं चीजों को अधिक सुसंगत बनाने की कोशिश करने के लिए चारों ओर घूम रहा था और मुझे लगता है कि मैंने इसे समाप्त कर दिया है, यह बिल्कुल भी समझ में नहीं आता है! उम्मीद है कि उपयुक्त ज्ञान रखने वाला कोई मदद कर सकता है।
अंकुशग

जवाबों:


10

छिपे हुए मार्कोव मॉडल लागू होते हैं, यदि डेटा कुछ अंतर्निहित अनबॉर्स्ड मार्कोव मॉडल से यादृच्छिक उत्सर्जन थे; मैं उस पर शासन नहीं करूंगा, लेकिन यह बहुत स्वाभाविक मॉडल नहीं है।

मैं बिंदु प्रक्रियाओं के बारे में सोचूंगा , जो आपके विशेष डेटा से अच्छी तरह मेल खाते हैं। भूकंप की भविष्यवाणी पर बहुत काम है (हालांकि मुझे इसके बारे में ज्यादा जानकारी नहीं है) और यहां तक ​​कि अपराध भी ।

यदि कई अलग-अलग लोग मुद्रण कर रहे हैं, और आप केवल बार-बार देख रहे हैं, लेकिन अलग-अलग पहचान नहीं है, तो एक पॉइसन प्रक्रिया अच्छी तरह से काम कर सकती है (कई स्वतंत्र बिंदु प्रक्रियाओं का सुपरपोज़िशन लगभग पॉइज़न है), हालांकि यह अमानवीय होना होगा ( एक बिंदु का मौका समय के साथ बदलता रहता है): लोगों को दोपहर 3 बजे की तुलना में 3 बजे मुद्रण करने की संभावना कम होती है।

के लिए inhomogeneous प्वासों प्रक्रिया मॉडल, कुंजी किसी खास दिन पर एक विशेष समय पर एक मुद्रण कार्य का मौका का एक अच्छा अनुमान हो रही होगी।

यदि ये प्रिंट समय एक कक्षा में छात्रों के लिए हैं, हालांकि, यह काफी मुश्किल हो सकता है, क्योंकि वे स्वतंत्र होने की संभावना नहीं रखते हैं और इसलिए पॉइसन प्रक्रिया अच्छी तरह से काम नहीं करेगी।

यहां अपराध आवेदन पर एक पेपर का लिंक दिया गया है।


इसके लिए धन्यवाद। क्या आप किसी बिंदु प्रक्रिया के लिए एक मॉडल बनाने का कोई तरीका जानते हैं? यह सबसे अधिक प्रासंगिक लगता है, लेकिन मैं आंकड़ों में अच्छी तरह से वाकिफ नहीं हूं, इसलिए यह सब भ्रमित करने वाला प्रतीत होता है (पॉइज़न बनाम निर्धारक बनाम कॉक्स?) जब मैं विकिपीडिया पढ़ रहा हूं ...: - \
akushg

@ Unk - मैं डेटा के कुछ प्लॉट बनाकर शुरू करूँगा। प्रिंट समय की यह सूची कितनी लंबी है?
कार्ल

यह लगभग एक साल के डेटा के लायक है। मैं कुछ भूखंड बनाऊंगा और आपको बताऊंगा कि यह कैसे चलता है।
अंकुश

1

मल्टीवेरेट बायेसियन स्कैन स्टेटिस्टिक (एमबीएसएस) का उपयोग करके संभावित समय की भविष्यवाणी के आधार पर सहायता की जा सकती है। इस MBSS को घटना का पता लगाने की समयबद्धता और सटीकता में सुधार करने का लाभ है।


साइट में आपका स्वागत है, @ ईसान। क्या आप MBSS के बारे में और कह सकते हैं कि यह कैसे काम करता है, और यह कैसे मदद करेगा?
गंग -
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.