मेरे पास घटनाओं का एक डेटासेट है जो उसी समय के दौरान हुआ था। प्रत्येक घटना का एक प्रकार होता है (कुछ अलग प्रकार होते हैं, फिर कम दस) और एक स्थान, एक 2 डी बिंदु के रूप में दर्शाया जाता है।
मैं जांचना चाहूंगा कि क्या घटनाओं के प्रकार, या प्रकार और स्थान के बीच कोई संबंध है। उदाहरण के लिए, टाइप ए की घटनाएं आमतौर पर नहीं होती हैं जहां टाइप बी की घटनाएं होती हैं। या शायद किसी क्षेत्र में, प्रकार सी की ज्यादातर घटनाएं होती हैं।
इसे प्रदर्शन करने के लिए मैं किस प्रकार के टूल का उपयोग कर सकता हूं? सांख्यिकीय विश्लेषण में एक नौसिखिया होने के नाते, मेरा पहला विचार इस डेटासेट पर किसी प्रकार के पीसीए (प्रिंसिपल कंपोनेंट एनालिसिस) का उपयोग करना था, यह देखने के लिए कि क्या प्रत्येक प्रकार के ईवेंट का अपना घटक था, या शायद कुछ उसी को साझा किया गया था (यानी सहसंबद्ध थे)?
मुझे यह उल्लेख करना होगा कि मेरा डेटासेट 500'000 अंकों के क्रम का है , इस प्रकार चीजों से निपटना थोड़ा कठिन हो जाता है।
EDIT: जैसा कि नीचे दिए गए जवाबों और टिप्पणियों में दिया गया है, जाने का तरीका इसे एक चिह्नित बिंदु प्रक्रिया के रूप में मॉडल करना है, और फिर आर का उपयोग सभी भारी उठाने के लिए करना है, जैसा कि इस कार्यशाला की रिपोर्ट में विवरण में बताया गया है: http: / /www.csiro.edu.au/resources/Spatial-Point-Patterns-in-R.html