मेरे पास कई प्रविष्टियों के साथ एक पांडा डेटा फ्रेम है, और मैं कुछ प्रकार की दुकानों की आय के बीच सहसंबंध की गणना करना चाहता हूं। आय डेटा के साथ कई स्टोर हैं, गतिविधि के क्षेत्र का वर्गीकरण (थिएटर, कपड़ा स्टोर, भोजन ...) और अन्य डेटा।
मैंने एक नया डेटा फ़्रेम बनाने और सभी प्रकार के स्टोरों की आय के साथ एक कॉलम सम्मिलित करने का प्रयास किया, जो एक ही श्रेणी के हैं, और रिटर्निंग डेटा फ़्रेम में केवल पहला कॉलम भरा है और शेष NaN से भरा है। कोड है कि मैं थक गया:
corr = pd.DataFrame()
for at in activity:
stores.loc[stores['Activity']==at]['income']
मैं ऐसा करना चाहता हूं, इसलिए मैं .corr()
स्टोर की श्रेणी के बीच सहसंबंध मैट्रिक्स को देने के लिए उपयोग कर सकता हूं ।
उसके बाद, मैं जानना चाहता हूं कि मैं मैट्रिक्स मूल्यों (-1 से 1) को कैसे प्लॉट कर सकता हूं, क्योंकि मैं मेटपॉलिब के साथ पियर्सन के सहसंबंध का उपयोग करना चाहता हूं)।