मेरे पास सबसे लोकप्रिय संगीत कलाकारों के बारे में कुछ दिलचस्प आंकड़े हैं जो स्थान के आधार पर लगभग 200 कांग्रेस जिलों में विभाजित हैं। मैं यह देखना चाहता हूं कि क्या यह संभव है कि किसी व्यक्ति को उसकी संगीत वरीयताओं को चुना जाए और यह निर्धारित किया जाए कि वह "एक डेमोक्रेट की तरह सुनता है" या "एक रिपब्लिकन की तरह सुनता है।" (स्वाभाविक रूप से यह हल्के दिल का है, लेकिन डेटा में वास्तविक एन्ट्रॉपी है!)
मेरे पास लगभग 100 कलाकारों का डेटा है, साथ ही पिछले तीन चुनाव चक्रों में प्रत्येक जिले में रिपब्लिकन और डेमोक्रेट के लिए औसत प्रतिशत वोट हैं। इसलिए मैंने प्रत्येक कलाकार पर एक सहसंबंध चलाया, यह देखने के लिए कि डेमोक्रेटस के लिए वोट शेयर के एक समारोह के रूप में कौन-सी सबसे अधिक सुनी-सुनाई गई। वे सहसंबंध किसी भी दिए गए कलाकार के लिए लगभग -0.3 से 0.3 तक चलते हैं, बीच में बहुत सारे जिनके पास कोई पूर्वानुमानित शक्ति नहीं है।
मेरे पास दो प्रश्न हैं: पहला, प्रति जिले धाराओं की कुल संख्या व्यापक रूप से भिन्न होती है। अभी, मैं प्रति जिले से संबंधित सभी धाराओं के प्रतिशत का उल्लेख कर रहा हूं, जैसे कि, बीओनसेक, डेमोक्रेट के लिए डाले गए वोटों के प्रतिशत के खिलाफ। लेकिन एक जिले में कुल धाराएँ लाखों में हो सकती हैं, जबकि दूसरी निम्न 100,000 में है। क्या मुझे इसके लिए किसी तरह सहसंबंध को वजन करने की आवश्यकता है?
दूसरा, मैं उत्सुक हूं कि इन सहसंबंधों को उपयोगकर्ता की राजनीति के रूप में एक समग्र अनुमान में कैसे संयोजित किया जाए। मान लें कि मैं 20 कलाकारों को उच्चतम पूर्ण सहसंबंधी मूल्यों (सकारात्मक और नकारात्मक) के साथ लेता हूं, प्रत्येक दिशा में दस, और प्रत्येक कलाकार को कितना पसंद है, इस पर एक उपयोगकर्ता को परागित करता है। इसलिए मेरे पास प्रत्येक कलाकार के वोटों के ऊपर या नीचे हैं और सभी 20 मूल्यों के लिए राजनीति से संबंध हैं। क्या इन अनुमानों को एक अनुमान में संयोजित करने का एक मानक तरीका है? (मैं NYTimes की प्रसिद्ध बोली क्विज़ की तरह कुछ सोच रहा हूँ , जहाँ इसने 25 सवालों के लिए क्षेत्रीय संभावनाओं को हीट मैप में जोड़ा है। लेकिन इस मामले में, मुझे सिर्फ एक मूल्य की आवश्यकता है कि डेमोक्रेटिक या रिपब्लिकन संगीत में किसी का स्वाद कैसा है।
धन्यवाद!