ओबामा के अभियान में डेटा खनन तकनीक


10

मुझे इस लेख में ओबामा के अभियान अभियान में डेटा माइनिंग टीम के बारे में पता चला। दुर्भाग्य से, लेख सांख्यिकीय एल्गोरिदम की वास्तविक मशीनरी के बारे में बहुत फजी है। हालाँकि, ऐसा लग रहा था कि सामान्य तकनीक सामाजिक और राजनीतिक विज्ञान में जानी जाती है। चूंकि यह मेरी विशेषज्ञता का क्षेत्र नहीं है, क्या कोई मुझे इस तरह की तकनीकों के बारे में (अवलोकन) साहित्य में इंगित कर सकता है?

जवाबों:


16

उस क्षेत्र को माइक्रोट्रैगेटिंग कहा जाता है (यदि आप इसके लिए गूगल करना चाहेंगे)। अभियान उनके उपकरण और प्रक्रियाओं के बारे में बहुत गोपनीय है, इसलिए मेरी जानकारी के लिए वहाँ इतना प्रकाशित हैल Malchow के सिवाय काम नहीं है लक्षित राजनीतिक (2008) या ग्रीन और गर्बर के (2008) हट जाओ वोट: कैसे मतदान बढ़ाएँ करने के लिए (उत्तरार्द्ध सौदों सामाजिक विज्ञान पहलुओं के साथ और अधिक जैसे कि क्या विज्ञापन प्रभावी और ऐसे हैं)।

अधिक तकनीकी मामलों पर साहित्य भी दुर्लभ है, लेकिन देखें, उदाहरण के लिए, मरे एंड स्काइम (2010) , राजनीतिक विश्लेषण पत्र इमाई और स्ट्रॉस (2011) ( पोस्टप्रिंट ) या रसेल, ली, द्वारा हाल ही में लागू सांख्यिकी पत्र के वार्षिक HORNIK, Jank और Zeileis (2013) ( postprint )। उन सभी में जो कुछ भी है वह यह है कि वे डेटा माइनिंग तकनीकों का उपयोग करते हैं, जो ज्यादातर पेड़ आधारित हैं।

मरे और स्काइम, CART जैसे मानक वर्गीकरण पेड़ों का उपयोग करते हैं।

रस्क एट अल। वर्गीकरण के पेड़, लॉजिस्टिक मॉडल और पेड़ों के एक संकर और लॉजिस्टिक प्रतिगमन का उपयोग करें। वे अपने पेड़ों के संकर के साथ तुलना करने के लिए बेतरतीब जंगलों, तंत्रिका नेटवर्क, समर्थन वेक्टर मशीनों और बायेसियन एडिटिव रिग्रेशन पेड़ों का भी उपयोग करते हैं, जैसा कि पेपर में रेज़िंडर में वर्णित है । उनके संकर पेड़ों ने अपने डेटा सेट पर उन अन्य तरीकों के साथ प्रदर्शन किया और बढ़ी हुई व्याख्या की पेशकश की (हम उनके कोड और डेटा को भी साझा करते हैं)।

इमाई और स्ट्रॉस दिलचस्प इंसोफर है क्योंकि वे इष्टतम अभियान योजना के लिए एक व्यापक निर्णय सिद्धांत संबंधी रूपरेखा प्रस्तुत करते हैं, न कि केवल दूसरों के रूप में माइक्रोटार्गेटिंग के लिए उपकरण। इस प्रकार वे अभियान में डाले गए प्रत्येक डॉलर का अधिकतम लाभ कैसे प्राप्त करें, इसके बारे में परिचालन अनुसंधान के पहलुओं पर बहुत ध्यान केंद्रित कर रहे हैं। उनके ढांचे के पहलू में जहां वे माइक्रोट्रैगेटिंग और टर्नआउट अनुमान के लिए सांख्यिकीय तकनीकों को नियुक्त करते हैं, वे फिर से वर्गीकरण पेड़ों पर भरोसा करते हैं।

इसलिए, कुछ सर्वसम्मति से प्रतीत होता है कि इस क्षेत्र में वृक्ष आधारित विधियों का उपयोग अच्छी तरह से काम करता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.