एसई योगदानकर्ताओं की "अच्छी तरह गोल-गोल" को कैसे मापें?


12

स्टैक एक्सचेंज, जैसा कि हम सभी जानते हैं, यह विविध विषयों के साथ क्यू एंड ए साइटों का एक संग्रह है। यह मानते हुए कि प्रत्येक साइट एक दूसरे से स्वतंत्र है, यह देखते हुए कि एक उपयोगकर्ता के पास, अगले आदमी की तुलना में उसकी "अच्छी तरह गोल-गोल" की गणना कैसे करें? मुझे कौन सा सांख्यिकीय उपकरण नियुक्त करना चाहिए?

ईमानदार होने के लिए, मुझे नहीं पता कि गणितीय रूप से "अच्छी तरह से गोलाई" को कैसे परिभाषित किया जाए, लेकिन इसमें निम्नलिखित विशेषताएं होनी चाहिए:

  1. सभी चीजें समान हैं, एक उपयोगकर्ता के पास जितने अधिक प्रतिनिधि हैं, वह उतना ही अच्छी तरह गोल है
  2. सभी चीजें समान हैं, जितने अधिक उपयोगकर्ता एक उपयोगकर्ता के रूप में भाग लेते हैं, वह उतना ही अच्छी तरह गोल है।
  3. उत्तर या प्रश्न अच्छी तरह से गोलाई को प्रभावित नहीं करता है

आप एसई के संदर्भ में "अच्छी तरह से गोल-गोल" को कैसे परिभाषित करेंगे, सबसे पहले?
जेएम

@ जेएम, मुझे नहीं पता, इसीलिए मुझे उम्मीद है कि समुदाय अवधारणाओं को थोड़ा और बढ़ाने में मदद करेगा।
ग्रेविटॉन

1
घुटने टेकने वाली पीसी पुलिस में से एक की तरह लगने के जोखिम में - चलो उन महिलाओं को शामिल किया जाए जो हमारी साइट पर आती हैं। @ ग्रेविटन, आपके सभी संदर्भ पुरुषों के लिए हैं।
rolando2

उपयोगकर्ता आईडी द्वारा अच्छी तरह से परिभाषित की गई गोल-गोलता आपको किसी योगदानकर्ता की अच्छी तरह से पूर्णता के बारे में नहीं बताती है , क्योंकि एक योगदानकर्ता के पास अलग-अलग एसई के लिए अलग-अलग उपयोगकर्ता आईडी हो सकते हैं। कुछ उपयोगकर्ता आईडी का उपयोग एक से अधिक योगदानकर्ता द्वारा भी किया जा सकता है (उदाहरण के लिए, एक खाता साझा करने वाले साझेदार)।
एलेक्सिस

जवाबों:


7

आपको साइटों के बीच समानता के लिए भी ध्यान देने की आवश्यकता है। कोई है जो StackOverflow और Seasoned सलाह पर भाग लेता है, तो SO और CrossValidated में भाग लेने वाले किसी व्यक्ति की तुलना में अधिक अच्छी तरह से गोल है, जो बदले में (SO बहस करेगा) SO और प्रोग्रामर में भाग लेने वाले व्यक्ति की तुलना में अधिक अच्छी तरह गोल है । ऐसा करने के लिए निस्संदेह कई तरीके हैं, लेकिन आप इसके लिए एक महसूस पाने के लिए अतिव्यापी पंजीकरण की जांच कर सकते हैं।


1
@ मट्ट पार्कर, अच्छे बिंदु - यदि प्रतिनिधि मीट्रिक का हिस्सा है, तो मुझे भी लगता है कि आपको यह देखने की आवश्यकता है कि प्रतिनिधि कैसे प्राप्त किया गया था। एक व्यक्ति जिसने बहुत सारे प्रश्नों / उत्तरों पर छोटे लाभ से अपना प्रतिनिधि प्राप्त किया, संभवतः एक ऐसे व्यक्ति की तुलना में अधिक अच्छी तरह गोल हो जाएगा जिसने एक ही प्रश्न पर एक ही रिपीट प्राप्त किया, जिसने एक टन तक के वोट प्राप्त किए।
DQdlM

3
@ केनी यह एक अच्छा बिंदु है और मुझे लगता है कि जिस तरह से आपने कहा है कि यह सही है - लेकिन मुझे लगता है कि बहुत से अति-वोट वाले प्रश्न और उत्तर अक्सर कम से कम विशेषज्ञता के संकेत होते हैं, जबकि वास्तव में बहुत अच्छे तकनीकी सवालों के जवाब अच्छे होते हैं बहुत कम वोट।
मैट पार्कर

1
उदाहरण के लिए, व्हिबर के उत्तर देखें। उनके उत्तर समान रूप से उत्कृष्ट हैं, इसलिए उनके उच्च श्रेणी के उत्तरों और उनके 1-मतदाताओं के बीच क्या अंतर है? जब मैं पूर्व को देखता हूं, तो मैं उन सवालों के शानदार जवाब देखता हूं जो मुझे समझ में आते हैं; उत्तरार्द्ध में, शानदार सवालों के जवाब जो मुझे भी नहीं लगते हैं। तो कम-वोट वाले उत्तर वास्तव में गहरी विशेषज्ञता के संकेत हो सकते हैं (लेकिन ध्यान दें: यदि आप उत्सुक हैं कि एक अच्छी तरह गोल एसई उपयोगकर्ता कैसा दिखता है, तो यह है )।
मैट पार्कर

1
वास्तव में, @Graviton, बहु-साइट उपयोगकर्ताओं की तलाश करने में समझदारी हो सकती है जिन्हें आप अच्छी तरह से गोल मानेंगे और देखेंगे कि वे आपके विभिन्न मैट्रिक्स में कैसा प्रदर्शन करते हैं।
मैट पार्कर

1
@KennyPeanuts, ऊपर दिए गए @ मैट के बिंदु को पूरक करने के लिए, एसई साइटों पर उपयोगकर्ताओं की एक प्रशंसनीय संख्या भी प्रतीत होती है, जो कई जबरदस्त सवालों का जवाब देते हैं, फिर भी कुछ अपडाउन करते हैं। यह आमतौर पर विशेषज्ञता या सांकेतिकता का संकेत नहीं है। (हालांकि, यह है गार्नर "प्रतिष्ठा" के लिए सबसे आसान रणनीतियों में से एक)।
कार्डिनल

6

उदाहरण: कहते हैं कि तीन साइटें हैं, और हम उपयोगकर्ताओं A, B, C. की अच्छी तरह से गोलाई की तुलना करना चाहते हैं। हम वेक्टर फॉर्म में तीन साइटों में उपयोगकर्ताओं की प्रतिष्ठा लिखते हैं:

उपयोगकर्ता A: [२३, २३, ०]

उपयोगकर्ता बी: [१५, १५, ०]

उपयोगकर्ता सी: [१०, १०, १०]

हम बी की तुलना में अधिक अच्छी तरह गोल होंगे (उनकी प्रतिष्ठा दोनों साइटों पर समान रूप से फैली हुई है, लेकिन ए की कुल प्रतिष्ठा अधिक है)। साथ ही, हम C को B की तुलना में अधिक अच्छी तरह से गोल मानेंगे (उनकी समान कुल प्रतिष्ठा है, लेकिन C का और भी साइटों पर प्रसार है।) यह अनिर्दिष्ट है कि क्या A को C से अधिक अच्छी तरह से गोल माना जाए, या इसके विपरीत। ।

चलो , एक्स बी , एक्स सी ऊपर प्रतिष्ठा वैक्टर क्रमशः।xAxBxC

f(x)ff(xA)>f(xB)f(xC)>f(xB)

f(x)

उत्तल कार्यों के दो सामान्य उदाहरण 'आंशिक मानक' हैं

f([x1,...,xm])=ixip

0<p<1

p=1/2

f(xA)=2239.6
f(xB)=2157.7
f(xC)=3109.5

1/2

f

f([x1,...,xm])=ixilog(xi/c).

c=ixi

f

f(xA)=46log(2)31.9
f(xB)=30log(2)20.8
f(xC)=30log(3)33.0

मापी गई शैनन एंट्रोपी के अनुसार, तब, हम कहेंगे कि सी तीन में से सबसे अच्छी तरह से गोल है, और दूसरा सबसे अच्छी तरह से गोल है।

f(x)

EDIT2: व्हिबर की टिप्पणी के प्रकाश में एक उदाहरण जोड़ा गया।


f

f[1,101]f

जब कोई भी x_i <0. शैनन एन्ट्रापी विफल हो जाता है, तो किसी भी x_i / c sense 0. के बिना आंशिक मानदंड अपरिभाषित होता है, इसका मतलब यह नहीं है कि जब x_i 0 से-from में बदलता है, तो अच्छी तरह से गोलाई का माप अचानक उड़ जाएगा।
२००:३_ को २

4

यह वास्तव में एक दिलचस्प सवाल है (वास्तव में स्टैक एक्सचेंज साइटों को सामान्य रूप से मॉडलिंग करने के विचार से मुझे कुछ हद तक प्यार है)।

अच्छी तरह से गोल-मटोल के मुद्दे पर, इसका आकलन करने का एक तरीका उन टैगों के माध्यम से होगा जो विशेष रूप से उपयोगकर्ताओं को जवाब देने के लिए करते हैं, और साइटों पर उनके वितरण। उदाहरण यह स्पष्ट कर सकते हैं।

मैं TeX, StackOverflow, CrossValidated और AskUbuntu पर एक सदस्य हूं। अब, मैं वास्तव में केवल यहाँ और StackOverflow में योगदान देता हूं, और केवल Stackoverflow पर R के बारे में। इसलिए, अच्छी तरह से गोलाई को परिभाषित करने के लिए मैं a) उन टैगों की मात्रा को देखूंगा, जो दो साइटों में सामान्य हैं (साइटों के बीच समानता को परिभाषित करने के लिए) और एक उपयोगकर्ता उन साइटों पर प्रश्नों का उत्तर देता है जिनके सामान्य में बहुत कम या कोई टैग हैं।

यदि, उदाहरण के लिए, कोई StackOverflow और खाना पकाने पर पायथन टैग में योगदान देता है, तो वह व्यक्ति उस व्यक्ति की तुलना में अधिक अच्छी तरह से गोल है, जो यहां अतिप्रवाह और सांख्यिकी प्रश्नों पर सांख्यिकीय सॉफ्टवेयर प्रश्नों (उदाहरण के लिए) के सवालों का जवाब दे रहा है।

मुझे उम्मीद है कि यह कुछ हद तक मददगार है।


4
(+1) कोई है जो SO और खाना पकाने दोनों पर पायथन टैग में योगदान दे रहा है, भोजन में कुछ विदेशी स्वाद है :-) मैंने सुना है कि यह चिकन की तरह स्वाद है।
whuber

3

यदि आप कई अलग-अलग स्टाॅक एक्सचेंज साइट्स में योगदान के रूप में 'अच्छी तरह गोल-गोल' को परिभाषित करते हैं, तो मैं प्रति साइट योगदान के कुछ मीट्रिक की गणना करूंगा। आप कुल पद, या औसत पद प्रति दिन, या शायद प्रतिष्ठा का उपयोग कर सकते हैं। फिर सभी साइटों पर इस मीट्रिक के वितरण को देखें, और किसी न किसी तरह से इसकी तिरछी गणना करें।

दूसरे शब्दों में, एक 'अच्छी तरह से गोल' व्यक्ति वह होगा जो कई अलग-अलग साइटों में योगदान देता है, जबकि एक 'अच्छी तरह से गोल नहीं' व्यक्ति वह होगा जो मुख्य रूप से एक साइट में योगदान देता है। आप सभी साइट के उपयोगकर्ता के कुल के साथ अपने मीट्रिक को स्केल करके इसे और बेहतर कर सकते हैं। यानी किसी ऐसे व्यक्ति का जिसने कई अलग-अलग साइटों के लिए बहुत योगदान दिया है, उसे किसी ऐसे व्यक्ति की तुलना में अधिक अच्छी तरह से गोल माना जाना चाहिए जिसने किसी भी साइट पर कुछ भी योगदान नहीं दिया है। एक व्यक्ति जिसने कभी एसई का उपयोग नहीं किया है वह बहुत अच्छी तरह गोल नहीं है!


1

पहले से ही कई अच्छे जवाब, तो एक और क्यों? यह ज्यादातर दिलचस्प विचार चर्चा की ओर ध्यान आकर्षित करना है यहाँ पर एन-श्रेणी कैफे । जबकि पारिस्थितिकी में विविधता (और अन्य जगहों पर) केवल बहुतायत में दिखती है, किसी को यह भी देखना चाहिए कि विभिन्न प्रजातियां समान / भिन्न कैसे हैं।

प्रजातियों का प्रतिनिधित्व करके (या जो कुछ भी, एसई साइटों की तरह ...) एक मीट्रिक अंतरिक्ष में बिंदुओं के रूप में यह मीट्रिक रिक्त स्थान में एन्ट्रापी को सामान्य बनाता है , उदाहरण के लिए देखें टॉम लेइनस्टर, एमिली रॉफ द्वारा मीट्रिक अंतरिक्ष का अधिकतम एन्ट्रापी । उन्हीं विचारों का उपयोग एसई साइटों के भीतर टैग के रूप में किया जा सकता है जो एक मीट्रिक स्थान में बिंदुओं को देखते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.