घटना समय के बारे में अनिश्चितता के साथ एक समय श्रृंखला में घटनाओं के लिए इंटरट्रेटर विश्वसनीयता


13

मेरे पास कई स्वतंत्र कोडर्स हैं जो एक समय श्रृंखला में घटनाओं की पहचान करने की कोशिश कर रहे हैं - इस मामले में, आमने-सामने की बातचीत का वीडियो देख रहे हैं और विशेष रूप से अशाब्दिक व्यवहार (जैसे, सिर हिलाते हुए) और प्रत्येक के समय और श्रेणी को कोडिंग करते हैं। प्रतिस्पर्धा। इस डेटा को उच्च नमूना दर (30 फ्रेम / सेकंड) के साथ असतत-समय श्रृंखला के रूप में या निरंतर-समय श्रृंखला के रूप में माना जा सकता है, जो भी काम करना आसान है।

मैं अंतर-रेटर विश्वसनीयता के कुछ माप की गणना करना चाहता हूं, लेकिन मुझे उम्मीद है कि जब घटनाएं हुईं तो कुछ अनिश्चितता होगी ; यह है, मुझे उम्मीद है कि एक कोडर हो सकता है, उदाहरण के लिए, कोड है कि एक विशेष आंदोलन शुरू किया एक तिमाही दूसरे कोडर से सोचा था कि यह शुरू कर दिया। ये दुर्लभ घटनाएं हैं, अगर यह मदद करता है; आम तौर पर घटनाओं के बीच कम से कम कई सेकंड (सैकड़ों वीडियो फ्रेम)।

क्या अंतर-रेटर विश्वसनीयता का आकलन करने का एक अच्छा तरीका है जो इस प्रकार के समझौते और असहमति दोनों को देखता है: (1) क्या चूहे इस बात पर सहमत होते हैं कि क्या घटना हुई (यदि कोई है), और (2) क्या वे सहमत हैं जब यह हुआ? दूसरा मेरे लिए महत्वपूर्ण है क्योंकि मैं बातचीत में होने वाली अन्य चीजों के सापेक्ष इन घटनाओं के समय को देखने में दिलचस्पी रखता हूं, जैसे लोग क्या कह रहे हैं।

मेरे क्षेत्र में मानक अभ्यास चीजों को समय के स्लाइस में विभाजित करने के लिए प्रतीत होता है, 1/4 सेकंड का एक या तो कहते हैं, प्रत्येक कोडर को प्रति टाइम स्लाइस की रिपोर्ट की गई घटनाओं को एकत्र करें, फिर कोहेन के कप्पा या कुछ इसी तरह की गणना करें। लेकिन स्लाइस अवधि का विकल्प तदर्थ है, और मुझे घटनाओं के समय में अनिश्चितता का अच्छा विचार नहीं है।

अब तक का सबसे अच्छा विचार यह है कि मैं किसी प्रकार की विश्वसनीयता वक्र की गणना कर सकता हूं; खिड़की के आकार के एक कार्य के रूप में कप्पा जैसा कुछ है जिसके भीतर मैं दो घटनाओं को एक ही समय में कोडित होने के रूप में मानता हूं। मुझे यकीन नहीं है कि वहाँ से कहाँ जाना है, हालांकि ...


यह स्थिति की तरह दिखता है जहां कार्यात्मक डेटा विश्लेषण विधियों को लागू किया जा सकता है। क्या आपने उन्हें माना?
एमपिकैटस

मैंने कार्यात्मक डेटा विश्लेषण के बारे में सोचा था, लेकिन यह ऐसा क्षेत्र नहीं है जिससे मैं बहुत परिचित हूं। मैं अब रामसे और सिल्वरमैन की पुस्तक पर काम कर रहा हूं। लेकिन मैं तुरंत नहीं देखता कि एक बहुराष्ट्रीय परिणाम चर से कैसे निपटें ...?

क्या उन मापों के लिए एक सोने का मानक उपलब्ध है (यानी, क्या आपको पता है कि ब्याज की घटना कब होती है)? इस अध्ययन में कितने कोडर शामिल हैं? हम कितने अलग-अलग घटनाओं की उम्मीद कर सकते हैं?
chl

जवाबों:


2

यहां कुछ तरीकों के बारे में सोचना है।

1

ए) आप कोडिंग के प्रत्येक पूर्ण अनुक्रम को घटनाओं के क्रमबद्ध सेट (यानी ["हेड नोड", "हेड शेक", "हेड नोड", "आइब्रो उठाया") और ["हेड नोड", "हेड शेक" के रूप में मान सकते हैं। , "आइब्रो उठाया"]), फिर एक एल्गोरिथ्म का उपयोग करके अनुक्रमों को संरेखित करें जिससे आपको समझ में आया ( http://en.wikipedia.org/wiki/Sequence_alignment )। फिर आप पूरे अनुक्रम के लिए अंतर कोडर विश्वसनीयता की गणना कर सकते हैं।

बी) फिर, फिर से संरेखित अनुक्रमों का उपयोग करते हुए, आप तुलना कर सकते हैं जब उन्होंने कहा कि एक घटना हुई, यह देखते हुए कि वे दोनों इस घटना को देखते हैं।

2) वैकल्पिक रूप से, आप इसे एक छिपे हुए मार्कोव मॉडल के रूप में मॉडल कर सकते हैं, और कुछ वास्तविक घटना को देखते हुए संभावनाओं को लागू करने के लिए ब्यूम-वेल्च एल्गोरिथ्म की तरह कुछ का उपयोग कर सकते हैं, प्रत्येक कोडर वास्तव में डेटा को सही ढंग से कोडित करता है। http://en.wikipedia.org/wiki/Baum-Welch_algorithm


यह तकनीक इसी तरह के लगने वाले कार्य के लिए ग्रैफ़सैगार्ड 2012 के समान थी।
केविनएल

0

डेटा को मनमाने टुकड़ों में ढालने के बजाय आप वास्तविक समय के अंतर पर विचार कर सकते हैं। कोडर 1 रिपोर्ट समय और कार्रवाई:

049 D
113 C
513 C
724 G

यह देखने का एक सरल तरीका कि अन्य कोडरों के अनुसार कौन सा कोडर सबसे विश्वसनीय है, उसे इस तरह से एक अंक दिया जाए:

Add a point for each other coder that reported a D between (049-025) and (049+025)
Add a point for each other coder that reported a C between (113-025) and (113+025)
Add a point for each other coder that reported a C between (513-025) and (513+025)
Add a point for each other coder that reported a C between (724-025) and (724+025)
Subtract a point for each reported action.

यदि निकटता आपके लिए महत्वपूर्ण है, तो इन जैसे विकल्पों पर विचार करें:

Add 25/(Time_Thiscoder-Time_Othercoder)^2 points for each other coder that reported a matching observation.

सभी समस्या की जानकारी उपलब्ध होने के साथ इस विचार को व्यावहारिक रूप से लागू करना कठिन नहीं होना चाहिए।


1
"25" कहाँ से आते हैं? क्या आपके पास संदर्भ हैं या आप इस सिद्धांत को स्पष्ट कर सकते हैं जो इस प्रस्ताव को सही ठहराता है?
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.