घटना समय के बारे में अनिश्चितता के साथ एक समय श्रृंखला में घटनाओं के लिए इंटरट्रेटर विश्वसनीयता

13

मेरे पास कई स्वतंत्र कोडर्स हैं जो एक समय श्रृंखला में घटनाओं की पहचान करने की कोशिश कर रहे हैं - इस मामले में, आमने-सामने की बातचीत का वीडियो देख रहे हैं और विशेष रूप से अशाब्दिक व्यवहार (जैसे, सिर हिलाते हुए) और प्रत्येक के समय और श्रेणी को कोडिंग करते हैं। प्रतिस्पर्धा। इस डेटा को उच्च नमूना दर (30 फ्रेम / सेकंड) के साथ असतत-समय श्रृंखला के रूप में या निरंतर-समय श्रृंखला के रूप में माना जा सकता है, जो भी काम करना आसान है।

मैं अंतर-रेटर विश्वसनीयता के कुछ माप की गणना करना चाहता हूं, लेकिन मुझे उम्मीद है कि जब घटनाएं हुईं तो कुछ अनिश्चितता होगी ; यह है, मुझे उम्मीद है कि एक कोडर हो सकता है, उदाहरण के लिए, कोड है कि एक विशेष आंदोलन शुरू किया एक तिमाही दूसरे कोडर से सोचा था कि यह शुरू कर दिया। ये दुर्लभ घटनाएं हैं, अगर यह मदद करता है; आम तौर पर घटनाओं के बीच कम से कम कई सेकंड (सैकड़ों वीडियो फ्रेम)।

क्या अंतर-रेटर विश्वसनीयता का आकलन करने का एक अच्छा तरीका है जो इस प्रकार के समझौते और असहमति दोनों को देखता है: (1) क्या चूहे इस बात पर सहमत होते हैं कि क्या घटना हुई (यदि कोई है), और (2) क्या वे सहमत हैं जब यह हुआ? दूसरा मेरे लिए महत्वपूर्ण है क्योंकि मैं बातचीत में होने वाली अन्य चीजों के सापेक्ष इन घटनाओं के समय को देखने में दिलचस्पी रखता हूं, जैसे लोग क्या कह रहे हैं।

मेरे क्षेत्र में मानक अभ्यास चीजों को समय के स्लाइस में विभाजित करने के लिए प्रतीत होता है, 1/4 सेकंड का एक या तो कहते हैं, प्रत्येक कोडर को प्रति टाइम स्लाइस की रिपोर्ट की गई घटनाओं को एकत्र करें, फिर कोहेन के कप्पा या कुछ इसी तरह की गणना करें। लेकिन स्लाइस अवधि का विकल्प तदर्थ है, और मुझे घटनाओं के समय में अनिश्चितता का अच्छा विचार नहीं है।

अब तक का सबसे अच्छा विचार यह है कि मैं किसी प्रकार की विश्वसनीयता वक्र की गणना कर सकता हूं; खिड़की के आकार के एक कार्य के रूप में कप्पा जैसा कुछ है जिसके भीतर मैं दो घटनाओं को एक ही समय में कोडित होने के रूप में मानता हूं। मुझे यकीन नहीं है कि वहाँ से कहाँ जाना है, हालांकि ...

time-series reliability agreement-statistics

— CHL
स्रोत

यह स्थिति की तरह दिखता है जहां कार्यात्मक डेटा विश्लेषण विधियों को लागू किया जा सकता है। क्या आपने उन्हें माना?

— एमपिकैटस

मैंने कार्यात्मक डेटा विश्लेषण के बारे में सोचा था, लेकिन यह ऐसा क्षेत्र नहीं है जिससे मैं बहुत परिचित हूं। मैं अब रामसे और सिल्वरमैन की पुस्तक पर काम कर रहा हूं। लेकिन मैं तुरंत नहीं देखता कि एक बहुराष्ट्रीय परिणाम चर से कैसे निपटें ...?

क्या उन मापों के लिए एक सोने का मानक उपलब्ध है (यानी, क्या आपको पता है कि ब्याज की घटना कब होती है)? इस अध्ययन में कितने कोडर शामिल हैं? हम कितने अलग-अलग घटनाओं की उम्मीद कर सकते हैं?

— chl

2

यहां कुछ तरीकों के बारे में सोचना है।

1

ए) आप कोडिंग के प्रत्येक पूर्ण अनुक्रम को घटनाओं के क्रमबद्ध सेट (यानी ["हेड नोड", "हेड शेक", "हेड नोड", "आइब्रो उठाया") और ["हेड नोड", "हेड शेक" के रूप में मान सकते हैं। , "आइब्रो उठाया"]), फिर एक एल्गोरिथ्म का उपयोग करके अनुक्रमों को संरेखित करें जिससे आपको समझ में आया ( http://en.wikipedia.org/wiki/Sequence_alignment )। फिर आप पूरे अनुक्रम के लिए अंतर कोडर विश्वसनीयता की गणना कर सकते हैं।

बी) फिर, फिर से संरेखित अनुक्रमों का उपयोग करते हुए, आप तुलना कर सकते हैं जब उन्होंने कहा कि एक घटना हुई, यह देखते हुए कि वे दोनों इस घटना को देखते हैं।

2) वैकल्पिक रूप से, आप इसे एक छिपे हुए मार्कोव मॉडल के रूप में मॉडल कर सकते हैं, और कुछ वास्तविक घटना को देखते हुए संभावनाओं को लागू करने के लिए ब्यूम-वेल्च एल्गोरिथ्म की तरह कुछ का उपयोग कर सकते हैं, प्रत्येक कोडर वास्तव में डेटा को सही ढंग से कोडित करता है। http://en.wikipedia.org/wiki/Baum-Welch_algorithm

— fgregg
स्रोत

यह तकनीक इसी तरह के लगने वाले कार्य के लिए ग्रैफ़सैगार्ड 2012 के समान थी।

— केविनएल

0

डेटा को मनमाने टुकड़ों में ढालने के बजाय आप वास्तविक समय के अंतर पर विचार कर सकते हैं। कोडर 1 रिपोर्ट समय और कार्रवाई:

यह देखने का एक सरल तरीका कि अन्य कोडरों के अनुसार कौन सा कोडर सबसे विश्वसनीय है, उसे इस तरह से एक अंक दिया जाए:

Add a point for each other coder that reported a D between (049-025) and (049+025)
Add a point for each other coder that reported a C between (113-025) and (113+025)
Add a point for each other coder that reported a C between (513-025) and (513+025)
Add a point for each other coder that reported a C between (724-025) and (724+025)
Subtract a point for each reported action.

यदि निकटता आपके लिए महत्वपूर्ण है, तो इन जैसे विकल्पों पर विचार करें:

Add 25/(Time_Thiscoder-Time_Othercoder)^2 points for each other coder that reported a matching observation.

सभी समस्या की जानकारी उपलब्ध होने के साथ इस विचार को व्यावहारिक रूप से लागू करना कठिन नहीं होना चाहिए।

— डेनिस जहरुद्दीन
स्रोत

1

"25" कहाँ से आते हैं? क्या आपके पास संदर्भ हैं या आप इस सिद्धांत को स्पष्ट कर सकते हैं जो इस प्रस्ताव को सही ठहराता है?

— whuber