विश्वसनीय जनसांख्यिकीय आधारित रोगी मिलान के लिए न्यूनतम मिलान मानदंड क्या हैं?


30

जब जनसांख्यिकीय डेटा के आधार पर रोगियों का मिलान किया जाता है तो क्या मरीज को "समान रोगी" होने के लिए किन क्षेत्रों से मेल खाना चाहिए?

मुझे पता है कि अलग-अलग कार्यान्वयन के लिए एल्गोरिदम अलग-अलग होंगे, मैं बस उत्सुक हूं अगर इस प्रक्रिया के आसपास कोई सर्वोत्तम अभ्यास या सिफारिशें हैं।

First Name
Last Name
Date of Birth
SSN
Address
City
State
Zip

आदि?


4
संभवतः इस प्रश्न का उत्तर विशिष्ट देश या यहां तक ​​कि जातीय और सांस्कृतिक विचारों के आधार पर भी बदल सकता है। उदाहरण के लिए, किसी व्यक्ति का नाम ऑस्ट्रेलियाई आदिवासियों के लिए एक अच्छा रोगी पहचानकर्ता नहीं हो सकता है (या उसे उसके मामले में कम "वजन" दिया जाना चाहिए) क्योंकि वे समय के साथ नाम बदल सकते हैं। एक मृतक के रूप में एक ही नाम रखने वाले ऑस्ट्रेलियाई आदिवासी इसे त्याग देते हैं क्योंकि वे मानते हैं कि जो कोई मरा है उसका वही नाम रखना बहुत बुरा है। अन्य संस्कृतियों में ऐसा ही कुछ होता है मृतकों का नाम वर्जित है। लिंक

4
या एक और अभी तक अप्रकाशित अध्ययन से एक और उदाहरण: अमेरिका में फिलिपिनो प्रवासियों में, दस सबसे आम उपनाम सभी लोगों के लगभग 6% हैं। वियतनामी आप्रवासियों में, वे ~ 60% के लिए जिम्मेदार हैं। वियतनामी की तुलना में फिलिपिनो में नाम काफी बेहतर पहचानकर्ता हैं। उपलब्ध होने के बाद मैं निश्चित रूप से उस अध्ययन को पोस्ट करूंगा।

बस स्पष्ट करने के लिए: रिकॉर्ड के दो सेटों का मिलान करना प्राथमिक उद्देश्य है?

रिकॉर्ड से मेल खाने का प्रयास करते समय, एक मैच की ताकत के बीच अंतर करना सुनिश्चित करें ("बॉब" "बॉब" के समान है) संभव मैचों की संख्या (कई बोब्स हैं)। यदि दो अभिलेखों में एक ही नाम है और उस नाम के साथ कोई अन्य अभिलेख नहीं हैं , तो शायद यह एक ही व्यक्ति है, भले ही पते भिन्न हों। मान लें कि आपके पास एक बड़ा कोष है, निश्चित रूप से।
जॉन ऑफ ऑल ट्रेड्स

जवाबों:


20

नहीं है इस महान निबंध (स्पेनिश में, खेद) पाब्लो Pazos, उरुग्वे से एक सीएस इंजीनियर है, जो 2006 के बाद से हेल्थकेयर आईटी पर काम कर रहा है और क्षेत्र है, जिसमें उन्होंने ऐसा करने के लिए एक एल्गोरिथ्म का वर्णन करने के लिए कुछ महान योगदान दिया है ने लिखा है।

आप लेख को एक अनुवादक के माध्यम से चला सकते हैं, लेकिन इसका सार यह है कि किसी व्यक्ति की पहचान निर्धारित करने की मूल जानकारी उनके दिए गए और पारिवारिक नाम (पिता और माता दोनों से), लिंग और जन्म तिथि है। दिलचस्प रूप से पर्याप्त है, वह विशेष रूप से अपनी पहचान मिलान एल्गोरिदम से एसएसएन जैसी आईडी संख्याओं को बाहर करता है, क्योंकि "किसी भी प्रकार का पहचानकर्ता उसकी पहचान का हिस्सा नहीं है" (मुझे लगता है कि यह बिंदु बहस योग्य हो सकता है, हालांकि)। इसके अलावा, वह सड़क का पता, फोन नंबर आदि जैसी विशेषताओं को शामिल नहीं करता है क्योंकि वे वास्तव में किसी की पहचान से संबंधित नहीं हैं, वे "जो वास्तव में कोई है" के साथ संबद्ध नहीं हैं।

इसके अलावा, वह इस तरह के प्रत्येक पूर्व विशेषताओं को अलग "वजन" प्रदान करता है:

  • पहला नाम: 17.5%
  • मध्य नाम: 17.5%
  • पारिवारिक नाम (पिता): 17.5%
  • पारिवारिक नाम (मां): 17.5%
  • लिंग: 10%
  • DOB: 20%

इन विशेषताओं में से हर एक पर पाए जाने वाले मैचों के साथ, वह एक समग्र "कॉन्कोर्डेंसी मैच इंडेक्स" प्राप्त करने के लिए एक कार्यप्रणाली का वर्णन करता है, जिसके साथ रिकॉर्ड के बीच तुलना संभव हो सकती है। इसके अलावा, नाम की विशेषताओं पर "आंशिक" मैच एल्गोरिदम का उपयोग करके संभव है जैसे लेवेंसहाइट की दूरी

अच्छा पढ़ा, IMO। क्षमा करें, यह स्पेनिश में है, लेकिन मुझे आशा है कि मैं इसके मुख्य विचारों को व्यक्त करने में सक्षम था।


2
यह बहुत अच्छा है, धन्यवाद। +1 का उल्लेख करने के लिए टाइपो के रूप में दूरी विशेष रूप से सांस्कृतिक पृष्ठभूमि की उच्च विविधता वाले समुदायों में काफी आम है, जैसा कि उत्तरी अमेरिका में अक्सर होता है। उस ने कहा, अधिकांश उदाहरण जहां मुझे संभावित मूल्यों के डोमेन से मेल खाना है, काफी प्रतिबंधित है। तो इन मामलों में किसी भी विश्वसनीय मानदंड (जैसे स्वास्थ्य बीमा नंबर) जो डेटाबेस में एक भी हिट लौटाते हैं, पर्याप्त होगा, यदि कई प्रविष्टियां वापस आती हैं तो मैं उपयोगकर्ता से पूछ सकता हूं (यदि उपलब्ध हो) या अतिरिक्त मानदंड के साथ फ़िल्टर करें।

(... contd) हालांकि ध्यान दें कि ये मामले एक क्लिनिक या अस्पताल में EMR की स्थानीय स्थापना या रेडियो 9 विभाग के लिए RIS पर अच्छी तरह से लागू होते हैं। इन मामलों में ग्राहक या तो क्लिनिक या अस्पताल में पंजीकृत है या नहीं। हालांकि MPI के मामलों में यह पूरी तरह से नया बॉल गेम है।

13

रोगी के मिलान के लिए एक भी जादू एल्गोरिथ्म नहीं है, और मुझे संदेह है कि कभी भी होगा।

शुरुआत के लिए, क्षेत्रीय संस्करण हैं। जैसा कि MMattoli ने बताया, शहरी संयुक्त राज्य के अस्पताल में क्या अच्छा काम करता है, शायद ग्रामीण ऑस्ट्रेलियाई क्लिनिक में आदिवासी लोगों के इलाज में अच्छी तरह से फिट नहीं होंगे।

इसके अलावा, अलग-अलग साइटों में दोष सहिष्णुता पर अलग-अलग विचार हैं। यदि आप केवल तभी मिलान करते हैं जब आप पूरी तरह से आश्वस्त थे , तो आपको बहुत सारे छूटे हुए मैच मिलेंगे। यह डुप्लिकेट रोगी रिकॉर्ड का कारण बनता है, जो समस्याओं का एक पूरा सेट बनाता है। अधिकांश साइटों के लिए समझौता करने के लिए तैयार हो जाएगा यकीन है कि है, लेकिन यकीन है कि कैसे यकीन है कि पर्याप्त है? 10 लोगों से पूछें और आपको 12 उत्तर मिलेंगे।

इसलिए "सर्वश्रेष्ठ" एल्गोरिथ्म कॉन्फ़िगर करने योग्य होगा, इसलिए आपके ग्राहक अपनी आवश्यकताओं को पूरा करने के लिए इसे ट्यून कर सकते हैं।

जब एक मैच पर विचार करते हैं, तो विभिन्न क्षेत्र आत्मविश्वास की भिन्न डिग्री प्रदान करते हैं।

हेल्थकेयर-विशिष्ट पहचानकर्ता सबसे अधिक आत्मविश्वास प्रदान करते हैं, क्योंकि उनका पूरा उद्देश्य स्वास्थ्य प्रणाली के भीतर व्यक्ति की विशिष्ट पहचान करना है। अस्पताल आमतौर पर ये सुनिश्चित करने के लिए दर्द उठाते हैं कि कहीं ये नकल न हो जाएं।

उदाहरण:

  • राष्ट्रीय स्वास्थ्य आईडी (जैसे यूके एनएचएस नंबर)
  • अस्पताल को सौंपा गया मेडिकल रिकॉर्ड नंबर।

सिस्टम के आधार पर अन्य रोगी पहचानकर्ता उच्च आत्मविश्वास भी प्रदान कर सकते हैं। उदाहरण के लिए, सैन्य अस्पताल में एक सैन्य आईडी संभवतः बहुत प्रासंगिक है।

उदाहरण:

  • मिलिट्री आई.डी.
  • बीमा आईडी
  • सामाजिक सुरक्षा संख्या (अमेरिका में, सामाजिक सुरक्षा संख्या को आम तौर पर एक उच्च आत्मविश्वास वाले मैच के रूप में नहीं माना जाता है, जो बड़े पैमाने पर बीमा धोखाधड़ी के कारण होता है।)

विशिष्ट पहचानकर्ताओं की अनुपस्थिति में, किसी को जनसांख्यिकीय जानकारी का सहारा लेना चाहिए। किसी भी एक क्षेत्र पर मैच करने की सलाह दी जाती है , लेकिन जितना अधिक जनसांख्यिकीय क्षेत्र का मैच होता है, उतना ही आत्मविश्वास से मैच होता है।

किसी ऐसे व्यक्ति के बारे में जो अक्सर बदलते नहीं हैं, मिलान के लिए अच्छे हैं:

  • नाम
  • लिंग
  • जन्म की तारीख

लेकिन आत्मविश्वास बढ़ाने के लिए मैच में और भी निंदनीय जानकारी पर विचार किया जा सकता है:

  • पता
  • फ़ोन नंबर
  • ईमेल पता

3
SSN में कुछ बहुत सख्त प्रतिबंध भी हैं, उदाहरण के लिए कनाडा में जब तक आप नियोक्ता या बैंक नहीं हैं तब तक इसके लिए पूछना गैरकानूनी है (शायद कुछ और भी, मैं वकील नहीं हूं)। चीन जैसी अन्य जगहों पर वे लगभग किसी भी चीज के लिए इसका इस्तेमाल करते हैं, यहां तक ​​कि उच्च यातायात छुट्टियों के दौरान ट्रेन टिकट खरीदने के लिए भी।

यदि आप महिला हैं तो नाम परिवर्तन आम हैं। और दो लोगों का अक्सर एक ही नाम होता है और यहां तक ​​कि एक ही जगह पर रहते हैं (उदाहरण के लिए एक बेटा नाम के साथ पिता)।
HLGEM

@ एचएलजीईएम: पूरी तरह से सही है, यही कारण है कि मिलान के लिए एक भी जनसांख्यिकीय क्षेत्र का उपयोग नहीं किया जाना चाहिए। लेकिन जब लोगों को इसका सहारा लेना पड़ता है, तो अधिक स्थिर क्षेत्र (जो फिर भी कभी-कभी बदलते हैं) विकल्प की तुलना में अधिक विश्वसनीय होते हैं। हालांकि यह उन्हें अच्छा नहीं बनाता है।
लिन

7

यह भी पिछले lastnames की जाँच के लायक है क्योंकि ये अक्सर बदलते हैं।


+1 "अक्सर" एक समझ है। :) यह उन रोगियों के लिए निश्चित रूप से हो सकता है जो पहचानने योग्य या अनाम नहीं हैं, नवजात शिशुओं, गलत पहचान वाले, और इसी तरह। बहुत अधिक लेन-देन वाले वातावरण में, नाम अधिक कठिन हैं, फिर भी अधिक महत्वपूर्ण हैं।

4

आपके प्रश्न में दिए गए निम्नलिखित तीन के स्पष्ट संयोजनों के अलावा

First Name
Last Name
Date of Birth
City
State
ZIP/Pin Code

मैं phone number (Home and/or Cell)सूची में जोड़ने के बारे में सोचूंगा । इन दिनों यह काफी सामान्य है और प्रत्येक के पास एक अद्वितीय संख्या होगी और भले ही कुछ बार लोग अपना फोन नंबर बदल दें, पुराने फोन नंबर ज्यादातर लोगों द्वारा याद किए जाते हैं, इसलिए काम आ सकता है।

हमने पाया कि पता अक्सर विशेष रूप से भारत जैसे देशों में कई वर्तनी और कई तरीकों से दिया जाता है जहां लोग स्थानीय भाषा का उपयोग करते हैं और रोगी प्रबंधन सॉफ्टवेयर्स 'स्टिल' अंग्रेजी का उपयोग करते हैं।


3

रिकॉर्ड में लिंग अक्सर प्रथम नाम से लिया गया लगता है। मैंने विदेशियों के लिए लिंग में भिन्नता देखी है, जब हम नाम से लिंग नहीं निकाल सकते।

जर्मनी में हमारे पास 'उमला' जैसे 'उमलाउत' नाम वाले कुछ और संस्करण हैं, जिन्हें कभी-कभी 'एईई ओई' द्वारा प्रतिस्थापित किया जाता है।


1

मेरा विचार 1 से नीचे के क्रम में है)। एसएसएन, अंतिम नाम, और पहले नाम 2 के पहले 5 वर्ण)। SSN, जन्मतिथि और प्रथम नाम 3 के पहले 5 वर्ण)। SSN, जन्मतिथि और अंतिम नाम 4)। SSN, लिंग, जन्मतिथि 5)। अंतिम नाम, पहले नाम के पहले 5 वर्ण, शहर और ज़िप


1

यह अमेरिका में वास्तव में एक कठिन समस्या है। नाम अद्वितीय नहीं होते हैं और अक्सर किसी व्यक्ति के जीवनकाल के दौरान बदल जाते हैं या अलग-अलग तरीके से प्रस्तुत किए जाते हैं (उदाहरण के लिए रोब बनाम रॉबर्ट), इसलिए उन्हें कुछ और अधिक वास्तविक जानकारी के साथ संयोजन के अलावा रोगी की पहचान करने के लिए कभी भी इस्तेमाल नहीं किया जा सकता है। स्वास्थ्य बीमा संख्या और प्रदाता बहुत अधिक बार बदलते हैं और परिवार के कई सदस्यों के लिए समान हो सकते हैं। एसएसएन माना जाता है कि अद्वितीय है, लेकिन इसके चारों ओर धोखाधड़ी है। ड्राइवर के बिस्कुट संख्या के साथ ही जो निश्चित रूप से हर किसी के पास नहीं होगा।

व्यक्तिगत रूप से, मैं बीमा पॉलिसी नंबर और जन्म तिथि और नाम संयोजन के साथ शुरू करूंगा, फिर ssn और जन्म तिथि और नाम संयोजन। जब वे मैच करते हैं तो मुझे ऐडिटोनल आश्वासन देने के लिए मैं पते और फोन की जांच करूंगा, लेकिन अगर वे नहीं करते हैं तो बहुत अधिक वजन होगा। Additonally मैं ब्लड टाइप का उपयोग एक नियम आउट फैक्टर के रूप में करता हूँ अगर यह ज्ञात है (और हम सभी जानते हैं कि अस्पताल के वैम्पायर रक्त के नमूने ले रहे होंगे) क्योंकि यह नहीं बदलता है। नाम मिलान समस्या के कारण नाम मिलान का फ़ज़ी मैच होगा। अन्य चीजें आम तौर पर एक सटीक मैच पहले थीम फजी मैच के लिए देखनी चाहिए अगर नाम आत्मविश्वास वास्तव में उच्च है (एसएसएन में प्रवेश करने वाला एक टाइपो हो सकता है)।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.