सांख्यिकी और सूचना विज्ञान में क्या अंतर है?


10

हम हमेशा कहते हैं कि आंकड़े केवल डेटा के साथ काम कर रहे हैं। लेकिन हम यह भी जानते हैं कि सूचना विश्लेषण को डेटा विश्लेषण से भी ज्ञान मिल रहा है। उदाहरण के लिए, बायोइनफॉरमैटिक्स लोग पूरी तरह से बायोस्टैटिस्टिक्स के बिना जा सकते हैं। मैं जानना चाहता हूं कि सांख्यिकी और सूचना विज्ञान के बीच आवश्यक अंतर क्या है।


7
नहीं, यह सिर्फ इसलिए है क्योंकि "सूचनात्मक" शब्द पूरी तरह से निश्चित अर्थ खो चुका है। "बायोइनफॉरमैटिक्स" को केवल "कंप्यूटर पर बने जीव विज्ञान" के लिए गढ़ा गया था, इसमें कुछ भी गहरा नहीं है।

1
@mbq सहमत "सूचना विज्ञान" और "जैव सूचना विज्ञान" ने कोई सार्थक परिभाषा खो दी है।
फोमाइट

स्पष्ट तरीके से जैव सूचना विज्ञान (जैविक तरीके से अपने परिणामों को देखने के लिए अपने निष्कर्षों को लागू करें)
कमाल अल्लवेई

जवाबों:


20

बहुत बढ़िया सवाल !!

मैंने कई बार सुना कि बायोइनफॉरमैटिशियन बिना बायोस्टैटिस्टिक्स के जा सकते हैं, या आंकड़ों के बिना भी। यह पूरी तरह से सच है जब तक कि यह गलत न हो जाए। मेरी राय में, सांख्यिकीय ज्ञान की सामान्य कमी का क्षेत्र में विनाशकारी प्रभाव है, जैसा कि कीथ बैगरली द्वारा दिखाया गया है । मैं यह भी देख सकता हूं कि सांख्यिकी (और रैखिक बीजगणित) में बुनियादी ज्ञान की कमी लंबे समय में जैव सूचना विज्ञानियों के ठहराव का कारण है: सिद्धांत के गहन ज्ञान के बिना, वे पहिया को फिर से मजबूत करते हैं और विज्ञापन समाधानों का सहारा लेते हैं जो हल करते हैं अपनी समस्या के अलावा कुछ नहीं।

लेकिन अब, आपके प्रश्न का उत्तर देने के लिए, मैं सहमत हूं कि कुल मिलाकर, उन दिनों कंप्यूटर के बिना आंकड़े नहीं कर सकते। फिर भी, आँकड़ों का एक बड़ा पहलू यह निष्कर्ष है , जिसका कंप्यूटर से कोई लेना-देना नहीं है। सांख्यिकीय निष्कर्ष वास्तव में वह है जो आंकड़ों को विज्ञान बनाता है, क्योंकि यह आपको बताता है कि आपके निष्कर्ष अन्य संदर्भों में हैं या नहीं।

संक्षेप में, आप अपने डेटा से नरक का विश्लेषण कर सकते हैं, फिर भी आपको अपने विश्लेषणों के आधार पर आपके द्वारा की गई भविष्यवाणियों या निर्णयों की वैधता जानने के लिए आंकड़ों की आवश्यकता होगी।


धन्यवाद। क्या आप इसे अनुशासन बनाने के लिए जैव सूचना विज्ञान के पीछे सामान्य सिद्धांत के बारे में अधिक बता सकते हैं। आंकड़ों के लिए, आम तौर पर बोलना, दो मुख्य भाग होते हैं, एक है शुद्ध डेटा हेरफेर, दूसरा सांख्यिकीय निष्कर्ष है, जो संभाव्यता पर आधारित है, शुद्ध गणित में से एक है। सांख्यिकीय मॉडल (प्रायिकता मॉडल) के आधार पर, सांख्यिकीय लोग विज्ञान कर सकते हैं। जैव सूचना विज्ञान के बारे में क्या?
हांगलांग वांग

4
जैविक प्रश्नों का अध्ययन करने के लिए जैव सूचना विज्ञान केवल कंप्यूटर का उपयोग है। अनुशासन आमतौर पर उनके द्वारा पूछे जाने वाले प्रश्नों से परिभाषित होते हैं, उनके तरीकों से नहीं, इसलिए जैव-सूचना विज्ञान मेरी राय में जीव विज्ञान का हिस्सा होना चाहिए। इसका एक विशेष नाम है क्योंकि जीवविज्ञानी कंप्यूटर के साथ बहुत खराब हैं, इसलिए जो लोग ऐसा कर सकते हैं उनके पास एक विशेष लेबल होना चाहिए। मुझे यकीन नहीं है कि 50 वर्षों में, जब जीवविज्ञानी आईटी और गणित में बेहतर हैं, जैव-सूचना विज्ञान अभी भी मौजूद होंगे।
gui11aume

2
कीथ के प्रयासों की सराहना किसी और को करना अच्छा लगता है। वह निश्चित रूप से विवाद या मुश्किल और असुविधाजनक पेशेवर स्थितियों से दूर नहीं हुआ है।
कार्डिनल

@cardinal कीथ ने एक या दो साल पहले APHA सम्मेलन में बात की थी। यह उन सबसे अच्छी वार्ताओं में से एक थी जो मैंने कभी देखी हैं।
फोमाइट

9

मेरा विचार है कि जहां खेतों के बीच उचित मात्रा में ओवरलैप है, वहां भी महत्वपूर्ण अंतर हैं। सामान्य तौर पर एक सांख्यिकी छात्र (उच्च डिग्री में) सूचना विज्ञान के छात्र की तुलना में अधिक सिद्धांत कक्षाएं (गणित और मैथ्सटैट) लेगा, लेकिन सूचनात्मक छात्र कंप्यूटिंग के अधिक (विशेष रूप से डेटाबेस भाग) पक्ष को सीखेंगे।

एक नया सांख्यिकीय परीक्षण विकसित करना, सूचनावादी की तुलना में सांख्यिकीविद् के लिए अधिक गिर जाएगा, लेकिन उपयोगकर्ता के लिए डेटा दर्ज करने और तालिकाओं और भूखंडों का निर्माण करने के लिए एक इंटरफ़ेस डिजाइन करना सांख्यिकीविद् की तुलना में अधिक जानकारीपूर्ण होगा।

सांख्यिकीविद् के लिए कंप्यूटर आँकड़ों के साथ मदद करने के लिए एक उपकरण है। सूचनात्मक आँकड़ों के लिए जानकारी (कंप्यूटर के माध्यम से) को इकट्ठा करने और वितरित करने में मदद करने के लिए एक उपकरण है।

नीचे संपादित करें -----

विस्तार करने के लिए, यहां एक उदाहरण है। मैंने सूचना विज्ञानियों के साथ परियोजनाओं पर काम किया है (मैं सांख्यिकीविद् हूं) जहां एक चिकित्सा चिकित्सक एक ऐसी प्रणाली रखना चाहता है, जहां रोगियों पर जानकारी का उपयोग उनकी कुछ स्थिति के जोखिम का अनुमान लगाने के लिए किया जाता है (उदाहरण के लिए एक रक्त का थक्का विकसित करना) और कुछ रूप प्राप्त करना चाहता है उन्हें जोखिम के बारे में बताने के लिए सतर्क करें। परियोजना में मेरी भूमिका (सांख्यिकीविद् की भूमिका) एक मॉडल विकसित करना है जो कि भविष्यवक्ता चर को दिए गए जोखिम की भविष्यवाणी करेगा (एक लॉजिस्टिक प्रतिगमन मॉडल ऐसा ही एक मॉडल है)। परियोजना में सूचनात्मक भूमिका उन उपकरणों को विकसित करने के लिए है जो भविष्यवक्ता चर इकट्ठा करते हैं, उन पर मेरे मॉडल का उपयोग करते हैं, फिर परिणामों को डॉक्टर को भेजें। डेटा को इलेक्ट्रॉनिक मेडिकल रिकॉर्ड से, या नर्स के लिए डेटा प्रविष्टि स्क्रीन के माध्यम से या अन्य में भरने के लिए एकत्र किया जा सकता है।

अब मैं (और कई अन्य सांख्यिकीविदों) प्रोग्रामिंग के बारे में पर्याप्त जानता हूं कि मैं भविष्यवाणियों को प्राप्त करने और किसी प्रकार का अलर्ट बनाने के लिए एक डेटाबेस को क्वेरी कर सकता हूं, लेकिन मुझे यह सूचित करने के लिए खुश है कि (और वे वैसे भी बेहतर हैं)। ऐसे सूचनावादी हैं जो लॉजिस्टिक रिग्रेशन मॉडल को फिट करने के लिए पर्याप्त आँकड़े जानते हैं। इसलिए इस परियोजना का एक सरल संस्करण केवल एक सांख्यिकीविद्, या केवल एक सूचनात्मक व्यक्ति द्वारा किया जा सकता है, लेकिन यह सबसे अच्छा है जब दोनों एक साथ काम करते हैं। यदि आप इस परियोजना को देखते हैं और सोचते हैं कि मॉडलिंग हिस्सा मज़ेदार हिस्सा है और डेटा संग्रह, चेतावनी और अन्य इंटरफेस जानकारी को मॉडल से और उसके पास स्थानांतरित करने के लिए सिर्फ उपकरण हैं तो आप एक सांख्यिकीविद् हैं। यदि आप इंटरफ़ेस को डिज़ाइन करते हुए देखते हैं, तो डेटा को वापस लेने का अनुकूलन, विभिन्न प्रकार के अलर्ट का परीक्षण करना, आदि।


(+1) मुझे इस उत्तर का संतुलन पसंद है। मुझे यकीन नहीं है कि मैं काफी समझ रहा हूं कि बहुत अंतिम वाक्य से क्या अभिप्राय था।
कार्डिनल

1
मुझे लगता है कि आपका उदाहरण बहुत अच्छा है और भूमि के बुनियादी स्तर का एक अच्छा चित्र देता है। काश मैं इसे उस हिस्से के लिए फिर से उभार सकता। चीयर्स।
कार्डिनल

आपका उदाहरण वास्तव में अच्छा है। बहुत बहुत धन्यवाद। अब मैं सिर्फ एक सवाल सोच रहा हूं। सांख्यिकीविद् के लिए, क्या सभी सांख्यिकीय मॉडल में आत्मविश्वास भाग होना चाहिए, जैसे कि आत्मविश्वास अंतराल या परिकल्पना परीक्षण, और इसलिए प्रायिकता मॉडल पर आधारित है? अन्यथा, वे केवल साजिश रचने और संक्षेप में बताए गए डेटा में हेरफेर करते हैं।
हांगलांग वांग

9

आंकड़े आंकड़ों से प्रभावित होते हैं; सूचना विज्ञान संचालित डेटा पर। बेशक वे ओवरलैप करते हैं, लेकिन जिस सवाल का बड़ा दायरा है, उसका कोई जवाब नहीं है।


"आंकड़े डेटा से हटते हैं। सूचनाएँ डेटा पर काम करती हैं।" यह वास्तव में है जो मैं पुष्टि करना चाहता हूं। अनुमान के लिए, हमेशा संभावना वितरण के आधार पर, इसमें आत्मविश्वास अंतराल या परिकल्पना परीक्षण शामिल होना चाहिए। अन्यथा, आप केवल डेटा पर काम कर रहे हैं।
हांगलांग वांग
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.