असतत डेटा और निरंतर डेटा के बीच अंतर क्या है?
असतत डेटा और निरंतर डेटा के बीच अंतर क्या है?
जवाबों:
असतत डेटा केवल विशेष मान ले सकता है। संभावित रूप से उन मूल्यों की एक अनंत संख्या हो सकती है, लेकिन प्रत्येक अलग है और बीच में कोई ग्रे क्षेत्र नहीं है। असतत डेटा संख्यात्मक हो सकता है - सेब की संख्या की तरह - लेकिन यह श्रेणीबद्ध भी हो सकता है - जैसे लाल या नीला, या पुरुष या महिला, या अच्छा या बुरा।
निरंतर डेटा परिभाषित अलग-अलग मूल्यों तक सीमित नहीं हैं, लेकिन निरंतर सीमा पर किसी भी मूल्य पर कब्जा कर सकते हैं। किसी भी दो निरंतर डेटा मूल्यों के बीच दूसरों की एक अनंत संख्या हो सकती है। सतत डेटा हमेशा अनिवार्य रूप से संख्यात्मक होते हैं।
यह कभी-कभी संख्यात्मक डेटा का इलाज करने के लिए समझ में आता है जो एक प्रकार से ठीक से दूसरे के रूप में होता है। उदाहरण के लिए, ऊंचाई जैसी कोई चीज निरंतर होती है, लेकिन अक्सर हम वास्तव में छोटे अंतर के बारे में बहुत ज्यादा परवाह नहीं करते हैं और इसके बजाय कई असतत पापों में समूह ऊंचाइयों पर पहुंचते हैं । इसके विपरीत, अगर हम कुछ असतत इकाई की बड़ी मात्रा में गिनती कर रहे हैं - चावल के दाने, या दीमक, या अर्थव्यवस्था में पेनी - हम 2,000,006 और 2,000,008 के बारे में सोचना नहीं चुन सकते हैं क्योंकि महत्वपूर्ण रूप से अलग-अलग मूल्य हैं, लेकिन इसके बजाय पास के बिंदुओं पर अनुमानित सातत्य।
यह कभी-कभी संख्यात्मक डेटा को श्रेणीबद्ध मानने के लिए भी उपयोगी हो सकता है, जैसे: कम वजन, सामान्य, मोटे। यह आमतौर पर सिर्फ दूसरी तरह की बाइनिंग है।
यह शायद ही कभी स्पष्ट डेटा को निरंतर मानने के लिए समझ में आता है।
डेटा हमेशा असतत है। n
एक चर पर मूल्यों के नमूने को देखते हुए , चर जो भिन्न मान ले सकता है, की अधिकतम संख्या के बराबर है n
। यह उद्धरण देखें
सभी वास्तविक नमूना स्थान असतत हैं, और सभी अवलोकनीय यादृच्छिक चर में असतत वितरण हैं। निरंतर वितरण एक गणितीय निर्माण है, जो गणितीय उपचार के लिए उपयुक्त है, लेकिन व्यावहारिक रूप से देखने योग्य नहीं है। ईजेजी पिटमैन (1979, पी। 1)।
एक चर पर डेटा को आमतौर पर एक यादृच्छिक चर से खींचा जाता है। रैंडम वैरिएबल एक सीमा पर निरंतर होता है यदि कोई अनंत मान हो जो वैरिएबल रेंज में किसी भी दो अलग-अलग बिंदुओं के बीच ले जा सकता है। उदाहरण के लिए, ऊंचाई, वजन और समय को आमतौर पर निरंतर माना जाता है। बेशक, इन चरों का कोई माप सूक्ष्मता से और कुछ अर्थों में असतत होगा।
यह आदेश दिया (यानी, क्रमिक), अनियंत्रित (यानी, नाममात्र),
और बाइनरी असतत चर के बीच अंतर करने के लिए उपयोगी है ।
कुछ परिचयात्मक पाठ्य पुस्तकें एक संख्यात्मक चर के साथ एक सतत चर को भ्रमित करती हैं। उदाहरण के लिए, कंप्यूटर गेम पर एक अंक असतत होते हुए भी, संख्यात्मक होता है।
कुछ परिचयात्मक पाठ्यपुस्तकें निरंतर चर के साथ एक अनुपात चर को भ्रमित करती हैं। एक गणना चर एक अनुपात चर है, लेकिन यह निरंतर नहीं है।
वास्तविक व्यवहार में, एक चर को अक्सर निरंतर माना जाता है जब यह पर्याप्त रूप से बड़ी संख्या में विभिन्न मूल्यों को ले सकता है।
तापमान में गिरावट जारी है। यह 23 डिग्री, 23.1 डिग्री, 23.100004 डिग्री हो सकता है।
सेक्स असत है। आप केवल पुरुष या महिला हो सकते हैं (शास्त्रीय सोच में वैसे भी)। कुछ आप 1, 2, आदि जैसी पूरी संख्या के साथ प्रतिनिधित्व कर सकते हैं
यह अंतर महत्वपूर्ण है क्योंकि कई सांख्यिकीय और डेटा खनन एल्गोरिदम एक प्रकार को संभाल सकते हैं लेकिन दूसरे को नहीं। नियमित प्रतिगमन में उदाहरण के लिए, Y निरंतर होना चाहिए। लॉजिस्टिक रिग्रेशन में वाई असतत है।
असतत डेटा केवल कुछ मान ले सकता है।
उदाहरण: एक कक्षा में छात्रों की संख्या (आपके पास आधा छात्र नहीं हो सकता है)।
सतत डेटा वह डेटा है जो किसी भी मूल्य (एक सीमा के भीतर) ले सकता है
उदाहरण:
डेटाबेस के मामले में, हम डेटा को हमेशा असतत में संग्रहीत करेंगे, यहां तक कि डेटा की प्रकृति निरंतर है। मुझे डेटा की प्रकृति पर जोर क्यों देना चाहिए? हमें डेटा का वितरण करना चाहिए जिससे हमें डेटा का विश्लेषण करने में मदद मिल सके। यदि डेटा की प्रकृति निरंतर है, तो मैं आपको निरंतर विश्लेषण द्वारा उनका उपयोग करने का सुझाव देता हूं।
निरंतर और असतत का एक उदाहरण लें: एमपी। यहां तक कि "ध्वनि" का प्रकार भी सादृश्य है, अगर डिजिटल प्रारूप द्वारा संग्रहीत किया जाता है। हमें इसका विश्लेषण हमेशा सादृश्य तरीके से करना चाहिए।
एक तरफ, व्यावहारिक दृष्टिकोण से मैं जेरोमी एंग्लिम के उत्तर से सहमत हूं। अंत में हम असतत चर से निपटने के अधिकांश समय हैं - यद्यपि सैद्धांतिक दृष्टिकोण से वे निरंतर हैं - और वर्गीकरण के लिए उदाहरण के लिए वास्तविक प्रभाव है। स्मरण करो स्ट्रोबल के पेपर से यह संकेत मिलता है कि रैंडम फ़ॉरेस्ट कई कटिंग पॉइंट्स (उच्च सटीकता लेकिन संभावित समान प्रकृति) वाले चर के प्रति पक्षपाती है। मेरे व्यक्तिगत अनुभव से संभाव्य तंत्रिका नेटवर्क भी एक पूर्वाग्रह पेश कर सकते हैं जब चर अलग-अलग सटीकता पेश करते हैं जब तक कि वे एक ही प्रकार (यानी, निरंतर) के न हों। दूसरी ओर, सैद्धांतिक वर्गीकरण से शास्त्रीय वर्गीकरण (जैसे, निरंतर, असतत, नाममात्र आदि), IMHO, सही है। तदनुसार मुझे लगता है कि एम 5 एल्गोरिदम का वर्णन करने वाले क्विनलान के पेपर का स्रोत नाम, जो एक 'regressor' है, एक बढ़िया विकल्प है। तो निरंतर और असतत की परिभाषा और निहितार्थ 'पर्यावरण' के आधार पर प्रासंगिक हैं।
refs:
क्विनलान जेआर (1992)। निरंतर कक्षाओं के साथ सीखना। में: AI पर 5 वां ऑस्ट्रेलियाई संयुक्त सम्मेलन। सिडनी (ऑस्ट्रेलिया), 343-348।
स्ट्रोबल सी।, बोउलेस्टिक्स ए .- एल।, ज़ाइलिस ए।, और होथोर्न टी। (2007)। यादृच्छिक वन चर महत्व उपायों में पूर्वाग्रह: चित्र, स्रोत और एक समाधान। BMC जैव सूचना विज्ञान, 8, 25. doi: 10.1186 / 1471-2105-8-25
असतत डेटा विशेष मान लेते हैं, जबकि निरंतर डेटा अलग-अलग मूल्यों तक सीमित नहीं होते हैं।
असतत डेटा अलग हैं और बीच में कोई ग्रे क्षेत्र नहीं है, जबकि निरंतर डेटा एक निरंतर डेटा मूल्य पर किसी भी मूल्य पर कब्जा कर लेता है।
असतत डेटा वे विशेष मान ले सकते हैं। वे संख्यात्मक हैं।
असतत डेटा केवल पूर्णांक मानों पर ले सकता है जबकि निरंतर डेटा किसी भी मूल्य पर ले सकता है। उदाहरण के लिए, प्रत्येक वर्ष एक अस्पताल द्वारा इलाज किए जाने वाले कैंसर रोगियों की संख्या असतत है, लेकिन आपका वजन निरंतर है। कुछ डेटा निरंतर हैं लेकिन एक असतत तरीके से मापा जाता है जैसे कि आपकी उम्र। 31 की आयु के अनुसार अपनी रिपोर्ट करना आम है।