असतत डेटा और निरंतर डेटा के बीच अंतर क्या है?


62

असतत डेटा और निरंतर डेटा के बीच अंतर क्या है?


2
क्या आपने पहले Google को आज़माया था? मेरे लिए, यह देता है यह
रॉबिन जिरार्ड

यहाँ एक अच्छा वीडियो है जो आपके प्रश्न का उत्तर देता है। youtube.com/watch?v=MIX3ZpzEOdM

2
बस डिजिटल बनाम एनालॉग लगता है। एक ही बात - विभिन्न नाम।
पिथिकोस

मैं वास्तव में नहीं जानता कि "असतत" और "निरंतर" डेटा के बीच क्या अंतर है। कुछ कारणों से, इंट्रो स्टेटिक क्लासेस वास्तव में छात्रों को इन दो चीजों को अलग करने के लिए नियमों को याद रखने का आनंद लेने लगती हैं। जहां तक ​​मैं समझने में सक्षम हूं, अंतर डेटा में नहीं हैं - लेकिन हम डेटा को कैसे चुनते हैं।
user795305

1
Google, @robingirard में यह शीर्ष परिणाम था।
denson

जवाबों:


58

असतत डेटा केवल विशेष मान ले सकता है। संभावित रूप से उन मूल्यों की एक अनंत संख्या हो सकती है, लेकिन प्रत्येक अलग है और बीच में कोई ग्रे क्षेत्र नहीं है। असतत डेटा संख्यात्मक हो सकता है - सेब की संख्या की तरह - लेकिन यह श्रेणीबद्ध भी हो सकता है - जैसे लाल या नीला, या पुरुष या महिला, या अच्छा या बुरा।

निरंतर डेटा परिभाषित अलग-अलग मूल्यों तक सीमित नहीं हैं, लेकिन निरंतर सीमा पर किसी भी मूल्य पर कब्जा कर सकते हैं। किसी भी दो निरंतर डेटा मूल्यों के बीच दूसरों की एक अनंत संख्या हो सकती है। सतत डेटा हमेशा अनिवार्य रूप से संख्यात्मक होते हैं।

यह कभी-कभी संख्यात्मक डेटा का इलाज करने के लिए समझ में आता है जो एक प्रकार से ठीक से दूसरे के रूप में होता है। उदाहरण के लिए, ऊंचाई जैसी कोई चीज निरंतर होती है, लेकिन अक्सर हम वास्तव में छोटे अंतर के बारे में बहुत ज्यादा परवाह नहीं करते हैं और इसके बजाय कई असतत पापों में समूह ऊंचाइयों पर पहुंचते हैं । इसके विपरीत, अगर हम कुछ असतत इकाई की बड़ी मात्रा में गिनती कर रहे हैं - चावल के दाने, या दीमक, या अर्थव्यवस्था में पेनी - हम 2,000,006 और 2,000,008 के बारे में सोचना नहीं चुन सकते हैं क्योंकि महत्वपूर्ण रूप से अलग-अलग मूल्य हैं, लेकिन इसके बजाय पास के बिंदुओं पर अनुमानित सातत्य।

यह कभी-कभी संख्यात्मक डेटा को श्रेणीबद्ध मानने के लिए भी उपयोगी हो सकता है, जैसे: कम वजन, सामान्य, मोटे। यह आमतौर पर सिर्फ दूसरी तरह की बाइनिंग है।

यह शायद ही कभी स्पष्ट डेटा को निरंतर मानने के लिए समझ में आता है।


@walktalky @jeromy के रूप में, मनोविज्ञान में, कम से कम, श्रेणीबद्ध चर जैसे कि प्रश्नों के प्रति प्राय: एक अंतर्निहित विशेषता के प्रतिनिधित्व के रूप में माना जाता है, इसलिए उस अर्थ में क्रमबद्ध डेटा कभी-कभी निरंतर होने के रूप में माना जाता है।
रिचमीमोर्रिसो

@richiemorrisroe डेटा और पुटकीय विशेषता के बीच के अंतर के बारे में बता सकते हैं, लेकिन निश्चित रूप से आप सही हैं। इस अनुवर्ती प्रश्न के जवाब में कुछ बहुत ही रोचक बिंदु बनाए गए थे ।
walkytalky

लिंक के लिए धन्यवाद, वे जवाब वास्तव में बहुत दिलचस्प हैं।
रिचमीमोर्रिसो

> " संभावित रूप से उन मूल्यों की एक अनंत संख्या हो सकती है, लेकिन प्रत्येक अलग है और बीच में कोई ग्रे क्षेत्र नहीं है " - यह वास्तव में अलग-अलग मूल्यों के साथ असतत वितरण के लिए पूरी तरह से संभव है, और एक ही समय में , किसी भी दो के लिए आपके द्वारा चुने गए अलग-अलग मूल्य, उनके बीच हमेशा अधिक मूल्य होते हैं (एक अर्थ में 'ग्रे एरिया')। वे अक्सर अभ्यास में नहीं आते हैं, लेकिन वास्तविक रूप से उनके लिए आना पूरी तरह से संभव है; वास्तव में मैं दो अलग-अलग (यदि संबंधित) उदाहरणों के बारे में सोच सकता हूं जो आसानी से उत्पन्न हो सकते हैं।
Glen_b

तो स्पष्ट करने के लिए, भले ही आपके पास स्टॉक संपत्ति के लिए ओएचसी डेटा की 10 बिलियन पंक्तियाँ हों, फिर भी इसे असतत माना जाएगा? लेकिन फिर एक संपत्ति की कीमत 1 से अनंत के बीच कुछ भी नहीं हो सकती, इस प्रकार की स्थिति में कैसे सोचें?
पाइरेटएप

19

डेटा हमेशा असतत है। nएक चर पर मूल्यों के नमूने को देखते हुए , चर जो भिन्न मान ले सकता है, की अधिकतम संख्या के बराबर है n। यह उद्धरण देखें

सभी वास्तविक नमूना स्थान असतत हैं, और सभी अवलोकनीय यादृच्छिक चर में असतत वितरण हैं। निरंतर वितरण एक गणितीय निर्माण है, जो गणितीय उपचार के लिए उपयुक्त है, लेकिन व्यावहारिक रूप से देखने योग्य नहीं है। ईजेजी पिटमैन (1979, पी। 1)।

एक चर पर डेटा को आमतौर पर एक यादृच्छिक चर से खींचा जाता है। रैंडम वैरिएबल एक सीमा पर निरंतर होता है यदि कोई अनंत मान हो जो वैरिएबल रेंज में किसी भी दो अलग-अलग बिंदुओं के बीच ले जा सकता है। उदाहरण के लिए, ऊंचाई, वजन और समय को आमतौर पर निरंतर माना जाता है। बेशक, इन चरों का कोई माप सूक्ष्मता से और कुछ अर्थों में असतत होगा।

यह आदेश दिया (यानी, क्रमिक), अनियंत्रित (यानी, नाममात्र),
और बाइनरी असतत चर के बीच अंतर करने के लिए उपयोगी है ।

कुछ परिचयात्मक पाठ्य पुस्तकें एक संख्यात्मक चर के साथ एक सतत चर को भ्रमित करती हैं। उदाहरण के लिए, कंप्यूटर गेम पर एक अंक असतत होते हुए भी, संख्यात्मक होता है।

कुछ परिचयात्मक पाठ्यपुस्तकें निरंतर चर के साथ एक अनुपात चर को भ्रमित करती हैं। एक गणना चर एक अनुपात चर है, लेकिन यह निरंतर नहीं है।

वास्तविक व्यवहार में, एक चर को अक्सर निरंतर माना जाता है जब यह पर्याप्त रूप से बड़ी संख्या में विभिन्न मूल्यों को ले सकता है।

संदर्भ

  • पिटमैन, ईजेजी 1979। सांख्यिकीय अनुमान के लिए कुछ बुनियादी सिद्धांत। लंदन: चैपमैन एंड हॉल। नोट: मुझे मुरैत एटकिन की पुस्तक स्टैटिस्टिकल इन्वेंशन के अध्याय 2 के परिचय में उद्धरण मिला : एक एकीकृत बायेसियन / लाइकेलहुड दृष्टिकोण

12
एक संभावना, "गणितीय निर्माण" भी है, न कि "प्रत्यक्ष रूप से अवलोकन योग्य"। क्या इसका मतलब यह है कि संभावना मौजूद नहीं है? कुल मिलाकर, इस दिलचस्प जबाब एक अस्थिर आधार है कि डेटा मानों की विशेषता किया जाना चाहिए वे के आधार पर लगता है है मानों एक गणितीय मॉडल उन्हें करने की अनुमति देता द्वारा बजाय है। उत्तरार्द्ध महत्वपूर्ण विशेषता है, पूर्व नहीं। यह सब बताता है कि निरंतर / असतत अंतर में क्या मायने रखता है कि हम डेटा के बारे में कैसे सोचते हैं (यानी हम उन्हें कैसे मॉडल करते हैं)।
whuber

3
लॉर्ड्स (1953), "फुटबॉल संख्याओं के सांख्यिकीय उपचार पर", अमेरिकी मनोवैज्ञानिक , 8 , pp750-51 : एक चतुर थोड़ा काल्पनिक चित्रण है ।
Scortchi - फिर से बहाल करें मोनिका

धन्यवाद, @ स्कोर्टची। वेब संस्करण Google विद्वान खोज के माध्यम से उपलब्ध हैं । भगवान एक गलत धारणा को संबोधित कर रहे हैं, 60 साल पहले गरमागरम बहस हुई, "माप सिद्धांत" किस हद तक प्रभावित होना चाहिए (या यहां तक ​​कि) सांख्यिकीय विश्लेषण के दायरे को सीमित करना चाहिए। मॉडल निर्माण और टिप्पणियों के बीच अंतर के बारे में मेरी बात एक अलग थी।
whuber

12

तापमान में गिरावट जारी है। यह 23 डिग्री, 23.1 डिग्री, 23.100004 डिग्री हो सकता है।

सेक्स असत है। आप केवल पुरुष या महिला हो सकते हैं (शास्त्रीय सोच में वैसे भी)। कुछ आप 1, 2, आदि जैसी पूरी संख्या के साथ प्रतिनिधित्व कर सकते हैं

यह अंतर महत्वपूर्ण है क्योंकि कई सांख्यिकीय और डेटा खनन एल्गोरिदम एक प्रकार को संभाल सकते हैं लेकिन दूसरे को नहीं। नियमित प्रतिगमन में उदाहरण के लिए, Y निरंतर होना चाहिए। लॉजिस्टिक रिग्रेशन में वाई असतत है।


5
Y

8

असतत डेटा केवल कुछ मान ले सकता है।

उदाहरण: एक कक्षा में छात्रों की संख्या (आपके पास आधा छात्र नहीं हो सकता है)।

सतत डेटा वह डेटा है जो किसी भी मूल्य (एक सीमा के भीतर) ले सकता है

उदाहरण:

  • एक व्यक्ति की ऊंचाई: किसी भी मूल्य (मानव ऊंचाइयों की सीमा के भीतर) हो सकती है, न कि केवल कुछ निश्चित ऊंचाइयों पर,
  • एक दौड़ में समय: आप इसे एक सेकंड के अंश तक भी माप सकते हैं,
  • एक कुत्ते का वजन,
  • एक पत्ती की लंबाई,
  • एक व्यक्ति का वजन,

2
आप यह भी बता सकते हैं कि आपने उत्तर कहां से कॉपी किया है: mathsisfun.com/data/data-discrete-continuous.html
philmcole

अच्छी तरह से वर्णित है।
अरसमन अहमद

0

डेटाबेस के मामले में, हम डेटा को हमेशा असतत में संग्रहीत करेंगे, यहां तक ​​कि डेटा की प्रकृति निरंतर है। मुझे डेटा की प्रकृति पर जोर क्यों देना चाहिए? हमें डेटा का वितरण करना चाहिए जिससे हमें डेटा का विश्लेषण करने में मदद मिल सके। यदि डेटा की प्रकृति निरंतर है, तो मैं आपको निरंतर विश्लेषण द्वारा उनका उपयोग करने का सुझाव देता हूं।

निरंतर और असतत का एक उदाहरण लें: एमपी। यहां तक ​​कि "ध्वनि" का प्रकार भी सादृश्य है, अगर डिजिटल प्रारूप द्वारा संग्रहीत किया जाता है। हमें इसका विश्लेषण हमेशा सादृश्य तरीके से करना चाहिए।


0

एक तरफ, व्यावहारिक दृष्टिकोण से मैं जेरोमी एंग्लिम के उत्तर से सहमत हूं। अंत में हम असतत चर से निपटने के अधिकांश समय हैं - यद्यपि सैद्धांतिक दृष्टिकोण से वे निरंतर हैं - और वर्गीकरण के लिए उदाहरण के लिए वास्तविक प्रभाव है। स्मरण करो स्ट्रोबल के पेपर से यह संकेत मिलता है कि रैंडम फ़ॉरेस्ट कई कटिंग पॉइंट्स (उच्च सटीकता लेकिन संभावित समान प्रकृति) वाले चर के प्रति पक्षपाती है। मेरे व्यक्तिगत अनुभव से संभाव्य तंत्रिका नेटवर्क भी एक पूर्वाग्रह पेश कर सकते हैं जब चर अलग-अलग सटीकता पेश करते हैं जब तक कि वे एक ही प्रकार (यानी, निरंतर) के न हों। दूसरी ओर, सैद्धांतिक वर्गीकरण से शास्त्रीय वर्गीकरण (जैसे, निरंतर, असतत, नाममात्र आदि), IMHO, सही है। तदनुसार मुझे लगता है कि एम 5 एल्गोरिदम का वर्णन करने वाले क्विनलान के पेपर का स्रोत नाम, जो एक 'regressor' है, एक बढ़िया विकल्प है। तो निरंतर और असतत की परिभाषा और निहितार्थ 'पर्यावरण' के आधार पर प्रासंगिक हैं।

refs:

क्विनलान जेआर (1992)। निरंतर कक्षाओं के साथ सीखना। में: AI पर 5 वां ऑस्ट्रेलियाई संयुक्त सम्मेलन। सिडनी (ऑस्ट्रेलिया), 343-348।

स्ट्रोबल सी।, बोउलेस्टिक्स ए .- एल।, ज़ाइलिस ए।, और होथोर्न टी। (2007)। यादृच्छिक वन चर महत्व उपायों में पूर्वाग्रह: चित्र, स्रोत और एक समाधान। BMC जैव सूचना विज्ञान, 8, 25. doi: 10.1186 / 1471-2105-8-25


-1

असतत डेटा विशेष मान लेते हैं, जबकि निरंतर डेटा अलग-अलग मूल्यों तक सीमित नहीं होते हैं।

असतत डेटा अलग हैं और बीच में कोई ग्रे क्षेत्र नहीं है, जबकि निरंतर डेटा एक निरंतर डेटा मूल्य पर किसी भी मूल्य पर कब्जा कर लेता है।


-2

असतत डेटा वे विशेष मान ले सकते हैं। वे संख्यात्मक हैं।


CV में आपका स्वागत है! उत्तर देने के लिए धन्यवाद, लेकिन कृपया पिछले उत्तरों को देखने के लिए समय निकालें और विचार करें कि क्या आप कुछ उपयोगी जोड़ रहे हैं।
Scortchi - फिर से बहाल करें मोनिका

-3

असतत डेटा केवल पूर्णांक मानों पर ले सकता है जबकि निरंतर डेटा किसी भी मूल्य पर ले सकता है। उदाहरण के लिए, प्रत्येक वर्ष एक अस्पताल द्वारा इलाज किए जाने वाले कैंसर रोगियों की संख्या असतत है, लेकिन आपका वजन निरंतर है। कुछ डेटा निरंतर हैं लेकिन एक असतत तरीके से मापा जाता है जैसे कि आपकी उम्र। 31 की आयु के अनुसार अपनी रिपोर्ट करना आम है।


11
पूर्णांक तक सीमित किए बिना डेटा असतत हो सकता है। या संख्या, उस बात के लिए। पूर्णांक के साथ असतत डेटा का प्रतिनिधित्व करना हमेशा संभव होता है , लेकिन इसका मतलब यह नहीं है कि डेटा केवल ऐसे मान ले सकता है।
वॉकिटाल्की

-4

डेटा को अलग-अलग परिमित मानों के बारे में और निरंतर डेटा के बारे में अनन्त मूल्यों के बारे में बात करता है .....


2
विस्तृत करने के लिए परवाह?
chl
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.