जनसंख्या उन सभी लोगों का (काल्पनिक) सेट है, जिन्हें बीमारी होने का खतरा है; आमतौर पर, इसमें सभी लोग (या कुछ स्पष्ट रूप से पहचाने जाने योग्य उपसमूह) होते हैं जो अध्ययन क्षेत्र में रहते हैं। इस आबादी को स्पष्ट रूप से परिभाषित करना महत्वपूर्ण है, क्योंकि यह अध्ययन का लक्ष्य है और डेटा से बने सभी निष्कर्षों का है।
जब रोग के मामले स्वतंत्र होते हैं (जो एक उचित परिकल्पना हो सकती है जब बीमारी लोगों के बीच आसानी से संप्रेषित नहीं होती है और स्थानीय पर्यावरणीय परिस्थितियों के कारण नहीं होती है) और वे दुर्लभ हैं, तो काउंट्स को पॉइसन वितरण का बारीकी से पालन करना चाहिए । इस वितरण के लिए, इसके मानक विचलन का एक अच्छा अनुमान गिनती का वर्गमूल है ।
इन अनुमानों का उपयोग करते हुए, डेटा में ( 13.4 , 9.5 , 6.7 , 14.5 ) के मानक विचलन होंगे , जिसे हम त्रुटि के किसी न किसी आकलन के रूप में अनंतिम रूप से ले सकते हैं । वैचारिक रूप से, प्रत्येक मौसम में एक काल्पनिक सच्ची बीमारी की घटना दर होती है - उस मौसम में हर किसी की आबादी में इस बीमारी के होने का जोखिम कम (कम) होता है - लेकिन क्योंकि इस बीमारी को एक बेतरतीब माना जाता है(180,90,45,210)( 13.4 , 9.5 , 6.7 ,14.5)घटना, एक सीज़न के दौरान देखी गई बीमारियों की वास्तविक संख्या उस वास्तविक दर से भिन्न होगी। सही (लेकिन अज्ञात!) दर का वर्गमूल भिन्न होने की संभावना की मात्रा निर्धारित करता है। क्योंकि प्रेक्षित गणनाओं को वास्तविक दरों के करीब होना चाहिए , क्योंकि उनकी वर्गमूल वास्तविक दरों के वर्गमूल के लिए उचित प्रॉक्सी होनी चाहिए। ये समीपताएं वास्तव में "मानक त्रुटि" से होती हैं।
1657714.577
9( 20 , १० , ५ , २३ )( 4.5 , 3.2 , 2.2 , 4.8 )9( 40 , 28.5 , 20 , 44 )
जहाँ तक इन सीमित डेटा के साथ जाने की बात है। इन सरल गणनाओं से पता चला है कि:
जनसंख्या की विशेषता महत्वपूर्ण है,
एक गिनती का वर्गमूल अपनी मानक त्रुटि का आकलन करने के लिए एक प्रारंभिक बिंदु है,
वर्गमूल को रोग के मामलों में स्वतंत्रता की कमी को प्रतिबिंबित करने के लिए कुछ कारक द्वारा (लगभग) गुणा किया जाना है (और यह कारक लगभग रोग समूहों के आकार से संबंधित हो सकता है)
इन मामलों में भिन्नता मुख्य रूप से अनिश्चितता (अंतर्निहित पॉइज़न तीव्रता के बारे में) के बजाय समय के साथ रोग दर में भिन्नता को दर्शाती है।