आइरिस डाटासेट यथायोग्य व्यापक रूप से विशेष रूप से सांख्यिकीय ग्राफिक्स, मल्टीवेरिएट सांख्यिकी और मशीन सीखने में विभिन्न समस्याओं को दर्शाता हुआ के लिए, सांख्यिकीय विज्ञान प्रयोग किया जाता है।
150 टिप्पणियों से युक्त, यह छोटा है लेकिन तुच्छ नहीं है।
यह कार्य आइरिस की तीन प्रजातियों के बीच भेदभाव करने के लिए उनके पंखुड़ियों और सीपल्स के माप से होता है, सरल लेकिन चुनौतीपूर्ण है।
डेटा वास्तविक डेटा हैं, लेकिन स्पष्ट रूप से अच्छी गुणवत्ता के हैं। सिद्धांत रूप में और व्यवहार में, परीक्षण डेटासेट सिंथेटिक हो सकता है और यह एक बिंदु बनाने के लिए आवश्यक या उपयोगी हो सकता है। फिर भी, कुछ लोगों को वास्तविक डेटा पर आपत्ति है।
डेटा का इस्तेमाल 1936 में प्रतिष्ठित ब्रिटिश सांख्यिकीविद् रोनाल्ड फिशर द्वारा किया गया था। (बाद में उन्हें सर रोनाल्ड कर दिया गया और सर रोनाल्ड हो गए।) कम से कम कुछ शिक्षकों को किसी के लिंक के साथ एक डेटासेट के विचार पसंद हैं, जो क्षेत्र के भीतर बहुत प्रसिद्ध है। डेटा मूल रूप से सांख्यिकीय रूप से दिमाग वाले वनस्पति विज्ञानी एडगर एस एंडरसन द्वारा प्रकाशित किए गए थे, लेकिन यह पहले की उत्पत्ति एसोसिएशन को कम नहीं करता है।
कुछ प्रसिद्ध डेटासेट का उपयोग करना हम उन परंपराओं में से एक है, जिसे हम प्रत्येक नई पीढ़ी को बता रहे हैं कि छात्र ने गिनीज के लिए काम किया या कई प्रसिद्ध सांख्यिकीविद एक-दूसरे के साथ बाहर हो गए। यह जड़ता की तरह लग सकता है, लेकिन पुराने और नए तरीकों की तुलना में, और किसी भी विधि का मूल्यांकन करने में, उन्हें अक्सर ज्ञात डेटासेट पर आज़माने में मददगार माना जाता है, इस प्रकार हम कुछ तरीकों को बनाए रखते हैं।
अंतिम, लेकिन कम से कम, आइरिस डाटासेट को संबंधित फूलों के चित्रों के साथ मज़बूती से जोड़ा जा सकता है, जैसे कि डेटासेट पर उपयोगी विकिपीडिया प्रविष्टि ।
ध्यान दें। ध्यान से संबंधित पौधों का हवाला देते हुए जैविक शुद्धता के लिए अपनी बिट करें। आइरिस सेटोसा , आइरिस वर्सिकोलर और आइरिस वर्जिनिका तीन प्रजातियां हैं (कुछ सांख्यिकीय खातों की तरह किस्में नहीं); उनके द्विपक्षों को इटैलिक में प्रस्तुत किया जाना चाहिए, जैसा कि यहां; और आईरिस जीनस नाम के रूप में और अन्य प्रजातियों को इंगित करने वाले नामों को क्रमशः ऊपरी और निचले मामले से शुरू होना चाहिए।