मैं एक स्क्रिप्ट लिख रहा हूं जो प्रक्रियाओं के समय का विश्लेषण करती है। मुझे उनके वितरण पर यकीन नहीं है, लेकिन मैं जानना चाहता हूं कि क्या कोई प्रक्रिया "बहुत लंबी" चलती है। अब तक मैं पिछले रन समय (n> 30) के 3 मानक विचलन का उपयोग कर रहा हूं, लेकिन मुझे बताया गया था कि यह डेटा सामान्य नहीं होने पर (जो यह प्रतीत नहीं होता है) कुछ भी उपयोगी नहीं प्रदान करता है। मैंने पाया कि एक और बाह्य परीक्षण है:
अंतर चतुर्थक श्रेणी का पता लगाएं, जो कि IQR = Q3 - Q1 है, जहां Q3 तीसरी चतुर्थक है और Q1 पहली बार चतुर्थक है। फिर इन दो संख्याओं को खोजें:
a) Q1 - 1.5 * IQR b) Q3 + 1.5 * IQR
बिंदु एक बाहरी है यदि <या a> बी
मेरा डेटा 2sec, 3sec, 2sec, 5sec, 300sec, 4sec .... जैसी चीजें हैं, जहाँ 300sec स्पष्ट रूप से एक बाहरी है।
कौन सा तरीका बेहतर है? IQR विधि या std विचलन विधि?