जवाबों:
यह 99 प्रतिशत है । इसका मतलब है कि अनुरोधों का 99% दिए गए विलंबता से तेज होना चाहिए। दूसरे शब्दों में, केवल 1% अनुरोधों को धीमा होने दिया जाता है।
हम इसे एक सादृश्यता के माध्यम से समझा सकते हैं, यदि 100 छात्र दौड़ कर रहे हैं तो 99 छात्रों को "विलंबता" समय में दौड़ पूरी करनी चाहिए।
कल्पना करें कि आप अपनी सेवा का प्रदर्शन डेटा एकत्र कर रहे हैं और नीचे दी गई तालिका परिणामों का संग्रह है (विचार को स्पष्ट करने के लिए विलंबता मान काल्पनिक हैं)।
Latency Number of requests
1s 5
2s 5
3s 10
4s 40
5s 20
6s 15
7s 4
8s 1
आपकी सेवा का P99 विलंबता 7s है। केवल 1% अनुरोध उससे अधिक समय लेते हैं। इसलिए, यदि आप अपनी सेवा के P99 विलंब को कम कर सकते हैं, तो आप इसके प्रदर्शन को बढ़ा सकते हैं।
चलो यहाँ से एक उदाहरण लेते हैं
Request latency:
min: 0.1
max: 7.2
median: 0.2
p95: 0.5
p99: 1.3
तो हम कह सकते हैं, 99 प्रतिशत वेब अनुरोध, पाया गया विलंबता 1.3ms (ms / microseconds आपके सिस्टम लेटेंसी कॉन्फ़िगर किए गए उपायों पर निर्भर करता है) या कम है। जैसे @tranmq ने बताया कि यदि हम सेवा के P99 विलंब को कम करते हैं, तो हम इसके प्रदर्शन को बढ़ा सकते हैं।
और यह भी p95 ध्यान देने योग्य है, क्योंकि हो सकता है कि कुछ अनुरोध p99 को p95 की तुलना में अधिक महंगा बनाते हैं) प्रारंभिक अनुरोध जो कैश बनाता है, क्लास ऑब्जेक्ट वार्म अप, थ्रेड इनिट ...
आखिरकार; हमारे माप में लगभग 1% शोर हो सकता है (जैसे नेटवर्क भीड़, आउटेज, सेवा में गिरावट), इसलिए पी 99 विलंबता व्यावहारिक रूप से सबसे खराब स्थिति का एक अच्छा प्रतिनिधि है। और, लगभग हमेशा, हमारा लक्ष्य p99 विलंबता को कम करना है।
Should
नहीं हैwill
।