यह एक पुराना प्रश्न है, लेकिन पिछले उत्तरों में से किसी ने भी वास्तविक मुद्दे को संबोधित नहीं किया है, अर्थात यह तथ्य कि समस्या स्वयं प्रश्न के साथ है।
सबसे पहले, यदि संभावनाओं की पहले ही गणना की जा चुकी है, यानी हिस्टोग्राम एग्रीगेटेड डेटा सामान्य तरीके से उपलब्ध है, तो संभावनाओं को 1 तक जोड़ना चाहिए। वे स्पष्ट रूप से ऐसा नहीं करते हैं और इसका मतलब है कि यहां कुछ गलत है, या तो शब्दावली के साथ या डेटा के साथ। या जिस तरह से सवाल पूछा जाता है।
दूसरा, यह तथ्य है कि लेबल प्रदान किए जाते हैं (और अंतराल नहीं) सामान्य रूप से इसका मतलब होगा कि संभावनाएं श्रेणीबद्ध प्रतिक्रिया चर की हैं - और हिस्टोग्राम की साजिश रचने के लिए बार प्लॉट का उपयोग सबसे अच्छा है (या पाइलोट के हिस्ट विधि के कुछ हैकिंग), शायान शफीक का जवाब कोड प्रदान करता है।
हालाँकि, समस्या 1 देखें, वे संभावनाएँ सही नहीं हैं और इस मामले में बार प्लॉट का "हिस्टोग्राम" के रूप में उपयोग करना गलत होगा क्योंकि यह एकतरफा वितरण की कहानी नहीं बताता है, किसी कारण से (शायद कक्षाएं अतिव्यापी हैं और टिप्पणियों को कई गिना जाता है) बार?) और इस तरह के साजिश को इस मामले में हिस्टोग्राम नहीं कहा जाना चाहिए।
हिस्टोग्राम परिभाषा के अनुसार अविभाज्य चर के वितरण का चित्रमय प्रतिनिधित्व है (देखें https://www.itl.nist.gov/div898/handbook/eda/section3/histogra.htm , https://en.wikipedia.org/wiki / हिस्टोग्राम) और ब्याज के चर के चयनित वर्गों में अवलोकनों की संख्या या आवृत्तियों का प्रतिनिधित्व करने वाले आकारों के बार बनाकर बनाया जाता है। यदि चर को निरंतर पैमाने पर मापा जाता है तो वे वर्ग बिन (अंतराल) होते हैं। हिस्टोग्राम निर्माण प्रक्रिया का महत्वपूर्ण हिस्सा यह स्पष्ट कर रहा है कि किस प्रकार समूह (या समूह के बिना रखें) एक श्रेणीगत चर के लिए प्रतिक्रियाओं की श्रेणियां, या संभव मूल्यों के डोमेन को अंतराल में (जहां बिन सीमाएं डालते हैं) को कैसे विभाजित किया जाए परिवर्तनशील प्रकार। सभी टिप्पणियों का प्रतिनिधित्व किया जाना चाहिए, और हर एक को केवल एक बार भूखंड में। इसका मतलब है कि बार आकार का योग अवलोकन की कुल गणना के बराबर होना चाहिए (या चर चौड़ाई के मामले में उनके क्षेत्र, जो कम आम दृष्टिकोण है)। या, यदि हिस्टोग्राम सामान्यीकृत है, तो सभी संभावनाओं को 1 तक जोड़ना होगा।
यदि डेटा स्वयं एक प्रतिक्रिया के रूप में "संभाव्यता" की एक सूची है, अर्थात अवलोकन अध्ययन की प्रत्येक वस्तु के लिए संभाव्यता मान (किसी चीज़ के) हैं तो सबसे अच्छा जवाब बस plt.hist(probability)
शायद बाइनिंग विकल्प के साथ है, और पहले से उपलब्ध एक्स-लेबल का उपयोग है। संदिग्ध।
तब बार प्लॉट को हिस्टोग्राम के रूप में नहीं बल्कि सीधे इस्तेमाल किया जाना चाहिए
import matplotlib.pyplot as plt
probability = [0.3602150537634409, 0.42028985507246375,
0.373117033603708, 0.36813186813186816, 0.32517482517482516,
0.4175257731958763, 0.41025641025641024, 0.39408866995073893,
0.4143222506393862, 0.34, 0.391025641025641, 0.3130841121495327,
0.35398230088495575]
plt.hist(probability)
plt.show()
परिणामों के साथ
इस तरह के मामले में matplotlib निम्नलिखित हिस्टोग्राम मूल्यों के साथ डिफ़ॉल्ट रूप से आता है
(array([1., 1., 1., 1., 1., 2., 0., 2., 0., 4.]),
array([0.31308411, 0.32380469, 0.33452526, 0.34524584, 0.35596641,
0.36668698, 0.37740756, 0.38812813, 0.39884871, 0.40956928,
0.42028986]),
<a list of 10 Patch objects>)
परिणाम सरणियों का एक समूह है, पहले सरणी में अवलोकन मायने रखता है, अर्थात प्लॉट के y- अक्ष के खिलाफ क्या दिखाया जाएगा (वे 13 तक जोड़ते हैं, टिप्पणियों की कुल संख्या) और दूसरा सरणी x के लिए अंतराल सीमाएं हैं -एक्सिस।
एक जाँच कर सकते हैं कि वे समान रूप से दूरी पर हैं,
x = plt.hist(probability)[1]
for left, right in zip(x[:-1], x[1:]):
print(left, right, right-left)
या, उदाहरण के लिए 3 डिब्बे (13 टिप्पणियों के लिए मेरा निर्णय कॉल) किसी को यह हिस्टोग्राम मिलेगा
plt.hist(probability, bins=3)
साजिश के साथ डेटा "सलाखों के पीछे" किया जा रहा है
प्रश्न के लेखक को यह स्पष्ट करने की आवश्यकता है कि मूल्यों की "संभावना" सूची का अर्थ क्या है - क्या "संभावना" प्रतिक्रिया चर का केवल एक नाम है (फिर क्यों हिस्टोग्राम के लिए एक्स-लेबल तैयार हैं, इसका कोई मतलब नहीं है ), या सूची मान डेटा से गणना की जाने वाली संभावनाएं हैं (फिर तथ्य यह है कि वे 1 तक नहीं जोड़ते हैं कोई मतलब नहीं है)।