utf-8 कोड त्रुटि आमतौर पर तब आती है जब संख्यात्मक मानों की सीमा 0 से 127 से अधिक हो जाती है।
इस अपवाद को बढ़ाने का कारण है:
1) यदि कोड बिंदु <128 है, तो प्रत्येक बाइट कोड बिंदु के मूल्य के समान है। 2) यदि कोड बिंदु 128 या अधिक है, तो यूनिकोड स्ट्रिंग को इस एन्कोडिंग में नहीं दिखाया जा सकता है। (अजगर इस मामले में एक यूनिकोडेनाकोड अपवाद को जन्म देता है।)
इसे दूर करने के लिए हमारे पास एन्कोडिंग का एक सेट है, जिसका सबसे व्यापक रूप से उपयोग किया जाता है "लैटिन -1, जिसे आईएसओ-8859-1 भी कहा जाता है"
तो ISO-8859-1 यूनिकोड अंक 0–255 लैटिन -1 मानों के समान हैं, इसलिए इस एन्कोडिंग में परिवर्तित करने के लिए कोड बिंदुओं को बाइट मानों में परिवर्तित करने की आवश्यकता होती है; यदि 255 से बड़ा कोड बिंदु सामने आया है, तो स्ट्रिंग को लैटिन -1 में एन्कोड नहीं किया जा सकता है
जब यह अपवाद तब होता है जब आप डेटा सेट को लोड करने का प्रयास कर रहे हैं, तो इस प्रारूप का उपयोग करके देखें
df=pd.read_csv("top50.csv",encoding='ISO-8859-1')
सिंटैक्स के अंत में एन्कोडिंग तकनीक जोड़ें जो तब डेटा सेट को लोड करने के लिए स्वीकार करता है।