MySQL Collation utf8_unicode अंतर


10

लेकिन मैं MySQL Collation के महत्व पर पढ़ रहा हूं और मैंने संगतता और सटीकता के बारे में अब तक जो कुछ भी सीखा है वह इन 4 सबसे अच्छा दांव लगता है।

  • utf8_unicode_ci
  • utf8_unicode_520_ci
  • utf8mb4_unicode_ci
  • utf8mb4_unicode_520_ci

मेरी समझ से uft8mb4 म्यूटली भाषा (चरित्र) समर्थन (उदाहरण के लिए जापानी) के साथ चरित्र के लिए अच्छा होगा। uf8 केवल 3 बाइट्स का समर्थन करता है जबकि uf8mb4 4 बाइट्स का समर्थन करता है। तो ऐसा लगता है कि स्पष्ट विकल्प uf8mb4 होगा, लेकिन यह लग रहा है कि आपकी लंबाई सीमा है (अरे!

फिर आप 520 मानक को ध्यान में रखते हैं; जो अधिक प्रदान करता है, उस पर मुझे क्या मिल सकता है। लेकिन यह निश्चित रूप से मुद्दा है, मैं इसके बारे में बहुत कम पा सकता हूं। केवल लोगों का कहना है कि यह एक सुधार है, फिर भी बहुत अस्पष्ट है कि यह कैसे है।

मुझे लगता है कि मैं सबसे अधिक संभव प्रतिबंधों के साथ मिल सकता है ... मुझे लगा कि यहां कोई व्यक्ति एक या दो को जान सकता है। आधिकारिक MySQL साइट उतनी जानकारीपूर्ण नहीं थी जितनी मुझे उम्मीद थी कि यह थी।

4 में से जो सबसे अधिक संगतता, सटीकता और सबसे अधिक भंडारण लंबाई की पेशकश करेगा? इसके अलावा क्या वास्तव में 502 मानक के बीच बड़ा अंतर है?

जवाबों:


10

यूनिकोड कोलाजेशन नामों में यूनिकोड Collation Algorithm (UCA) के संस्करण को इंगित करने के लिए एक संस्करण संख्या शामिल हो सकती है, जिस पर कोलाज आधारित है। UCA- आधारित कोलाज नाम के संस्करण संख्या के बिना UCA भार कुंजियों का उपयोग करते हैंversion-4.0.0 । जैसे कि UCA 5.2.0 वज़न कुंजियोंutf8_unicode_520_ci पर आधारित है ।

Https://dev.mysql.com/doc/refman/5.6/en/charset-collation-names.html देखें ।


इस पर आगे व्याख्या करने के लिए: कोलाजेशन उपयोग किए गए एन्कोडिंग (जो MySQL गलत तरीके से कॉल करता है character setया charset) को संशोधित नहीं करेगा , इसलिए utf8आपको 3-बाइट (गैर-मानक) UTF-8 utf8mb4प्रदान करेगा और आपको 4-बाइट UTF-8 प्रदान करेगा।
ज्युनस

1
इतनी सरल अंग्रेजी में यूसीए 4.0.0 और यूसीए 5.2.0 के अलावा एक और नया क्या अंतर है। फायदा या नुकसान क्या होगा?
एडम

4
यह छँटाई को प्रभावित करता है। यदि आपको यूनिकोड मानक के अधिक हाल के (लेकिन अभी भी पुराने) संस्करण के खिलाफ छाँटने की आवश्यकता है, तो आप उपयोग करना चाह सकते हैं 520_ci। अपनी वेबसाइटों के लिए मैं कम देखभाल नहीं कर सकता।
मैथियास ब्यनेंस 19

टकराव में सबसे बड़ा बाइट आकार चरित्र का बाइट आकार क्या है utf8mb4_unicode_520_ci?
ओल्डबॉय
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.