बाइबिल हिब्रू के लिए मुझे किस महाविद्यालय का उपयोग करना चाहिए?


19

बाइबिल हिब्रू के लिए मुझे किस एसक्यूएल सर्वर कोलेशन का उपयोग करना चाहिए? विचाराधीन डेटाबेस को डायक्ट्रीक्स (जैसे, स्वर, उच्चारण, ट्रॉप, आदि) को समायोजित करने की आवश्यकता है।

जवाबों:


34

पहला: बाइबिल हिब्रू और आधुनिक हिब्रू के बीच कोई भेद, टकराव-वार नहीं है। हम सिर्फ हिब्रू से निपट रहे हैं।

दूसरा: किसी और चीज के बावजूद, आप कोलाज के नवीनतम सेट का उपयोग करना चाहते हैं, जो कि _100_श्रृंखला हैं क्योंकि उनके पास पुराने श्रृंखला की तुलना में नए / अधिक पूर्ण सॉर्ट वेट और भाषाई नियम हैं जिनका नाम में कोई संस्करण संख्या नहीं है (तकनीकी रूप से संस्करण हैं 80)।आम तौर पर मैं आपको जो भी कोलाजेशन की आवश्यकता होती है उसके नवीनतम संस्करण का उपयोग करने की सलाह देता हूं, लेकिन कम से कम इस एक उदाहरण में नाम में कोई संस्करण संख्या के साथ संस्करण का उपयोग करने का अच्छा कारण है। संस्करण 100 (या नया) टकराव कहीं अधिक पूर्ण है, और पूरक वर्णों के बीच अंतर कर सकते हैं (या यहां तक ​​कि अगर SCया किसी 140टकराव का उपयोग करते हुए पूरी तरह से उनका समर्थन करते हैं ), लेकिन यह मानते हुए कि आप पूरक वर्णों के साथ काम नहीं कर रहे हैं, तो संस्करण 80 (कोई संस्करण नहीं) संख्या नाम) टकराव हिब्रू से निपटने का एक बेहतर काम करते हैं (नीचे आइटम "छठे" देखें)।

तीसरा: हिब्रू में "काना" (या काना-प्रकार) की कोई अवधारणा नहीं है, इसलिए आप _KSउनके नामों के साथ किसी भी टकराव की विविधता को अनदेखा कर सकते हैं (जैसा कि वह संवेदनशीलता है जिसका आप कभी उपयोग नहीं करेंगे)।

फोर्थ:_SC समर्थन पूरक वर्ण (यानी पूर्ण UTF-16) में समाप्त होने वाली संपत्तियां आमतौर पर उनमें से किसी एक को लेने के लिए सबसे अच्छा है, यदि उपलब्ध हो (मतलब: यदि आप SQL सर्वर 2012 या नए का उपयोग कर रहे हैं)।

पांचवां: आप एक द्विआधारी टकराव ( _BINया _BIN2) नहीं चाहते हैं क्योंकि वे हिब्रू अक्षरों के बीच स्वर और दोलन के निशान के बीच अंतर नहीं कर सकते हैं जो समान हैं, लेकिन विभिन्न वर्णों में संयोजन वर्ण हैं, और न ही वे स्वर और अन्य चिह्नों को अनदेखा कर सकते हैं की तरह समानता बातें אऔर אֽ

उदाहरण के लिए (स्वर और छावनी चिह्न विपरीत क्रम में वर्णों को मिलाते हुए):

SELECT NCHAR(0x05D0) + NCHAR(0x059C) + NCHAR(0x05B8),
       NCHAR(0x05D0) + NCHAR(0x05B8) + NCHAR(0x059C)
WHERE  NCHAR(0x05D0) + NCHAR(0x059C) + NCHAR(0x05B8) =
       NCHAR(0x05D0) + NCHAR(0x05B8) + NCHAR(0x059C) COLLATE Hebrew_100_CS_AS_SC;
-- אָ֜  אָ֜

SELECT NCHAR(0x05D0) + NCHAR(0x059C) + NCHAR(0x05B8),
       NCHAR(0x05D0) + NCHAR(0x05B8) + NCHAR(0x059C)
WHERE  NCHAR(0x05D0) + NCHAR(0x059C) + NCHAR(0x05B8) =
       NCHAR(0x05D0) + NCHAR(0x05B8) + NCHAR(0x059C) COLLATE Hebrew_100_BIN2;
-- no rows

छठा: यह इस बात पर निर्भर करता है कि आप स्ट्रिंग मानों के साथ कैसे बातचीत करेंगे। हिब्रू में ऊपरी-मामले / निचले-मामले वाले पत्र नहीं हैं, फिर भी कुछ कोड बिंदु हैं जो केस-संवेदनशीलता से प्रभावित हैं। यहां तक ​​कि कुछ कोड बिंदु भी हैं जो चौड़ाई-संवेदनशील हैं। एक्सेंट-सेंसिटिव / असंवेदनशील स्वर, उच्चारण और छावनी के निशान (यानी ट्रॉप) के लिए उपयोग किए जाने वाले डायसरिटिक्स को प्रभावित करता है ।

  1. क्या आपको एक ही अक्षर के अंतिम और गैर-अंतिम रूपों के बीच अंतर करने की आवश्यकता है? हिब्रू में पाँच अक्षर हैं जो किसी शब्द के अंतिम अक्षर के रूप में उपयोग किए जाने पर अलग दिखते हैं। SQL सर्वर इसे केस-सेंसिटिविटी / _CSकोलाजेशन के माध्यम से संभालता है (हालाँकि, दुर्भाग्य से, यह नए में टूटता हुआ प्रतीत होता है, और आमतौर पर बेहतर, संस्करण 100 और नए कोलाज):

    SELECT NCHAR(0x05DE) AS [Mem],
           NCHAR(0x05DD) AS [Final Mem]
    WHERE  NCHAR(0x05DE) = NCHAR(0x05DD) COLLATE Hebrew_CI_AS_KS_WS;
    -- 1 row (expected; all sensitive except case)
    -- Mem  Final Mem
    -- ‭מ    ם
    
    
    SELECT NCHAR(0x05DE) AS [Mem],
           NCHAR(0x05DD) AS [Final Mem]
    WHERE  NCHAR(0x05DE) = NCHAR(0x05DD) COLLATE Hebrew_CS_AI;
    -- no rows (expected; all insensitive except case)
    
    
    SELECT NCHAR(0x05DE) AS [Mem],
           NCHAR(0x05DD) AS [Final Mem]
    WHERE  NCHAR(0x05DE) = NCHAR(0x05DD) COLLATE Hebrew_100_CI_AI;
    -- no rows (expected 1 row; all insensitive)
  2. क्या आपको उच्चारण चिह्नों, स्वरों और छावनी के निशान के बीच अंतर करने की आवश्यकता है? एसक्यूएल सर्वर इसे उच्चारण-संवेदनशीलता / _ASकोलाजेशन के माध्यम से संभालता है (हालांकि, दुर्भाग्य से, यह नए में टूटा हुआ प्रतीत होता है, और आमतौर पर बेहतर, संस्करण 100 और नए टकराव)। कृपया ध्यान दें कि इन तीनों को एक साथ उच्चारण-संवेदनशीलता के तहत वर्गीकृत किया गया है और अलग से नियंत्रित नहीं किया जा सकता है (यानी आप संवेदनशील लेकिन छावनी चिह्न असंवेदनशील नहीं कर सकते हैं)।

    उच्चारण के निशान

    कई अक्षर हैं जिनमें दो अलग-अलग ध्वनियां हैं। कभी-कभी एकमात्र संकेतक जिसके लिए ध्वनि का उपयोग किया जाता है वह यह है कि पत्र किस शब्द का संदर्भ है (और कभी-कभी आसपास के शब्द भी), जैसे कि वास्तविक टोरा में (जहां कोई उच्चारण चिह्न या स्वर नहीं हैं)। लेकिन, अन्य रूपों के साथ-साथ अन्य पाठों में भी, पाठ के अंदर या पत्र शिन के लिए या तो पत्र के अंदर या तो बिंदुओं को रखा जाएगा। शिन अक्षर में या तो "श" या "स" ध्वनि हो सकती है। "श" ध्वनि (यानी अक्षर "शिन") को इंगित करने के लिए, दाईं ओर ऊपर एक बिंदु है, जबकि बाईं ओर ऊपर एक बिंदु "एस" ध्वनि (अक्षर "पाप") को दर्शाता है:

    SELECT NCHAR(0x05E9) AS [Shin],                            -- ש
           NCHAR(0x05E9) + NCHAR(0x05C1) AS [Shin + Shin Dot], -- שׁ
           NCHAR(0x05E9) + NCHAR(0x05C2) AS [Shin + Sin Dot]   -- שׂ
    WHERE  NCHAR(0x05E9) = NCHAR(0x05E9) + NCHAR(0x05C1) COLLATE Hebrew_CS_AI_KS_WS
    AND    NCHAR(0x05E9) = NCHAR(0x05E9) + NCHAR(0x05C2) COLLATE Hebrew_CS_AI_KS_WS;
    -- 1 row (expected; all sensitive except accent)
    
    
    SELECT NCHAR(0x05E9) AS [Shin],                            -- ש
           NCHAR(0x05E9) + NCHAR(0x05C1) AS [Shin + Shin Dot], -- שׁ
           NCHAR(0x05E9) + NCHAR(0x05C2) AS [Shin + Sin Dot]   -- שׂ
    WHERE  NCHAR(0x05E9) = NCHAR(0x05E9) + NCHAR(0x05C1) COLLATE Hebrew_CI_AS
    OR     NCHAR(0x05E9) = NCHAR(0x05E9) + NCHAR(0x05C2) COLLATE Hebrew_CI_AS;
    -- no rows (expected; all insensitive except accent)
    
    
    SELECT NCHAR(0x05E9) AS [Shin],                            -- ש
           NCHAR(0x05E9) + NCHAR(0x05C1) AS [Shin + Shin Dot], -- שׁ
           NCHAR(0x05E9) + NCHAR(0x05C2) AS [Shin + Sin Dot]   -- שׂ
    WHERE  NCHAR(0x05E9) = NCHAR(0x05E9) + NCHAR(0x05C1) COLLATE Hebrew_100_CI_AI_SC
    OR     NCHAR(0x05E9) = NCHAR(0x05E9) + NCHAR(0x05C2) COLLATE Hebrew_100_CI_AI_SC;
    -- no rows (expected 1 row; all insensitive)

    स्वर वर्ण

    SELECT NCHAR(0x05D0) AS [Aleph],                           -- א
           NCHAR(0x05D0) + NCHAR(0x05B8) AS [Aleph with vowel] -- אָ
    WHERE  NCHAR(0x05D0) =
           NCHAR(0x05D0) + NCHAR(0x05B8) COLLATE Hebrew_CS_AI_KS_WS;
    -- 1 row (expected; all sensitive except accent)
    
    
    SELECT NCHAR(0x05D0) AS [Aleph],                           -- א
           NCHAR(0x05D0) + NCHAR(0x05B8) AS [Aleph with vowel] -- אָ
    WHERE  NCHAR(0x05D0) =
           NCHAR(0x05D0) + NCHAR(0x05B8) COLLATE Hebrew_CI_AS;
    -- no rows (expected; all insensitive except accent)
    
    
    SELECT NCHAR(0x05D0) AS [Aleph],                           -- א
           NCHAR(0x05D0) + NCHAR(0x05B8) AS [Aleph with vowel] -- אָ
    WHERE  NCHAR(0x05D0) =
           NCHAR(0x05D0) + NCHAR(0x05B8) COLLATE Hebrew_100_CI_AI_SC;
    -- no rows (expected 1 row; all insensitive)

    छावनी के निशान

    तकनीकी रूप से, आधिकारिक यूनिकोड आंकड़ों के अनुसार, हिब्रू छावनी के निशान आग्नेय हैं और केवल द्विआधारी राशन का उपयोग करते समय यहां अंतर के रूप में पंजीकृत होना चाहिए । हालाँकि, SQL सर्वर उन्हें एक्सेंट (दुर्भाग्य से) के समान मानता है और उन्हें उच्चारण के निशान या स्वर से अलग से अनदेखा नहीं कर सकता है।

    SELECT NCHAR(0x05D0) AS [Aleph],                                       -- א
           NCHAR(0x05D0) + NCHAR(0x05A8) AS [Aleph with cantillation mark] -- א֨
    WHERE  NCHAR(0x05D0) =
           NCHAR(0x05D0) + NCHAR(0x05A8) COLLATE Hebrew_CS_AI_KS_WS;
    -- 1 row (expected; all sensitive except accent)
    
    
    SELECT NCHAR(0x05D0) AS [Aleph],                                       -- א
           NCHAR(0x05D0) + NCHAR(0x05A8) AS [Aleph with cantillation mark] -- א֨
    WHERE  NCHAR(0x05D0) =
           NCHAR(0x05D0) + NCHAR(0x05A8) COLLATE Hebrew_CI_AS;
    -- no rows (expected; all insensitive except accent)
    
    
    SELECT NCHAR(0x05D0) AS [Aleph],                                       -- א
           NCHAR(0x05D0) + NCHAR(0x05A8) AS [Aleph with cantillation mark] -- א֨
    WHERE  NCHAR(0x05D0) =
           NCHAR(0x05D0) + NCHAR(0x05A8) COLLATE Hebrew_100_CI_AI_SC;
    -- no rows (expected 1 row; all insensitive)
  3. क्या आपको एक ही अक्षर के व्यापक और गैर-विस्तृत रूपों के बीच अंतर करने की आवश्यकता है? हिब्रू में आठ अक्षर हैं जो विस्तृत हैं (विस्तृत) लेकिन केवल टोरा स्क्रॉल (या तो हाथ से लिखे गए / वास्तविक या मुद्रित) में उपयोग के उद्देश्य के लिए पूरी तरह से उचित स्तंभ प्रारूप (जो वास्तव में यह कैसे टोरा स्क्रॉल में प्रकट होता है रखने के लिए) )। SQL सर्वर इसे चौड़ाई-संवेदनशीलता / _WSकोलाजेशन के माध्यम से संभालता है (दिलचस्प रूप से पर्याप्त है, यह एकमात्र संवेदनशीलता प्रतीत होती है जो नए संस्करण 100 और नए कोलाज में सही ढंग से काम करती है, हालांकि दुख की बात है, इसका उपयोग किए जाने की संभावना कम है):

    SELECT NCHAR(0x05DC) AS [Lamed],
           NCHAR(0xFB25) AS [Wide Lamed]
    WHERE  NCHAR(0x05DC) = NCHAR(0xFB25) COLLATE Hebrew_CI_AI;
    -- no rows (expected 1 row; all insensitive)
    
    
    SELECT NCHAR(0x05DC) AS [Lamed],
           NCHAR(0xFB25) AS [Wide Lamed]
    WHERE  NCHAR(0x05DC) = NCHAR(0xFB25) COLLATE Hebrew_100_CS_AS_KS_SC;
    -- 1 row (expected; all sensitive except width)
    -- Lamed    Wide Lamed
    -- ‭ל        ﬥ
    
    
    SELECT NCHAR(0x05DC) AS [Lamed],
           NCHAR(0xFB25) AS [Wide Lamed]
    WHERE  NCHAR(0x05DC) = NCHAR(0xFB25) COLLATE Hebrew_100_CI_AI_WS_SC;
    -- no rows (expected; all insensitive except width)

तो, शायद Hebrew_CI_AIकॉलम के लिए, और आप अभिव्यक्ति के अनुसार ओवरराइड कर सकते हैं / COLLATEकथन के माध्यम से भविष्यवाणी कर सकते हैं यदि आपको किसी भिन्नता का उपयोग करने की आवश्यकता है, जैसे कि COLLATE Hebrew_CS_AIया Hebrew_CI_ASया Hebrew_CS_AS

अतिरिक्त नोट्स

  1. आपको NVARCHARकॉलम / वैरिएबल में डेटा स्टोर करना होगा । आप Windows-1255 कोड पृष्ठ (जो सभी टकराव का उपयोग करते हैं) का नियमित 8-बिट में अधिकांशVARCHAR उपयोग कर सकते हैं , जिसमें स्वर और उच्चारण बिंदुओं के लिए वर्ण शामिल हैं:Hebrew_*

    ;WITH Hebrew AS
    (
        SELECT NCHAR(0x05E9) + NCHAR(0x05C1) + NCHAR(0x05B8)
               COLLATE Hebrew_100_CS_AS AS [Shin]
    )
    SELECT
      Hebrew.[Shin] AS [Unicode],
      CONVERT(VARCHAR(20), Hebrew.[Shin]) AS [CodePage1255],
      CONVERT(VARBINARY(10), CONVERT(VARCHAR(20), Hebrew.[Shin])) AS [CodePage1255_bytes]
    FROM   Hebrew;
    -- Unicode  CodePage1255    CodePage1255_bytes
    -- שָׁ        שָׁ               F9D1C8
    

    हालाँकि, केवल यूनिकोड हिब्रू ब्लॉक में छावनी चिह्न (यानी ट्रॉप; कोड अंक U + 0591 U + 05AF के माध्यम से) और कुछ अतिरिक्त (U + 05C7 के माध्यम से कोड U + 05C4 अंक), और वर्णनात्मक प्रस्तुति प्रपत्र ब्लॉक विस्तृत हैं कई अक्षरों के संस्करण और कुछ अन्य सामान।

  2. कृपया यूनिकोड कैसे हिब्रू पाठ को हैंडल करता है, इस बारे में अधिक विस्तृत विवरण के लिए कृपया आधिकारिक यूनिकोड स्टैंडर्ड (संस्करण 12.1), अध्याय 9: मध्य पूर्व- I, अनुभाग 9.1: हिब्रू, पृष्ठ 361-366 (पीडीएफ के 389-394) देखें।
  3. आधिकारिक यूनिकोड सीएलडीआर (स्थानीय-विशिष्ट टेलरिंग) के अनुसार हिब्रू ("वह" और "वह-आईएल") संस्कृति के लिए नियम, U + 05F3 HEBREW PUNCTUATION GERESH को या तो मैच होना चाहिए या पहले आना चाहिए , U + 0027 APOSTROPHE। सामान्य तौर पर, एपोस्ट्रोफ के बाद U + 05F3 प्रकार । आईसीयू कोलाज डेमो का उपयोग करते समय और "रूट" / मानक सॉर्ट ऑर्डर (यूएस अंग्रेजी / "एन-यूएस" द्वारा उपयोग किया जाता है) और "वह" के बीच स्विच करने पर यह व्यवहार वास्तव में देखा जाता है। हालाँकि, यह व्यवहार .NET या SQL सर्वर में उपलब्ध नहीं लगता है:

    SELECT NCHAR(0x05F3)
    WHERE  NCHAR(0x05F3) <= N'''' COLLATE Hebrew_100_CS_AS_KS_WS;
    -- no rows
    
    SELECT NCHAR(0x05F3)
    WHERE  NCHAR(0x05F3) <= N'''' COLLATE Hebrew_CS_AS_KS_WS;
    -- no rows

    एक दुर्भाग्यपूर्ण चूक के दौरान, यह समझ में आता है कि मैं विंडोज सॉर्टिंग वेट टेबल फाइलों में कोई "वह" या "वह-आईएल" -सांस्कृतिक दर्जी नहीं देखता। इसका बहुत मतलब यह हो सकता है कि संबंधित कोड पृष्ठ के बाहर Hebrew_*और Latin1_General_*टकराव के बीच कोई वास्तविक अंतर नहीं है , जो केवल VARCHARडेटा के लिए उपयोग किया जाता है , और यह यहां लागू नहीं होता है।

  4. कृपया संबंधित प्रश्न और उत्तर देखें: हाउ टू स्ट्रिप हिब्रू एक्सेंट मार्क्स

ओपी ने जवाब दिया:

हां, मुझे इसके बीच अंतर करने की आवश्यकता है: 1) एक ही अक्षर के अंतिम और गैर-अंतिम रूप 2) उच्चारण चिह्न 3) स्वर, और 4) छावनी निशान।

उस स्थिति में, चूंकि आपको उन गुणों के बीच के मतभेदों को नजरअंदाज करने की आवश्यकता नहीं है, इसलिए आप 100 स्तर के टकराव का उपयोग कर सकते हैं। नीचे दिए गए उदाहरण में एक हिब्रू चिह्न (पाप) एक उच्चारण चिह्न, एक छावनी चिह्न और एक स्वर दिखाई देता है। छह संस्करण हैं ताकि संयोजन वर्णों के आदेश के प्रत्येक संभावित संयोजन का प्रतिनिधित्व किया जा सके। एक सातवीं प्रविष्टि है जो शिन को एक ही आधार पत्र, स्वर और छावनी के निशान के साथ बनाने के लिए अन्य डॉट का उपयोग करती है। क्वेरी से पता चलता है कि केवल छह "पाप" प्रविष्टियां एक दूसरे से मेल खाती हैं (यहां तक ​​कि अलग-अलग बाइट आदेशों के साथ), लेकिन "शिन" नहीं।

मैंने यह दिखाने के लिए Latin1_Generalऔर Japanese_XJIS_140collations का उपयोग शामिल किया कि नियम उन लोगों के साथ भी काम करते हैं, जब आपको उनके उपयोग की आवश्यकता होती है ( 140टकराव, केवल जापानी में, पुराने संस्करणों की तुलना में अधिक ऊपरी-केस / लोअर-केस मैपिंग)। लेकिन सामान्य तौर पर, संभवतः हिब्रू टकरावों के साथ रहना, और 100यदि आप स्वरों, निशान, बिंदुओं और अंतिम बनाम गैर-अंतिम रूपों में अंतर को नजरअंदाज करना चाहते हैं, तो गैर- संस्करण का उपयोग करें ।

DECLARE @Shin   NVARCHAR(5) = NCHAR(0x05E9), -- base Hebrew letter
        @Dot    NVARCHAR(5) = NCHAR(0x05C2), -- Sin Dot
        @Mark   NVARCHAR(5) = NCHAR(0x05A8), -- Cantillation Mark (i.e. trope)
        @Vowel  NVARCHAR(5) = NCHAR(0x05B8); -- Vowel

DECLARE @Dot_Mark_Vowel NVARCHAR(20) = @Shin + @Dot + @Mark + @Vowel,
        @Dot_Vowel_Mark NVARCHAR(20) = @Shin + @Dot + @Vowel + @Mark,
        @Vowel_Dot_Mark NVARCHAR(20) = @Shin + @Vowel + @Dot + @Mark,
        @Vowel_Mark_Dot NVARCHAR(20) = @Shin + @Vowel + @Mark + @Dot,
        @Mark_Vowel_Dot NVARCHAR(20) = @Shin + @Mark + @Vowel + @Dot,
        @Mark_Dot_Vowel NVARCHAR(20) = @Shin + @Mark + @Dot + @Vowel,
        @ShinDot_Mark_Vowel NVARCHAR(20) = @Shin + NCHAR(0x05C1) + @Mark + @Vowel;

SELECT @Dot_Mark_Vowel AS [Sin], @ShinDot_Mark_Vowel AS [Shin];

;WITH chr AS
(
  SELECT *
  FROM   (VALUES
            (@Dot_Mark_Vowel, 'Dot + Mark + Vowel'),
            (@Dot_Vowel_Mark, 'Dot + Vowel + Mark'),
            (@Vowel_Dot_Mark, 'Vowel + Dot + Mark'),
            (@Vowel_Mark_Dot, 'Vowel + Mark + Dot'),
            (@Mark_Vowel_Dot, 'Mark + Vowel + Dot'),
            (@Mark_Dot_Vowel, 'Mark + Dot + Vowel'),
            (@ShinDot_Mark_Vowel, 'ShinDot + Mark + Vowel')
         ) tmp([Hebrew], [Description])
) SELECT chr1.[Hebrew],
         '--' AS [---],
         chr1.[Description] AS [Description_1],
         CONVERT(VARBINARY(20), RIGHT(chr1.[Hebrew], 3)) AS [Bytes_1],
         '--' AS [---],
         chr2.[Description] AS [Description_2],
         CONVERT(VARBINARY(20), RIGHT(chr2.[Hebrew], 3)) AS [Bytes_2]
  FROM   chr chr1
  CROSS JOIN chr chr2
  WHERE  chr1.[Description] <> chr2.[Description] -- do not compare item to itself
  AND    chr1.[Hebrew] = chr2.[Hebrew] COLLATE Hebrew_100_CS_AS_SC
  AND    chr1.[Hebrew] = chr2.[Hebrew] COLLATE Latin1_General_100_CS_AS_SC
  AND    chr1.[Hebrew] = chr2.[Hebrew] COLLATE Japanese_XJIS_140_CS_AS;

-- this query returns 30 rows

हां, मुझे इसके बीच अंतर करने की आवश्यकता है: 1) एक ही अक्षर के अंतिम और गैर-अंतिम रूप 2) उच्चारण चिह्न 3) स्वर, और 4) छावनी निशान।
brian12345

1
@ brian12345 उस अद्यतन के लिए धन्यवाद। मैं उत्तर के एक नए, अंतिम खंड में उस स्पष्टीकरण को संबोधित करने के लिए अपने उत्तर को अपडेट करता हूं। समीक्षा करें।
सोलोमन रटज़की

धन्यवाद, सोलोमन। बहुत मददगार।
bri12312345

8

यह बहुत सी चीजों पर निर्भर करता है। Collation सॉर्टिंग, तुलना और गैर-यूनिकोड कोड पृष्ठ है।

इस रेपो में हिब्रू के आसपास विकल्पों की एक अच्छी सूची है।

+---------------------------+---------------------------------------------------------------------------------------------------------------------+
| Hebrew_BIN                | Hebrew, binary sort                                                                                                 |
| Hebrew_BIN2               | Hebrew, binary code point comparison sort                                                                           |
| Hebrew_CI_AI              | Hebrew, case-insensitive, accent-insensitive, kanatype-insensitive, width-insensitive                               |
| Hebrew_CI_AI_WS           | Hebrew, case-insensitive, accent-insensitive, kanatype-insensitive, width-sensitive                                 |
| Hebrew_CI_AI_KS           | Hebrew, case-insensitive, accent-insensitive, kanatype-sensitive, width-insensitive                                 |
| Hebrew_CI_AI_KS_WS        | Hebrew, case-insensitive, accent-insensitive, kanatype-sensitive, width-sensitive                                   |
| Hebrew_CI_AS              | Hebrew, case-insensitive, accent-sensitive, kanatype-insensitive, width-insensitive                                 |
| Hebrew_CI_AS_WS           | Hebrew, case-insensitive, accent-sensitive, kanatype-insensitive, width-sensitive                                   |
| Hebrew_CI_AS_KS           | Hebrew, case-insensitive, accent-sensitive, kanatype-sensitive, width-insensitive                                   |
| Hebrew_CI_AS_KS_WS        | Hebrew, case-insensitive, accent-sensitive, kanatype-sensitive, width-sensitive                                     |
| Hebrew_CS_AI              | Hebrew, case-sensitive, accent-insensitive, kanatype-insensitive, width-insensitive                                 |
| Hebrew_CS_AI_WS           | Hebrew, case-sensitive, accent-insensitive, kanatype-insensitive, width-sensitive                                   |
| Hebrew_CS_AI_KS           | Hebrew, case-sensitive, accent-insensitive, kanatype-sensitive, width-insensitive                                   |
| Hebrew_CS_AI_KS_WS        | Hebrew, case-sensitive, accent-insensitive, kanatype-sensitive, width-sensitive                                     |
| Hebrew_CS_AS              | Hebrew, case-sensitive, accent-sensitive, kanatype-insensitive, width-insensitive                                   |
| Hebrew_CS_AS_WS           | Hebrew, case-sensitive, accent-sensitive, kanatype-insensitive, width-sensitive                                     |
| Hebrew_CS_AS_KS           | Hebrew, case-sensitive, accent-sensitive, kanatype-sensitive, width-insensitive                                     |
| Hebrew_CS_AS_KS_WS        | Hebrew, case-sensitive, accent-sensitive, kanatype-sensitive, width-sensitive                                       |
| Hebrew_100_BIN            | Hebrew-100, binary sort                                                                                             |
| Hebrew_100_BIN2           | Hebrew-100, binary code point comparison sort                                                                       |
| Hebrew_100_CI_AI          | Hebrew-100, case-insensitive, accent-insensitive, kanatype-insensitive, width-insensitive                           |
| Hebrew_100_CI_AI_WS       | Hebrew-100, case-insensitive, accent-insensitive, kanatype-insensitive, width-sensitive                             |
| Hebrew_100_CI_AI_KS       | Hebrew-100, case-insensitive, accent-insensitive, kanatype-sensitive, width-insensitive                             |
| Hebrew_100_CI_AI_KS_WS    | Hebrew-100, case-insensitive, accent-insensitive, kanatype-sensitive, width-sensitive                               |
| Hebrew_100_CI_AS          | Hebrew-100, case-insensitive, accent-sensitive, kanatype-insensitive, width-insensitive                             |
| Hebrew_100_CI_AS_WS       | Hebrew-100, case-insensitive, accent-sensitive, kanatype-insensitive, width-sensitive                               |
| Hebrew_100_CI_AS_KS       | Hebrew-100, case-insensitive, accent-sensitive, kanatype-sensitive, width-insensitive                               |
| Hebrew_100_CI_AS_KS_WS    | Hebrew-100, case-insensitive, accent-sensitive, kanatype-sensitive, width-sensitive                                 |
| Hebrew_100_CS_AI          | Hebrew-100, case-sensitive, accent-insensitive, kanatype-insensitive, width-insensitive                             |
| Hebrew_100_CS_AI_WS       | Hebrew-100, case-sensitive, accent-insensitive, kanatype-insensitive, width-sensitive                               |
| Hebrew_100_CS_AI_KS       | Hebrew-100, case-sensitive, accent-insensitive, kanatype-sensitive, width-insensitive                               |
| Hebrew_100_CS_AI_KS_WS    | Hebrew-100, case-sensitive, accent-insensitive, kanatype-sensitive, width-sensitive                                 |
| Hebrew_100_CS_AS          | Hebrew-100, case-sensitive, accent-sensitive, kanatype-insensitive, width-insensitive                               |
| Hebrew_100_CS_AS_WS       | Hebrew-100, case-sensitive, accent-sensitive, kanatype-insensitive, width-sensitive                                 |
| Hebrew_100_CS_AS_KS       | Hebrew-100, case-sensitive, accent-sensitive, kanatype-sensitive, width-insensitive                                 |
| Hebrew_100_CS_AS_KS_WS    | Hebrew-100, case-sensitive, accent-sensitive, kanatype-sensitive, width-sensitive                                   |
| Hebrew_100_CI_AI_SC       | Hebrew-100, case-insensitive, accent-insensitive, kanatype-insensitive, width-insensitive, supplementary characters |
| Hebrew_100_CI_AI_WS_SC    | Hebrew-100, case-insensitive, accent-insensitive, kanatype-insensitive, width-sensitive, supplementary characters   |
| Hebrew_100_CI_AI_KS_SC    | Hebrew-100, case-insensitive, accent-insensitive, kanatype-sensitive, width-insensitive, supplementary characters   |
| Hebrew_100_CI_AI_KS_WS_SC | Hebrew-100, case-insensitive, accent-insensitive, kanatype-sensitive, width-sensitive, supplementary characters     |
| Hebrew_100_CI_AS_SC       | Hebrew-100, case-insensitive, accent-sensitive, kanatype-insensitive, width-insensitive, supplementary characters   |
| Hebrew_100_CI_AS_WS_SC    | Hebrew-100, case-insensitive, accent-sensitive, kanatype-insensitive, width-sensitive, supplementary characters     |
| Hebrew_100_CI_AS_KS_SC    | Hebrew-100, case-insensitive, accent-sensitive, kanatype-sensitive, width-insensitive, supplementary characters     |
| Hebrew_100_CI_AS_KS_WS_SC | Hebrew-100, case-insensitive, accent-sensitive, kanatype-sensitive, width-sensitive, supplementary characters       |
| Hebrew_100_CS_AI_SC       | Hebrew-100, case-sensitive, accent-insensitive, kanatype-insensitive, width-insensitive, supplementary characters   |
| Hebrew_100_CS_AI_WS_SC    | Hebrew-100, case-sensitive, accent-insensitive, kanatype-insensitive, width-sensitive, supplementary characters     |
| Hebrew_100_CS_AI_KS_SC    | Hebrew-100, case-sensitive, accent-insensitive, kanatype-sensitive, width-insensitive, supplementary characters     |
| Hebrew_100_CS_AI_KS_WS_SC | Hebrew-100, case-sensitive, accent-insensitive, kanatype-sensitive, width-sensitive, supplementary characters       |
| Hebrew_100_CS_AS_SC       | Hebrew-100, case-sensitive, accent-sensitive, kanatype-insensitive, width-insensitive, supplementary characters     |
| Hebrew_100_CS_AS_WS_SC    | Hebrew-100, case-sensitive, accent-sensitive, kanatype-insensitive, width-sensitive, supplementary characters       |
| Hebrew_100_CS_AS_KS_SC    | Hebrew-100, case-sensitive, accent-sensitive, kanatype-sensitive, width-insensitive, supplementary characters       |
| Hebrew_100_CS_AS_KS_WS_SC | Hebrew-100, case-sensitive, accent-sensitive, kanatype-sensitive, width-sensitive, supplementary characters         |
+---------------------------+---------------------------------------------------------------------------------------------------------------------+
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.