थीटा ज्वाइन, इक्विजिन और नेचुरल जॉइन में अंतर

Question 1

जब यह थीटा जुड़ने, समभुज और प्राकृतिक जुड़ने की बात आती है, तो मुझे संबंधिक बीजगणित को समझने में परेशानी हो रही है। क्या कोई मुझे बेहतर समझने में मदद कर सकता है? अगर मैं थीटा जॉइन पर = साइन का उपयोग करता हूं तो क्या यह बिल्कुल वैसा ही है जैसे किसी नेचुरल जॉइन का उपयोग करना?

Question 2

एक थीटा में शामिल होने के (जैसे ≥) मनमाने ढंग से तुलना संबंधों के लिए अनुमति देता है।

एक equijoin थीटा समानता ऑपरेटर का उपयोग शामिल होने के एक है।

एक प्राकृतिक जुड़ाव उन विशेषताओं पर एक समान है जिनका प्रत्येक रिश्ते में समान नाम है।

इसके अतिरिक्त, एक प्राकृतिक जुड़ाव समानता तुलना में शामिल डुप्लिकेट कॉलम को हटाता है, इसलिए प्रत्येक तुलना किए गए कॉलम में से केवल 1 ही रहता है; किसी न किसी संबंधपरक बीजगणितीय शब्दों में: ⋈ = π_{R,S-a_s} ○ ⋈_{a_R=a_S}

Question 3

हालांकि सटीक अंतर बताने वाले उत्तर ठीक हैं, मैं बताना चाहता हूं कि रिलेशनल बीजगणित को एसक्यूएल में कैसे बदला जाता है और 3 अवधारणाओं का वास्तविक मूल्य क्या है।

आपके प्रश्न में मुख्य अवधारणा एक जुड़ने का विचार है। किसी ज्वाइन को समझने के लिए आपको कार्टेसियन प्रोडक्ट को समझने की जरूरत है (उदाहरण एसक्यूएल पर आधारित है जहां समतुल्य को क्रॉस ज्वाइन कहा जाता है जैसा कि ऑनएडवाइन बताते हैं);

यह व्यवहार में बहुत उपयोगी नहीं है। इस उदाहरण पर विचार करें।

Product(PName, Price)
====================
Laptop,   1500
Car,      20000
Airplane, 3000000


Component(PName, CName, Cost)
=============================
Laptop, CPU,    500
Laptop, hdd,    300
Laptop, case,   700
Car,    wheels, 1000

कार्टेशियन उत्पाद उत्पाद x घटक होगा - बेलो या स्क्वल फ़िडल । आप देख सकते हैं कि 12 पंक्तियाँ हैं = 3 x 4. जाहिर है, "पहियों" के साथ "लैपटॉप" जैसी पंक्तियों का कोई मतलब नहीं है, यही कारण है कि व्यवहार में कार्टेशियन उत्पाद का उपयोग शायद ही कभी किया जाता है।

|    PNAME |   PRICE |  CNAME | COST |
--------------------------------------
|   Laptop |    1500 |    CPU |  500 |
|   Laptop |    1500 |    hdd |  300 |
|   Laptop |    1500 |   case |  700 |
|   Laptop |    1500 | wheels | 1000 |
|      Car |   20000 |    CPU |  500 |
|      Car |   20000 |    hdd |  300 |
|      Car |   20000 |   case |  700 |
|      Car |   20000 | wheels | 1000 |
| Airplane | 3000000 |    CPU |  500 |
| Airplane | 3000000 |    hdd |  300 |
| Airplane | 3000000 |   case |  700 |
| Airplane | 3000000 | wheels | 1000 |

इन उत्पादों के लिए अधिक मूल्य जोड़ने के लिए JOIN यहां हैं। हम वास्तव में चाहते हैं कि उत्पाद अपने संबंधित घटकों के साथ "शामिल" हो, क्योंकि प्रत्येक घटक एक उत्पाद से संबंधित है। ऐसा करने का तरीका एक जुड़ाव के साथ है:

उत्पाद नाम पर घटक शामिल हैं

संबंधित SQL क्वेरी इस तरह होगी (आप यहां सभी उदाहरणों के साथ खेल सकते हैं )

SELECT *
FROM Product
JOIN Component
  ON Product.Pname = Component.Pname

और परिणाम:

|  PNAME | PRICE |  CNAME | COST |
----------------------------------
| Laptop |  1500 |    CPU |  500 |
| Laptop |  1500 |    hdd |  300 |
| Laptop |  1500 |   case |  700 |
|    Car | 20000 | wheels | 1000 |

ध्यान दें कि परिणाम में केवल 4 पंक्तियाँ हैं, क्योंकि लैपटॉप में 3 घटक हैं, कार में 1 और हवाई जहाज कोई भी नहीं है। यह बहुत अधिक उपयोगी है।

अपने प्रश्नों पर वापस आते हुए, आपके द्वारा पूछे जाने वाले सभी योग जोइन के रूपांतर हैं जो मैंने अभी दिखाए हैं:

नैचुरल ज्वाइन = द ज्वाइन (ऑन क्लॉज) सभी कॉलम पर एक ही नाम से बना है; यह परिणाम से डुप्लिकेट कॉलम निकालता है, अन्य सभी जॉइन के विपरीत; अधिकांश DBMS (Microsoft के SQL Server, Oracle के MySQL आदि जैसे विभिन्न विक्रेताओं द्वारा बनाए गए डेटाबेस सिस्टम) भी इसका समर्थन करने से बाज नहीं आते हैं, यह सिर्फ बुरा व्यवहार है (या जानबूझकर इसे लागू नहीं करने के लिए चुना गया है)। कल्पना कीजिए कि एक डेवलपर आता है और उत्पाद में मूल्य से लागत तक के दूसरे कॉलम का नाम बदलता है। फिर सभी प्राकृतिक जुड़ाव PName और कॉस्ट पर किए जाएंगे, जिसके परिणामस्वरूप 0 नंबर्स बिना किसी नंबर के मेल खाते हैं।

थीटा ज्वाइन करें = यह सामान्य रूप से शामिल होने वाला हर व्यक्ति उपयोग करता है क्योंकि यह आपको स्थिति को निर्दिष्ट करने की अनुमति देता है (SQL में ON क्लाज)। आप अपनी पसंद के किसी भी हालत में शामिल हो सकते हैं, उदाहरण के लिए उन उत्पादों पर जिनमें पहले 2 अक्षर समान हैं, या जिनकी कीमत अलग है। व्यवहार में, यह शायद ही कभी होता है - 95% मामलों में आप एक समानता की स्थिति में शामिल होंगे, जो हमें निम्न की ओर ले जाता है:

इक्वि जॉइन = व्यवहार में प्रयुक्त सबसे आम। ऊपर दिया गया उदाहरण एक इक्वी जॉइन है। इस प्रकार के जॉइन के लिए डेटाबेस को ऑप्टिमाइज़ किया जाता है! एक इक्वी जॉइन का ओपोजिट एक नॉन-इक्वी जॉइन है, जब आप "=" के अलावा किसी अन्य कंडीशन में शामिल होते हैं। डेटाबेस इसके लिए अनुकूलित नहीं हैं! वे दोनों सामान्य थीटा में शामिल होते हैं। प्राकृतिक जुड़ना भी थीटा जुड़ना है लेकिन स्थिति (थीटा) निहित है।

जानकारी का स्रोत: यूनिवर्सिटी + प्रमाणित SQL सर्वर डेवलपर + ने हाल ही में स्टैनफोर्ड से "डेटाबेस का परिचय" पूरा किया है, इसलिए मैं कहता हूं कि मेरे मन में संबंधपरक बीजगणित ताजा है।

Question 4

@ आउटिस का जवाब अच्छा है: संबंध के अनुसार संक्षिप्त और सही।

हालाँकि, SQL के संबंध में स्थिति थोड़ी अधिक जटिल है।

सामान्य आपूर्तिकर्ताओं और भागों डेटाबेस पर विचार करें लेकिन SQL में लागू किया गया:

SELECT * FROM S NATURAL JOIN SP;

कॉलम के साथ एक परिणामी ** लौटाएगा

SNO, SNAME, STATUS, CITY, PNO, QTY

शामिल होने पर स्तंभ को दोनों तालिकाओं में एक ही नाम से प्रदर्शित किया जाता है SNO। ध्यान दें कि परिणामसेट में छह कॉलम हैं और केवल एक कॉलम के लिए है SNO।

अब थीटा एक्जीकॉइन पर विचार करें, जहां शामिल होने के लिए कॉलम के नाम स्पष्ट रूप से निर्दिष्ट होने चाहिए (प्लस रेंज चर Sऔर SPआवश्यक हैं):

SELECT * FROM S JOIN SP ON S.SNO = SP.SNO;

रिजल्ट में सात कॉलम होंगे, जिनमें दो कॉलम होंगे SNO। परिणामी नाम वे हैं जो SQL मानक "कार्यान्वयन पर निर्भर" के रूप में संदर्भित करता है, लेकिन इस तरह दिख सकता है:

SNO, SNAME, STATUS, CITY, SNO, PNO, QTY

या शायद यह

S.SNO, SNAME, STATUS, CITY, SP.SNO, PNO, QTY

दूसरे शब्दों में, NATURAL JOINएसक्यूएल में resultset से डुप्लिकेट किए गए नामों के साथ स्तंभों को निकालने के लिए विचार किया जा सकता है (लेकिन अफसोस डुप्लीकेट पंक्तियों को दूर नहीं होगा - आप परिवर्तन करने के लिए याद रखना चाहिए SELECTकरने के लिए SELECT DISTINCTअपने आप को)।

** मुझे पता नहीं है कि इसका परिणाम क्या SELECT * FROM table_expression;है। मुझे पता है कि यह एक संबंध नहीं है क्योंकि, अन्य कारणों के साथ, इसमें डुप्लिकेट नाम वाले कॉलम या बिना नाम वाले कॉलम हो सकते हैं। मुझे पता है कि यह एक सेट नहीं है क्योंकि, अन्य कारणों के बीच, स्तंभ क्रम महत्वपूर्ण है। यह SQL टेबल या SQL टेबल एक्सप्रेशन भी नहीं है। मैं इसे एक परिणाम कहता हूं।

Question 5

प्राकृतिक इक्वी का एक सबसेट है जो थीटा का सबसेट है।

अगर मैं थीटा जॉइन पर = साइन का उपयोग करता हूं तो क्या यह बिल्कुल वैसा ही है जैसे किसी नेचुरल जॉइन का उपयोग करना ???

जरूरी नहीं है, लेकिन यह एक इक्वी होगा। प्राकृतिक का मतलब है कि आप सभी समान नाम वाले कॉलम पर मेल कर रहे हैं, इक्वी का अर्थ है कि आप विशेष रूप से '=' का उपयोग कर रहे हैं (और 'से कम नहीं', जैसे, आदि)

यह शुद्ध शिक्षा है, हालांकि, आप वर्षों के लिए रिलेशनल डेटाबेस के साथ काम कर सकते हैं और कभी भी किसी को भी इन शर्तों का उपयोग करते हुए नहीं सुना होगा।

Question 6

थीटा ज्वाइन करें: जब आप किसी भी ऑपरेटर (जैसे, =, <,>,> = इत्यादि) का उपयोग करके जुड़ने के लिए एक क्वेरी बनाते हैं, तो उस ज्वाइन क्वेरी को थीटा जॉइन के अंतर्गत आता है।

इक्वी जॉइन: जब आप केवल समानता ऑपरेटर के उपयोग से जुड़ने के लिए एक क्वेरी बनाते हैं, तो वह ज्वाइन क्वेरी इक्वी जॉइन के अंतर्गत आती है।

उदाहरण:

> का चयन करें * महारानी विभाग से प्राप्त करें। विभाग = विभाग।
> चयन से * इनर जॉइन डेप यूटिंग (विभाग) से

यह दिखाएगा:
 _________________________________________________
| Emp.Name | Emp.DeptID | विभाग .नाम | विभाग
| | | | |

नोट: इक्वी जॉइन भी थीटा जॉइन है!

नेचुरल ज्वाइन: एक प्रकार का इक्वी ज्वाइन जो दोनों तालिकाओं में सभी समान नामों के कॉलम की तुलना करके निहित होता है।

नोट: यहां, ज्वाइन रिजल्ट में एक ही नाम वाले कॉलम की प्रत्येक जोड़ी के लिए केवल एक कॉलम है।

उदाहरण

 चयनित * प्राकृतिक जॉय विभाग से

यह दिखाएगा:
 _______________________________
| विभाग | Emp.Name | विभाग .नाम |
| | | |

Question 7

दो टेबलों का कार्टेशियन उत्पाद टुपल्स के सभी संभावित संयोजनों को गणित में उदाहरण देता है जैसे दो सेटों का क्रॉस उत्पाद। चूँकि कई बार कुछ जंक मान होते हैं जो कि स्मृति में अनावश्यक स्थान पर कब्जा कर लेते हैं इसलिए यहाँ भी बचाव के लिए आते हैं जो केवल उन विशेषताओं मूल्यों का संयोजन देते हैं जो आवश्यक हैं और सार्थक हैं।

इनर ज्वाइन दो बार तालिका में दोहराए गए फ़ील्ड को देता है, जबकि यहाँ शामिल होने से बार-बार स्तंभों को फ़िल्टर करने और केवल एक बार प्रदर्शित करने से समस्या हल होती है। ठीक है, दोनों एक ही काम करते हैं। प्राकृतिक जुड़ाव अधिक कुशल है क्योंकि यह मेमोरी को संरक्षित करता है। इसके अलावा, प्राकृतिक जुड़ाव में अतिरेक को हटा दिया जाता है।

दो टेबलों में से एक समान जुड़ाव ऐसा है कि वे केवल उन टुपल्स को प्रदर्शित करते हैं जो अन्य तालिका में मान से मेल खाते हैं उदाहरण के लिए: new1 और new2 दो तालिकाओं को होने दें। यदि sql क्वेरी का चयन करें * new1 से new1 पर नए 2 से जुड़ें। new =id.id (आईडी दो तालिकाओं में एक ही स्तंभ है) तो new2 तालिका से प्रारंभ करें और शामिल हों जो दूसरे तालिका में आईडी से मेल खाती है। इसके अलावा, नॉन इक्वी जॉइन में समानता ऑपरेटर नहीं है, जिनके पास <,> और ऑपरेटर के बीच है।

थीटा जॉइन में समतुल्यता ऑपरेटर सहित समानता और अन्य <,> तुलना ऑपरेटर शामिल हैं। जब यह समानता (=) ऑपरेटर का उपयोग करता है तो इसे इक्वी जॉइन के रूप में जाना जाता है।

Question 8

प्राकृतिक जुड़ाव: प्राकृतिक जुड़ाव तब संभव हो सकता है जब दो संबंधों में कम से कम एक सामान्य विशेषता हो।

थीटा ज्वाइन: थीटा जॉइन तब संभव हो सकता है जब किसी विशेष स्थिति पर दो कार्य करें।

इक्वी जॉइन: इक्विटी की स्थिति पर दो कार्य करने पर इक्विटी संभव हो सकती है। यह थीटा जॉइन का एक प्रकार है।