चिप्स में अधिक से अधिक कोर क्यों होते हैं? बड़े सिंगल-कोर प्रोसेसर का निर्माण क्यों नहीं किया जाता है? क्या इसका निर्माण आसान है? यह अलग कोर का उपयोग करके कार्यक्रमों को अनुमति देने के लिए है?
चिप्स में अधिक से अधिक कोर क्यों होते हैं? बड़े सिंगल-कोर प्रोसेसर का निर्माण क्यों नहीं किया जाता है? क्या इसका निर्माण आसान है? यह अलग कोर का उपयोग करके कार्यक्रमों को अनुमति देने के लिए है?
जवाबों:
मल्टीपल कोर की ओर रुझान एक इंजीनियरिंग दृष्टिकोण है जो सीपीयू डिजाइनरों को बिजली की खपत की समस्या से बचने में मदद करता है जो कभी बढ़ती आवृत्ति स्केलिंग के साथ आया था। जैसे-जैसे सीपीयू की गति 3-4 Ghz में बढ़ी, तेजी से जाने के लिए आवश्यक विद्युत शक्ति की मात्रा निषेधात्मक होने लगी। इसके लिए तकनीकी कारण जटिल हैं, लेकिन गर्मी के नुकसान और लीकेज करंट (बिजली जो केवल कुछ उपयोगी किए बिना सर्किटरी से गुजरती है) जैसे कारक हैं, दोनों में तेजी से वृद्धि होती है। हालांकि 6 गीगाहर्ट्ज़ का सामान्य उद्देश्य x86 सीपीयू बनाना निश्चित रूप से संभव है, यह इतनी कुशलता से करने के लिए किफायती नहीं है। इसीलिए मल्टी-कोर की चाल शुरू हुई और यही कारण है कि हम देखेंगे कि जब तक समांतरिकरण मुद्दे असंवेदनशील नहीं हो जाते, तब तक यह प्रवृत्ति कम से कम जारी रहेगी।
एक व्यावहारिक उदाहरण के रूप में E5640 Xeon (4 कोर @ 2.66 गीगाहर्ट्ज) में 95 वाट का पावर लिफाफा है जबकि L5630 (4 कोर @ 2.13 गीगाहर्ट्ज) के लिए केवल 40 वाट की आवश्यकता है। सीपीयू के लिए 24% अधिक सीपीयू पावर के लिए 137% अधिक विद्युत शक्ति है जो कि अधिकांश भाग के लिए संगत है। X5677 कुछ और विशेषताओं के साथ 3.46 गीगाहर्ट्ज तक की गति को बढ़ाता है, लेकिन यह 225% विद्युत विद्युत शक्ति के लिए केवल 60% अधिक प्रसंस्करण शक्ति है।
अब नए X5660 (2.8 गीगा, 6 कोर, 95 वाट) के साथ X5560 (2.8 गीगाहर्ट्ज, 4 कोर, 95 वाट) की तुलना करें और सॉकेट में 50% अतिरिक्त कंप्यूटिंग शक्ति है (संभवतः, यह मानते हुए कि अमहल का कानून हमारे लिए दयालु है। अब) किसी भी अतिरिक्त विद्युत शक्ति की आवश्यकता के बिना। एएमडी की 6100 श्रृंखला सीपीयू विद्युत शक्ति खपत को सपाट रखते हुए 2400 \ 8400 श्रृंखला से अधिक प्रदर्शन में समान लाभ देखती है।
एकल-थ्रेडेड कार्यों के लिए यह एक समस्या है, लेकिन अगर आपकी आवश्यकताएं वितरित सीपीसी या वर्चुअलाइजेशन क्लस्टर में बड़ी मात्रा में सकल सीपीयू बिजली देने के लिए हैं तो यह एक उचित दृष्टिकोण है। इसका मतलब यह है कि अधिकांश सर्वर वातावरणों के लिए आज प्रत्येक सीपीयू में कोर की संख्या को मापना एक बेहतर तरीका है, जो तेजी से बेहतर सिंगल कोर सीपीयू बनाने की कोशिश कर रहा है।
प्रवृत्ति कुछ समय के लिए जारी रहेगी, लेकिन चुनौतियां हैं और लगातार कोर की संख्या को स्केल करना आसान नहीं है (मेमोरी बैंडविड्थ को पर्याप्त रूप से बनाए रखना और कैश को प्रबंधित करना बहुत कठिन हो जाता है क्योंकि कोर की संख्या बढ़ती है)। इसका मतलब है कि प्रति सॉकेट में कोर की संख्या में मौजूदा काफी विस्फोटक वृद्धि को एक दो पीढ़ियों में धीमा करना होगा और हम कुछ अन्य दृष्टिकोण देखेंगे।
उन्हें तेजी से उपयोगी बनाने के लिए बहुत मुश्किल हो रहा था।
समस्या यह है कि, आपको एक बार में निर्देशों के एक समूह पर काम करने की आवश्यकता है, वर्तमान x86 cpu में 80 या अधिक निर्देश हैं, जो एक ही बार में काम कर रहे हैं, और ऐसा लगता है कि यह सीमा है, क्योंकि यह P4 के साथ मारा गया था, बिल्ली , पेंटियम प्रो ने 1995 में 40 किया था। विशिष्ट निर्देश धाराएं उस से परे अनुमान लगाने योग्य नहीं हैं (आपको शाखाओं, मेमोरी एक्सेस, आदि का अनुमान लगाना होगा) एक बार में कुछ निर्देशों से अधिक निष्पादित करने के लिए (486 ने 5 किया, पेंटियम ने 10, मुश्किल से किया। ।
इसलिए जब आप उन्हें व्यापक बना सकते हैं (निर्देश के प्रत्येक टुकड़े को करने के लिए अधिक कार्यात्मक इकाइयाँ), लंबे समय तक (विलंबता को छिपाने के लिए गहरी पाइपलाइन), यह बहुत अच्छा नहीं लगता है। और हम घड़ी की गति के साथ एक दीवार को भी हिट करने लगते हैं। और हम अभी भी स्मृति से बाहर हैं। इसलिए कई सीपीयू में बंट जाना एक जीत है। इसके अलावा, वे कैश साझा कर सकते हैं।
इसके लिए काफी कुछ है, लेकिन यह पारंपरिक कार्यक्रमों के लिए उबलता है, किसी भी हार्डवेयर पर बहुत तेजी से नहीं चलाया जा सकता है जिसे हम कल्पना कर सकते हैं कि कैसे डिजाइन और निर्माण किया जाए।
अब अगर भविष्यवाणी करने में कोई समस्या नहीं है, उदाहरण के लिए, कई वैज्ञानिक समस्याएं और ग्राफिक्स (वे अक्सर संख्या के इस सेट को संख्याओं के इस समूह को गुणा करने के लिए उबालते हैं), यह मामला नहीं है, और इस तरह इंटेल की IA64 की लोकप्रियता ( इटेनियम) और जीपीयू, कि बस तेज हो रहे हैं, लेकिन वे आपको किसी भी बेहतर वर्ड को चलाने में मदद नहीं करेंगे।
एकल प्रोसेसर की कंप्यूटिंग शक्ति और घड़ी की आवृत्ति कुछ साल पहले अपने चरम पर पहुंच गई थी, बस वर्तमान की तुलना में अधिक शक्तिशाली और / या तेज प्रोसेसर बनाना आसान नहीं है; इसलिए प्रमुख सीपीयू निर्माताओं (इंटेल, एएमडी) ने रणनीति बदल दी और बहु-कोर बन गए। मल्टी-टास्किंग की पूरी शक्ति का उपयोग करने के लिए इस कोर्स को एप्लिकेशन डेवलपर्स से बहुत अधिक काम की आवश्यकता होती है: एक एकल कार्य पर चलने वाले प्रोग्राम को केवल मल्टी-कोर सीपीयू से कोई लाभ नहीं मिलता है (हालांकि सिस्टम को एक सिस्टम मिलता है समग्र बोनस क्योंकि यह लॉक नहीं होता है यदि कोई एकल प्रक्रिया एकल CPU को 100% उपयोग में लेती है)।
भौतिक वास्तुकला (मल्टीपल सिंगल-कोर वाले के बजाय मल्टी-कोर प्रोसेसर) के बारे में ... आपको इंटेल से पूछना चाहिए। लेकिन मुझे पूरा यकीन है कि मदरबोर्ड के साथ ऐसा करने के लिए कुछ एक ही सीपीयू सॉकेट के साथ डिजाइन करना और कई लोगों के साथ बोर्डों की तुलना में निर्माण करना बहुत आसान है।
घड़ी की गति बढ़ाने के लिए, चिप पर सिलिकॉन ट्रांजिस्टर को तेजी से स्विच करने में सक्षम होना चाहिए। इन उच्च गति के लिए उच्च इनपुट वोल्टेज और अर्धचालक विनिर्माण प्रक्रियाओं की आवश्यकता होती है जिसके परिणामस्वरूप अधिक रिसाव होता है , जिससे बिजली की खपत और गर्मी उत्पादन दोनों बढ़ जाते हैं। आप अंततः एक ऐसे बिंदु पर पहुँच जाते हैं जहाँ आप अत्यधिक मात्रा में बिजली की आवश्यकता के बिना या विदेशी शीतलन समाधानों का उपयोग किए बिना घड़ी की दरों को और अधिक नहीं बढ़ा सकते हैं।
इस समस्या को समझने के लिए, मैं दो आधुनिक एएमडी प्रोसेसर की तुलना करूँगा। एएमडी एफएक्स -9590 बॉक्स से बाहर 5 गीगाहर्ट्ज तक की घड़ी की गति प्राप्त करने में सक्षम है, लेकिन कोर वोल्टेज पर 1.912 वी तक संचालित होता है, जो कि 32 एनएम चिप के लिए बहुत अधिक है, और एक ऊष्मा 220 वाट गर्मी को नष्ट कर देता है । एफएक्स -8350, जो एक ही डाई पर आधारित है, अधिकतम 4.2 गीगाहर्ट्ज पर चलता है लेकिन अधिकतम 1.4 वी पर संचालित होता है और 125 वाट को नष्ट कर देता है।
परिणामस्वरूप, घड़ियों को और अधिक बढ़ाने की कोशिश करने के बजाय, इंजीनियरों ने चिप्स को अन्य तरीकों से अधिक तेजी से काम करने की मांग की है, जिसमें उन्हें एक साथ कई प्रक्रियाओं को चलाने के लिए डिजाइन करना शामिल है - इसलिए मल्टी-कोर प्रोसेसर।
मूर का नियम । मूल रूप से प्रोसेसर किसी भी तेज नहीं बनाया जा सकता है (5 साल पहले आवृत्ति 3 गीगाहर्ट्ज और कभी भी उस पर ज्यादा नहीं गई), इसलिए वे अधिक कोर प्राप्त करके अधिक शक्तिशाली बना दिए जाते हैं।