जैसा कि हम जानते हैं कि सीपीयू एक ही थंबनेल पर बहुत अधिक अरबों ट्रांजिस्टर है, अगर ट्रांजिस्टर में से एक टूट जाए तो क्या होगा?
क्या सीपीयू में कोई ऑटो-रिकवरी तंत्र है?
जैसा कि हम जानते हैं कि सीपीयू एक ही थंबनेल पर बहुत अधिक अरबों ट्रांजिस्टर है, अगर ट्रांजिस्टर में से एक टूट जाए तो क्या होगा?
क्या सीपीयू में कोई ऑटो-रिकवरी तंत्र है?
जवाबों:
यह आसान है, हम उन्हें बेचने से पहले उनका परीक्षण करते हैं और बुरे लोगों को बाहर फेंक देते हैं।
ऐसा करने के बहुत सारे तरीके हैं - अलग-अलग लोग अलग-अलग काम करते हैं, अक्सर एक संयोजन का उपयोग करते हैं:
कुछ परीक्षणों की गति यह सुनिश्चित करने के लिए है कि वे पर्याप्त तेजी से चलते हैं।
अन्य परीक्षणों में एक मोड शामिल होता है जो चिप में कुछ या सभी फ्लिपफ्लॉप को विशाल सीरियल शिफ्ट रजिस्टरों में बदल देता है, हम ज्ञात डेटा को उन जंजीरों में देखते हैं, फिर एक घड़ी के लिए चिप को चलाते हैं और फिर नए परिणामों को वापस स्कैन करते हैं और जांचते हैं कि वे मेल खाते हैं हमारे अनुमानित परिणाम - स्वचालित परीक्षण उपकरण "स्कैन वैक्टर" का एक न्यूनतम सेट उत्पन्न करते हैं जो चिप पर प्रत्येक यादृच्छिक गेट या ट्रांजिस्टर का परीक्षण करेगा - अन्य वैक्टर राम ब्लॉकों के विशेष परीक्षण करते हैं,
दूसरों का परीक्षण है कि बाहरी तार सही ढंग से बंधे हैं
हम यह सुनिश्चित करते हैं कि यह एक अस्वास्थ्यकर राशि को खींच नहीं रहा है
परीक्षण के समय में पैसे खर्च होते हैं, हम कभी-कभी स्पष्ट मृत चिप्स के लिए कुछ सरल परीक्षण करते हैं इससे पहले कि वे बुरे लोगों को छोड़ने के लिए पैक किए जाते हैं और फिर पैकेजिंग के बाद अधिक परीक्षण किया जाता है
दूसरों ने जो कहा है उस पर थोड़ा विस्तार करने के लिए: सत्यापन है और उसके बाद चिप्स का वर्गीकरण है।
सीपीयू में ट्रांजिस्टर उच्च आवृत्तियों पर अपनी समस्याएं दिखाते हैं, इसलिए एक सीपीयू बनाना और फिर इसे कई अलग-अलग उत्पादों के रूप में विपणन करना आम है। सस्ता सीपीयू वास्तव में महंगे सीपीयू के क्षतिग्रस्त संस्करण हैं। एक अन्य विकल्प सीपीयू के कुछ हिस्सों को अक्षम कर रहा है। उदाहरण के लिए, एएमडी ने बैरटन कोर के साथ प्रोसेसर बनाया। इसने थॉर्टन कोर के साथ प्रोसेसर भी बेचे। थॉर्टन नया कोर नहीं था। इसके बजाय, L2 कैश का आधा दोषपूर्ण और अक्षम था। इस तरह, एएमडी ने सीपीयू पर कुछ वसूली की जो अन्यथा बर्बाद हो जाती।
एएमडी के 3 कोर प्रोसेसर के साथ भी यही हुआ। वे मूल रूप से 4 कोर प्रोसेसर थे, लेकिन कोर में से एक को दोषपूर्ण होना निर्धारित किया गया था, इसलिए इसे अक्षम कर दिया गया था।
आपके प्रश्न का उत्तर है, "नहीं।" हार्डवेयर विफलताओं के लिए वर्तमान में कोई ऑटो-पुनर्प्राप्ति विधियाँ नहीं हैं।
निर्माता अपनी प्रक्रियाओं को अपने वेफर्स से सर्वोत्तम उपज (डॉलर) प्राप्त करने के लिए बनाते हैं। ट्रांजिस्टर को सिकोड़कर, वे कम क्षेत्र में अधिक कार्यक्षमता फिट कर सकते हैं। यह वेफर के अनुसार अधिक चिप्स (एक ही कार्यक्षमता का) के रूप में सोचा जा सकता है। जैसे-जैसे चिप का आकार सिकुड़ता है, आप उनमें से एक वेफर को बाहर निकाल सकते हैं, लेकिन जैसे-जैसे वे सिकुड़ते हैं, उनमें से अधिक खराब होते जाते हैं। मैन्युफैक्चरर्स इसे स्वीकार करते हैं, और चिप्स को सिकोड़ने के लिए लगातार प्रौद्योगिकी के लिफाफे को आगे बढ़ा रहे हैं। जो चीज उन्हें बताती है कि वे लिफाफे के किनारे पर हैं वे खराब चिप्स हैं।
यदि कोई कंपनी फ़ीचर साइज़ को 70% पुराने फ़ीचर साइज़ को छोटा कर सकती है, तो वे वफ़र पर लगभग 2 गुना चिप्स प्राप्त कर सकते हैं। यदि पुरानी प्रक्रिया पर उनकी उपज 95% थी (कहते हैं, वेफर पर 100 में से 95 अच्छे चिप्स चिप्स) और नई प्रक्रिया पर उनकी उपज 75% है (वेफर पर 200 में से 150 अच्छे चिप्स) तो उन्होंने पैसा कमाया नई प्रक्रिया।
छोटे नोड्स पर, प्रत्येक "ट्रांजिस्टर" 2 गेट्स हैं जब तक कि आपके पास मेमोरी नहीं है, जैसे SRAM। यदि कोई काम नहीं करता है, तो आपके पास एक धीमा ड्राइवर है। SRAM के लिए, यदि यह पास नहीं होता है, तो आप पंक्ति को "झटका" दें। यदि ट्रांजिस्टर पर दोनों FETS विफल हो जाते हैं, तो आपके पास रेत का एक बहुत महंगा टुकड़ा होगा, लेकिन मैंने व्यक्तिगत रूप से ऐसा कभी नहीं किया है। आधुनिक FinFETs बहुत छोटे हैं, लिथोग्राफी और संभाव्यता की प्रकृति के कारण उत्पादन समस्याओं (मुख्य रूप से परेशानी) का एक गुच्छा है। आप पाएंगे कि नई प्रक्रियाओं में पहली चीजें FPGAs हैं क्योंकि आप खराब कोशिकाओं को "उड़ा" सकते हैं और रूटिंग ग्राफ को बदल सकते हैं। मैं आपको संख्याएँ नहीं दे सकता, लेकिन आप अनुमान लगा सकते हैं कि x86 दुनिया कैसे बिंग करती है, चीजें शायद ही कभी पूरी तरह से होती हैं।
यहाँ XOR सेल के लेआउट का चित्रण है:
हरे रंग की सलाखों के बाईं / दाईं ओर पंख होते हैं, और लाल रंग की पाली होती है। ब्लूज़ 1 स्तर पर रंगीन धातु हैं।
कमर्शियल सीपीयू में ऑटोरेसिस मैकेनिज्म नहीं है, लेकिन शिक्षाविदों और विशेष एप्लीकेशन सीपीयू में चीजें घूमती रहती हैं। मैंने कुछ विशेष घटक बनाए हैं जो घड़ी के मुद्दों को हल करने के लिए अतुल्यकालिक आर्किटेक्चर का उपयोग करते हैं जो एक गर्म वाहक के रूप में एक छेद के ऑक्साइड के विनाश के कारण उत्पन्न होते हैं जहां आपको बस एक बहुत धीमी ट्रांजिस्टर मिलती है।
जाहिर तौर पर समय बदल गया है। इस प्रश्न में पाँच साल पुराने कई उत्तर अब कला की स्थिति को नहीं दर्शाते हैं और कुछ तब सटीक नहीं थे।
ट्रांजिस्टर और सिलिकॉन पर अन्य उपकरण विनिर्माण के बाद काफी स्थिर हैं, बशर्ते आईसी गर्म न हो।
दोषों को कम करने के लिए आधुनिक आईसी निर्माण प्रक्रिया में अब ऐसी चीजें की जाती हैं:
प्रोसेसर के औपचारिक विनिर्देश में प्रोग्रामिंग त्रुटियां किसी विशेष ट्रांजिस्टर की विफलताओं से अधिक होने की संभावना है।
जबकि सामान्य सीपीयू में ऑटोरेसिस क्षमता की तरह कुछ भी नहीं होता है, वहीं कॉस्मिक किरणों के लिए एक जवाबी कार्रवाई के रूप में स्वयं-रीसेट सीपीयू पर भी काम किया गया है । कॉस्मिक किरणें बिट-फ़्लिप का कारण बनने के लिए सीपीयू या रैम में पर्याप्त ऊर्जा जमा कर सकती हैं।
जैसा कि टिप्पणियों में कहा गया है, मिशन क्रिटिकल सिस्टम ने लंबे समय तक सत्यापन के लिए कई सीपीयू पर भरोसा किया है। अंतरिक्ष यान, 1976 में वापस , एक उदाहरण के रूप में, पांच कंप्यूटर, जिनमें से चार एक ही कार्यक्रम भाग गया और सुरक्षा सुनिश्चित करने के लिए सभी उड़ान नियंत्रण फैसले पर "मतदान" का इस्तेमाल किया।
अधिकांश आधुनिक प्रोसेसर ट्रांजिस्टर एफईटी हैं। अधिभार शुरू करने पर इनका स्रोत / नाली प्रतिरोध प्राप्त करने का लाभ है। यह एक ऐसा कारक है जो उच्च शक्ति MOSFETs को कई समानांतर में रखकर बनाया जा सकता है। लोड स्वचालित रूप से वितरित करता है। यह मुद्दों को वितरित करने में मदद करने वाला कारक हो सकता है। लेकिन मुझे लगता है कि यह वास्तव में उससे कहीं ज्यादा सरल है।
अधिकांश इलेक्ट्रॉनिक भागों की तरह, यदि आप उन्हें कल्पना के भीतर चलाते हैं, तो वे काफी समय तक चलेंगे। जब एक माइक्रोप्रोसेसर बनाया जाता है, तो लागत के लिए दो कारक होते हैं। सिर्फ सिलिकॉन पर जगह और, जटिलता के कारण, वास्तविक उपज। सभी चिप्स विनिर्माण के बाद काम नहीं करते हैं। हालांकि, एक बार जब यह बन जाता है और सत्यापन चिपक जाता है, तो आप जानते हैं कि ट्रांजिस्टर अच्छे हैं। यदि कल्पना के भीतर संचालित किया जाता है, तो संभावना है कि वे अच्छे रहेंगे।
क्या आपने कभी सोचा है कि एक ही चिप को कभी-कभी अलग-अलग गति से क्यों बेचा जाता है? और क्या आपने देखा है कि कभी-कभी एक ही GPU चिप आर्किटेक्चर विभिन्न आंतरिक इकाइयों के साथ बेचा जाता है?
सिलिकॉन स्तर पर एक हार्डवेयर दोष को ठीक करने का कोई तरीका नहीं है, लेकिन समय के साथ डिजाइनरों ने उपज बढ़ाने की समस्या से निपटना सीख लिया है । दूरदर्शिता के साथ, उपज पूरी तरह से विनिर्माण गुणवत्ता पर निर्भर है। हालांकि, यदि आप चतुर हैं, तो आप कुछ खराब चिप्स को पुनर्प्राप्त कर सकते हैं।
उदाहरण के लिए, मान लें कि आपके पास 18-कोर चिप डिज़ाइन है, जो स्वतंत्र रूप से कम या ज्यादा काम करती है। परीक्षण के दौरान, आप सही चिप्स को सॉर्ट करते हैं और इसे A18 मॉडल के रूप में जारी करते हैं। अधिकांश विफल चिप्स में केवल एक त्रुटि है, इसलिए वे तब तक ठीक काम करेंगे जब तक कि दोषपूर्ण कोर अक्षम न हो जाए। आप इन्हें A17 मॉडल के रूप में थोड़ी कम कीमत पर बेचते हैं, और जिनके पास दो खराब कोर हैं, उन्हें कभी भी कम कीमत पर A16 मॉडल के रूप में बेचा जाता है।
वही चिप की स्पीड रेटिंग पर लागू हो सकता है। पूरी तरह से निर्मित चिप्स डिजाइन कल्पना से परे गति पर चलने में सक्षम होंगे, लेकिन समस्याओं वाले चिप्स नहीं हो सकते हैं। ये कम स्पीड के चश्मे पर बेचे जाते हैं।
यह विधि नाटकीय रूप से समग्र उपज में वृद्धि करेगी और इसलिए आमतौर पर काफी देखी जाती है। उदाहरण के लिए PlayStation 3 में 8 SPE इकाइयाँ होती हैं, लेकिन पैदावार की समस्याओं के कारण हमेशा एक को अक्षम किया जाता है।
क्या सीपीयू में कोई ऑटो-रिकवरी तंत्र है?
जैसा कि ऊपर बताया नहीं गया है। हालांकि उनके कैश, विशेष रूप से L2 और L3, उनमें अतिरिक्त रैम हो सकते हैं। जब कारखाने में भाग का परीक्षण किया जाता है, तो खराब रैम ब्लॉक को हटाया जा सकता है और अतिरिक्त रैम ब्लॉक का उपयोग किया जाता है।
सामान्य तौर पर, आप चिप स्क्रीन के माध्यम से खराब ट्रांजिस्टर को कवर करते हैं, और आप उसके बाद अपेक्षाकृत कम प्रतिशत नुकसान की उम्मीद करते हैं। चिप का कारोबार दशकों से रहा है, इसके प्रबंधन के लिए उनके पास बहुत सारी तरकीबें हैं (और हाँ, कभी-कभी चालों में से एक यह है कि खराब भागों को बाहर निकाल दें और उन्हें मुफ्त में बदलें या ग्राहकों को दुखी होने दें)।
विकिरण वाले कठोर वातावरण (स्थान) के लिए, आप ट्रिपल वोटिंग की संभावना रखते हैं, प्रत्येक "बिट" में वास्तव में तीन बिट्स होते हैं जो एक बनाने के लिए मतदान करते हैं। यह बिट सेटिंग निर्धारित करने के लिए केवल दो तिहाई वोट लेता है। इसलिए अन्य तीसरे में ट्रांजिस्टर खराब हो सकते हैं और अंततः कुल खुराक के साथ होंगे। लेकिन प्राथमिक चिंता एकल घटना परेशान है। उन चिप्स और सिस्टम को इन वातावरणों के लिए ऊपर से नीचे, सिलिकॉन, हार्डवेयर, सॉफ्टवेयर, आदि के लिए डिज़ाइन किया गया है और वे पुरानी कोशिश की और सच्ची तकनीक का उपयोग करते हैं, न कि अत्याधुनिक, इसलिए ट्रांजिस्टर की गिनती और आकार ट्रांजिस्टर का वर्षों पहले से है।
सीओटीएस से हिचकी और समय-समय पर विफल होने की उम्मीद है।
यह एक चमत्कार की तरह लग सकता है लेकिन ट्रांजिस्टर विफलताओं की मात्रा को कम करने के लिए कई तंत्र हैं। हालांकि, ट्रांजिस्टर द्वारा अनुभव की जाने वाली विफलता के प्रकार पर निर्भर करता है और कहां, सीपीयू कुछ शर्तों के तहत कभी-कभी उपयोग करने योग्य भी हो सकता है या नहीं।
वर्तमान में, अक्सर कोई ऑटो-रिकवरी तंत्र नहीं बनाया जाता है, लेकिन इस समस्या को कम करने के लिए पुन: उपयोग योग्य कंप्यूटिंग, अतिरेक और अन्य तकनीकों में बहुत अधिक शोध होता है।