जब इतने सारे ट्रांजिस्टर हैं तो सीपीयू कैसे स्थिर हो सकते हैं?

10

जैसा कि हम जानते हैं कि सीपीयू एक ही थंबनेल पर बहुत अधिक अरबों ट्रांजिस्टर है, अगर ट्रांजिस्टर में से एक टूट जाए तो क्या होगा?

क्या सीपीयू में कोई ऑटो-रिकवरी तंत्र है?

transistors cpu

— cpuer
स्रोत

6

दरअसल आजकल बड़े लोगों में अरबों ट्रांजिस्टर होते हैं।

— starblue

6

"स्थिर" शायद सही शब्द नहीं है, क्योंकि यह मेटास्टेबिलिटी जैसे मुद्दों की ओर अधिक इशारा करता है। इस विषय के लिए एक बेहतर विकल्प 'दोष-मुक्त' या 'उपज' जैसे शब्द होंगे। या आप परिणामी चिप्स के बजाय निर्माण प्रक्रिया की स्थिरता के बारे में पूछ सकते हैं।

— क्रिस स्ट्रैटन

2

@ क्रिसट्रैटन, मुझे लगता है कि ओपी उपज से अधिक विश्वसनीयता के बारे में पूछ सकता है।

— फोटॉन

1

यदि ट्रांजिस्टर में से एक टूट जाता है, तो आप चिप को बाहर फेंक देते हैं। कोई अतिरेक नहीं है (कुछ विशिष्ट अनुप्रयोगों को छोड़कर) और कोई मरम्मत विकल्प नहीं है।

— दिमित्री ग्रिगोरीव

18

यह आसान है, हम उन्हें बेचने से पहले उनका परीक्षण करते हैं और बुरे लोगों को बाहर फेंक देते हैं।

ऐसा करने के बहुत सारे तरीके हैं - अलग-अलग लोग अलग-अलग काम करते हैं, अक्सर एक संयोजन का उपयोग करते हैं:

कुछ परीक्षणों की गति यह सुनिश्चित करने के लिए है कि वे पर्याप्त तेजी से चलते हैं।
अन्य परीक्षणों में एक मोड शामिल होता है जो चिप में कुछ या सभी फ्लिपफ्लॉप को विशाल सीरियल शिफ्ट रजिस्टरों में बदल देता है, हम ज्ञात डेटा को उन जंजीरों में देखते हैं, फिर एक घड़ी के लिए चिप को चलाते हैं और फिर नए परिणामों को वापस स्कैन करते हैं और जांचते हैं कि वे मेल खाते हैं हमारे अनुमानित परिणाम - स्वचालित परीक्षण उपकरण "स्कैन वैक्टर" का एक न्यूनतम सेट उत्पन्न करते हैं जो चिप पर प्रत्येक यादृच्छिक गेट या ट्रांजिस्टर का परीक्षण करेगा - अन्य वैक्टर राम ब्लॉकों के विशेष परीक्षण करते हैं,
दूसरों का परीक्षण है कि बाहरी तार सही ढंग से बंधे हैं
हम यह सुनिश्चित करते हैं कि यह एक अस्वास्थ्यकर राशि को खींच नहीं रहा है

परीक्षण के समय में पैसे खर्च होते हैं, हम कभी-कभी स्पष्ट मृत चिप्स के लिए कुछ सरल परीक्षण करते हैं इससे पहले कि वे बुरे लोगों को छोड़ने के लिए पैक किए जाते हैं और फिर पैकेजिंग के बाद अधिक परीक्षण किया जाता है

— taniwha
स्रोत

1

"यह सरल है, हम उन्हें बेचने से पहले उनका परीक्षण करते हैं और बुरे लोगों को बाहर फेंकते हैं।" यदि यह एकमात्र गुणवत्ता प्रणाली होगी, तो आप संभावित रूप से 1 बिलियन ट्रांजिस्टर उपकरणों के साथ 0.00000000001% की उपज प्राप्त करेंगे

— फेडेरिको रूसो

2

वास्तव में यह उतना आसान है; चाल बहुत बड़ी मात्रा में अनुकरण और नियम-जाँच से पहले है ताकि यह सुनिश्चित किया जा सके कि आपकी उपज स्वीकार्य है। सीपीयू लॉजिक में शायद ही कोई अतिरेक हो; कभी-कभी आपको ऑन-चिप रैम में अतिरेक मिलता है।

— pjc50

यदि डिज़ाइन सही है, तो आपकी व्यक्तिगत विफलताएँ भौतिक दोष, संदूषण, प्रक्रिया त्रुटियों आदि से आती हैं, हालांकि उपयोग में केवल कुछ वेफर आकार हैं, बड़े आईसी उनके आनुपातिक आकार से अधिक महंगे हैं, क्योंकि एक दोष की संभावना बढ़ जाती है क्षेत्र। कुछ मामलों में, आपके पास कभी-कभी बेचे जाने की तुलना में अधिक कार्यात्मक इकाइयों के साथ एक चिप हो सकती है, इसलिए यह अभी भी विपणन योग्य हो सकता है यदि कोई खराब है, लेकिन यह सीमित है। कभी-कभी आप FPGAs को एक छूट पर खरीद सकते हैं जो केवल एक विशेष विन्यास फ़ाइल के रूप में काम करने के लिए परीक्षण किया जाता है, बजाय एक मध्यस्थ के साथ काम करने के।

— क्रिस स्ट्रैटन

2

मुझे लगता है कि आप एएमडी जैसे निर्माताओं का उल्लेख करना भूल गए हैं, जो खराब कोर के साथ प्रोसेसर को खराब कोर के साथ एक अलग मॉडल के रूप में बेच रहे हैं। यह एक तरह की अतिरेक है, या होशियार विपणन शायद।

— अंकल

अगर किसी को कभी भी आश्चर्य होता है कि ग्रे मार्केट पार्ट्स की आपूर्ति कैसे की जाती है, तो उन्हें आश्चर्य नहीं होना चाहिए। मैंने चिप फैब सिस्टम के सॉफ्टवेयर अंत में काम किया है, और यहां वर्णित स्वचालित परीक्षण पौधों के लिए समय और धन लागत का एक बड़ा हिस्सा है।

12

दूसरों ने जो कहा है उस पर थोड़ा विस्तार करने के लिए: सत्यापन है और उसके बाद चिप्स का वर्गीकरण है।

सीपीयू में ट्रांजिस्टर उच्च आवृत्तियों पर अपनी समस्याएं दिखाते हैं, इसलिए एक सीपीयू बनाना और फिर इसे कई अलग-अलग उत्पादों के रूप में विपणन करना आम है। सस्ता सीपीयू वास्तव में महंगे सीपीयू के क्षतिग्रस्त संस्करण हैं। एक अन्य विकल्प सीपीयू के कुछ हिस्सों को अक्षम कर रहा है। उदाहरण के लिए, एएमडी ने बैरटन कोर के साथ प्रोसेसर बनाया। इसने थॉर्टन कोर के साथ प्रोसेसर भी बेचे। थॉर्टन नया कोर नहीं था। इसके बजाय, L2 कैश का आधा दोषपूर्ण और अक्षम था। इस तरह, एएमडी ने सीपीयू पर कुछ वसूली की जो अन्यथा बर्बाद हो जाती।

एएमडी के 3 कोर प्रोसेसर के साथ भी यही हुआ। वे मूल रूप से 4 कोर प्रोसेसर थे, लेकिन कोर में से एक को दोषपूर्ण होना निर्धारित किया गया था, इसलिए इसे अक्षम कर दिया गया था।

— AndrejaKo
स्रोत

2

यह असामान्य नहीं है कि आप फ़्यूज़ को फूंक कर निष्क्रिय कर सकने वाली सुविधाओं के साथ चिप डिज़ाइन बनाएं। चिप की उपज का सरल अर्थशास्त्र, अगर हम इसे धीमा या चलाकर या परीक्षण में विफल रहे किसी सुविधा को अक्षम करके, चिप के सभी भाग को निस्तारण कर सकते हैं, तो हम पूरे भाग को टॉस करने के बजाय उस हिस्से की कुछ लागत वसूल कर सकते हैं। आप उदाहरण के रूप में इंटेल 386 SX और DX पर वापस जा सकते हैं। और बहुत ज्यादा हर सीपीयू गति वर्गीकृत है। धीमे व्यक्ति ऐसे भाग हैं जो तेज गति से विफल हुए।

— Old_timer

2

नहीं, 386SX / 386DX नहीं। इन चिप्स में एक बिल्कुल अलग बस इंटरफेस है। 386SX प्राप्त करने के लिए आप केवल 386DX के एक भाग को अक्षम नहीं करते हैं। आप जो कहते हैं वह सच है 486DX / 486SX के लिए, बाद वाला FPU अक्षम है।

— माइकल करचर

6

आपके प्रश्न का उत्तर है, "नहीं।" हार्डवेयर विफलताओं के लिए वर्तमान में कोई ऑटो-पुनर्प्राप्ति विधियाँ नहीं हैं।

निर्माता अपनी प्रक्रियाओं को अपने वेफर्स से सर्वोत्तम उपज (डॉलर) प्राप्त करने के लिए बनाते हैं। ट्रांजिस्टर को सिकोड़कर, वे कम क्षेत्र में अधिक कार्यक्षमता फिट कर सकते हैं। यह वेफर के अनुसार अधिक चिप्स (एक ही कार्यक्षमता का) के रूप में सोचा जा सकता है। जैसे-जैसे चिप का आकार सिकुड़ता है, आप उनमें से एक वेफर को बाहर निकाल सकते हैं, लेकिन जैसे-जैसे वे सिकुड़ते हैं, उनमें से अधिक खराब होते जाते हैं। मैन्युफैक्चरर्स इसे स्वीकार करते हैं, और चिप्स को सिकोड़ने के लिए लगातार प्रौद्योगिकी के लिफाफे को आगे बढ़ा रहे हैं। जो चीज उन्हें बताती है कि वे लिफाफे के किनारे पर हैं वे खराब चिप्स हैं।

यदि कोई कंपनी फ़ीचर साइज़ को 70% पुराने फ़ीचर साइज़ को छोटा कर सकती है, तो वे वफ़र पर लगभग 2 गुना चिप्स प्राप्त कर सकते हैं। यदि पुरानी प्रक्रिया पर उनकी उपज 95% थी (कहते हैं, वेफर पर 100 में से 95 अच्छे चिप्स चिप्स) और नई प्रक्रिया पर उनकी उपज 75% है (वेफर पर 200 में से 150 अच्छे चिप्स) तो उन्होंने पैसा कमाया नई प्रक्रिया।

— विंटेज
स्रोत

5

कुछ प्रकार की चिप्स जैसे नंद फ्लैश मेमोरी के लिए, निर्माता नियमित रूप से लिफाफे को उस बिंदु से परे धकेलते हैं जहां शून्य-दोष वाले चिप्स आदर्श होंगे, लेकिन अधिकांश विफलताओं में कुछ पूर्वानुमानित विशेषताएं होंगी, और चिप्स का उपयोग करने वाले उपकरणों से उम्मीद की जाएगी उनके आसपास काम करें।

— सुपरकैट

3

छोटे नोड्स पर, प्रत्येक "ट्रांजिस्टर" 2 गेट्स हैं जब तक कि आपके पास मेमोरी नहीं है, जैसे SRAM। यदि कोई काम नहीं करता है, तो आपके पास एक धीमा ड्राइवर है। SRAM के लिए, यदि यह पास नहीं होता है, तो आप पंक्ति को "झटका" दें। यदि ट्रांजिस्टर पर दोनों FETS विफल हो जाते हैं, तो आपके पास रेत का एक बहुत महंगा टुकड़ा होगा, लेकिन मैंने व्यक्तिगत रूप से ऐसा कभी नहीं किया है। आधुनिक FinFETs बहुत छोटे हैं, लिथोग्राफी और संभाव्यता की प्रकृति के कारण उत्पादन समस्याओं (मुख्य रूप से परेशानी) का एक गुच्छा है। आप पाएंगे कि नई प्रक्रियाओं में पहली चीजें FPGAs हैं क्योंकि आप खराब कोशिकाओं को "उड़ा" सकते हैं और रूटिंग ग्राफ को बदल सकते हैं। मैं आपको संख्याएँ नहीं दे सकता, लेकिन आप अनुमान लगा सकते हैं कि x86 दुनिया कैसे बिंग करती है, चीजें शायद ही कभी पूरी तरह से होती हैं।

यहाँ XOR सेल के लेआउट का चित्रण है:

हरे रंग की सलाखों के बाईं / दाईं ओर पंख होते हैं, और लाल रंग की पाली होती है। ब्लूज़ 1 स्तर पर रंगीन धातु हैं।

कमर्शियल सीपीयू में ऑटोरेसिस मैकेनिज्म नहीं है, लेकिन शिक्षाविदों और विशेष एप्लीकेशन सीपीयू में चीजें घूमती रहती हैं। मैंने कुछ विशेष घटक बनाए हैं जो घड़ी के मुद्दों को हल करने के लिए अतुल्यकालिक आर्किटेक्चर का उपयोग करते हैं जो एक गर्म वाहक के रूप में एक छेद के ऑक्साइड के विनाश के कारण उत्पन्न होते हैं जहां आपको बस एक बहुत धीमी ट्रांजिस्टर मिलती है।

— b पतित
स्रोत

3

जाहिर तौर पर समय बदल गया है। इस प्रश्न में पाँच साल पुराने कई उत्तर अब कला की स्थिति को नहीं दर्शाते हैं और कुछ तब सटीक नहीं थे।

ट्रांजिस्टर और सिलिकॉन पर अन्य उपकरण विनिर्माण के बाद काफी स्थिर हैं, बशर्ते आईसी गर्म न हो।

दोषों को कम करने के लिए आधुनिक आईसी निर्माण प्रक्रिया में अब ऐसी चीजें की जाती हैं:

आईसीएस बड़े पैमाने पर परीक्षण किए जाते हैं, दोनों डिजाइन सत्यापन और सत्यापन, और व्यक्तिगत नमूना परीक्षणों के स्तर पर। यह पेपर पेंटियम 4 के लिए कुछ परीक्षण प्रक्रियाओं का वर्णन करता है।
आईसीएस के समग्र डिजाइन अब पूरी तरह से सत्यापित करने के लिए बहुत जटिल है
IC में प्रोग्राम करने योग्य माइक्रोकोड होता है, जो विनिर्माण के बाद दोषों की खोज करने पर सीमित मात्रा में रिप्रोग्रामेबिलिटी की अनुमति देता है
आधुनिक आईसी में निरर्थक सिलिकॉन परतें होती हैं, जिससे निर्माण के दौरान खोजे गए दोषों को ठीक किया जा सकता है
कई सीपीयू में निरर्थक हार्डवेयर मॉड्यूल होते हैं, चाहे ये सीपीयू कोर, कैश मेमोरी या अन्य आईपी हों; यदि सभी इकाइयाँ क्रियाशील नहीं हैं, तो कुछ को कम लागत वाले भागों के रूप में निष्क्रिय और "बायनड" किया जा सकता है। एक उदाहरण है PS4 मल्टी-कोर IC में एक निरर्थक कोर शामिल है जो उच्च उपज प्राप्त करने के लिए अक्षम है।
कुछ सीपीयू प्रदर्शन करेंगे लेकिन शीर्ष गति पर नहीं; इन्हें निम्न गति, कम लागत वाले सीपीयू के रूप में बेचा जा सकता है
कई CPU और RAM त्रुटि सुधार कोडिंग (ECC) मेमोरी का उपयोग करते हैं या अखंडता सुनिश्चित करने के लिए डेटा स्थानांतरण के विभिन्न चरणों में संदेश सत्यापन त्रुटि सुधार करते हैं
कभी-कभी प्रोसेसर एक तरह से विफल हो जाते हैं जो सिस्टम क्रैश का कारण बनता है लेकिन सिस्टम को फिर से काम करने से रोकता नहीं है अगर रीबूटिंग (सीएमओएस लैचअप)

प्रोसेसर के औपचारिक विनिर्देश में प्रोग्रामिंग त्रुटियां किसी विशेष ट्रांजिस्टर की विफलताओं से अधिक होने की संभावना है।

जबकि सामान्य सीपीयू में ऑटोरेसिस क्षमता की तरह कुछ भी नहीं होता है, वहीं कॉस्मिक किरणों के लिए एक जवाबी कार्रवाई के रूप में स्वयं-रीसेट सीपीयू पर भी काम किया गया है । कॉस्मिक किरणें बिट-फ़्लिप का कारण बनने के लिए सीपीयू या रैम में पर्याप्त ऊर्जा जमा कर सकती हैं।

जैसा कि टिप्पणियों में कहा गया है, मिशन क्रिटिकल सिस्टम ने लंबे समय तक सत्यापन के लिए कई सीपीयू पर भरोसा किया है। अंतरिक्ष यान, 1976 में वापस , एक उदाहरण के रूप में, पांच कंप्यूटर, जिनमें से चार एक ही कार्यक्रम भाग गया और सुरक्षा सुनिश्चित करने के लिए सभी उड़ान नियंत्रण फैसले पर "मतदान" का इस्तेमाल किया।

— jbarlow
स्रोत

ECC और त्रुटि का पता लगाने का उपयोग कुछ समय के लिए किया गया है (यादों और संचार के लिए, अंकगणित और इसी तरह के तर्क कार्यों के लिए कुछ उच्च-अंत प्रणालियों में वर्षों से त्रुटि का पता चला है)। इसी प्रकार, निरर्थक निष्पादन (स्थानिक या लौकिक) का उपयोग उन प्रणालियों में काफी समय के लिए त्रुटियों का पता लगाने के लिए किया गया है जहां हार्डवेयर / निष्पादन समय में लागत उचित लगती है।

— पॉल ए। क्लेटन

@ पॉलए.केल्टन यदि आप इटेनियम और बाद के एक्सोन आरएएस विशेषताओं के बारे में एक पोस्ट करेंगे, तो मुझे निश्चित रूप से उसके लिए वोट करने में खुशी होगी।

— ओलेकैंडर आर।

2

अधिकांश आधुनिक प्रोसेसर ट्रांजिस्टर एफईटी हैं। अधिभार शुरू करने पर इनका स्रोत / नाली प्रतिरोध प्राप्त करने का लाभ है। यह एक ऐसा कारक है जो उच्च शक्ति MOSFETs को कई समानांतर में रखकर बनाया जा सकता है। लोड स्वचालित रूप से वितरित करता है। यह मुद्दों को वितरित करने में मदद करने वाला कारक हो सकता है। लेकिन मुझे लगता है कि यह वास्तव में उससे कहीं ज्यादा सरल है।

अधिकांश इलेक्ट्रॉनिक भागों की तरह, यदि आप उन्हें कल्पना के भीतर चलाते हैं, तो वे काफी समय तक चलेंगे। जब एक माइक्रोप्रोसेसर बनाया जाता है, तो लागत के लिए दो कारक होते हैं। सिर्फ सिलिकॉन पर जगह और, जटिलता के कारण, वास्तविक उपज। सभी चिप्स विनिर्माण के बाद काम नहीं करते हैं। हालांकि, एक बार जब यह बन जाता है और सत्यापन चिपक जाता है, तो आप जानते हैं कि ट्रांजिस्टर अच्छे हैं। यदि कल्पना के भीतर संचालित किया जाता है, तो संभावना है कि वे अच्छे रहेंगे।

— जो
स्रोत

2

क्या आपने कभी सोचा है कि एक ही चिप को कभी-कभी अलग-अलग गति से क्यों बेचा जाता है? और क्या आपने देखा है कि कभी-कभी एक ही GPU चिप आर्किटेक्चर विभिन्न आंतरिक इकाइयों के साथ बेचा जाता है?

सिलिकॉन स्तर पर एक हार्डवेयर दोष को ठीक करने का कोई तरीका नहीं है, लेकिन समय के साथ डिजाइनरों ने उपज बढ़ाने की समस्या से निपटना सीख लिया है । दूरदर्शिता के साथ, उपज पूरी तरह से विनिर्माण गुणवत्ता पर निर्भर है। हालांकि, यदि आप चतुर हैं, तो आप कुछ खराब चिप्स को पुनर्प्राप्त कर सकते हैं।

उदाहरण के लिए, मान लें कि आपके पास 18-कोर चिप डिज़ाइन है, जो स्वतंत्र रूप से कम या ज्यादा काम करती है। परीक्षण के दौरान, आप सही चिप्स को सॉर्ट करते हैं और इसे A18 मॉडल के रूप में जारी करते हैं। अधिकांश विफल चिप्स में केवल एक त्रुटि है, इसलिए वे तब तक ठीक काम करेंगे जब तक कि दोषपूर्ण कोर अक्षम न हो जाए। आप इन्हें A17 मॉडल के रूप में थोड़ी कम कीमत पर बेचते हैं, और जिनके पास दो खराब कोर हैं, उन्हें कभी भी कम कीमत पर A16 मॉडल के रूप में बेचा जाता है।

वही चिप की स्पीड रेटिंग पर लागू हो सकता है। पूरी तरह से निर्मित चिप्स डिजाइन कल्पना से परे गति पर चलने में सक्षम होंगे, लेकिन समस्याओं वाले चिप्स नहीं हो सकते हैं। ये कम स्पीड के चश्मे पर बेचे जाते हैं।

यह विधि नाटकीय रूप से समग्र उपज में वृद्धि करेगी और इसलिए आमतौर पर काफी देखी जाती है। उदाहरण के लिए PlayStation 3 में 8 SPE इकाइयाँ होती हैं, लेकिन पैदावार की समस्याओं के कारण हमेशा एक को अक्षम किया जाता है।

— Pål-Kristian Engstad
स्रोत

1

क्या सीपीयू में कोई ऑटो-रिकवरी तंत्र है?

जैसा कि ऊपर बताया नहीं गया है। हालांकि उनके कैश, विशेष रूप से L2 और L3, उनमें अतिरिक्त रैम हो सकते हैं। जब कारखाने में भाग का परीक्षण किया जाता है, तो खराब रैम ब्लॉक को हटाया जा सकता है और अतिरिक्त रैम ब्लॉक का उपयोग किया जाता है।

— ब्रायन कार्लटन
स्रोत

1

सामान्य तौर पर, आप चिप स्क्रीन के माध्यम से खराब ट्रांजिस्टर को कवर करते हैं, और आप उसके बाद अपेक्षाकृत कम प्रतिशत नुकसान की उम्मीद करते हैं। चिप का कारोबार दशकों से रहा है, इसके प्रबंधन के लिए उनके पास बहुत सारी तरकीबें हैं (और हाँ, कभी-कभी चालों में से एक यह है कि खराब भागों को बाहर निकाल दें और उन्हें मुफ्त में बदलें या ग्राहकों को दुखी होने दें)।

विकिरण वाले कठोर वातावरण (स्थान) के लिए, आप ट्रिपल वोटिंग की संभावना रखते हैं, प्रत्येक "बिट" में वास्तव में तीन बिट्स होते हैं जो एक बनाने के लिए मतदान करते हैं। यह बिट सेटिंग निर्धारित करने के लिए केवल दो तिहाई वोट लेता है। इसलिए अन्य तीसरे में ट्रांजिस्टर खराब हो सकते हैं और अंततः कुल खुराक के साथ होंगे। लेकिन प्राथमिक चिंता एकल घटना परेशान है। उन चिप्स और सिस्टम को इन वातावरणों के लिए ऊपर से नीचे, सिलिकॉन, हार्डवेयर, सॉफ्टवेयर, आदि के लिए डिज़ाइन किया गया है और वे पुरानी कोशिश की और सच्ची तकनीक का उपयोग करते हैं, न कि अत्याधुनिक, इसलिए ट्रांजिस्टर की गिनती और आकार ट्रांजिस्टर का वर्षों पहले से है।

सीओटीएस से हिचकी और समय-समय पर विफल होने की उम्मीद है।

— पुराने घड़ी
स्रोत

-1

यह एक चमत्कार की तरह लग सकता है लेकिन ट्रांजिस्टर विफलताओं की मात्रा को कम करने के लिए कई तंत्र हैं। हालांकि, ट्रांजिस्टर द्वारा अनुभव की जाने वाली विफलता के प्रकार पर निर्भर करता है और कहां, सीपीयू कुछ शर्तों के तहत कभी-कभी उपयोग करने योग्य भी हो सकता है या नहीं।

वर्तमान में, अक्सर कोई ऑटो-रिकवरी तंत्र नहीं बनाया जाता है, लेकिन इस समस्या को कम करने के लिए पुन: उपयोग योग्य कंप्यूटिंग, अतिरेक और अन्य तकनीकों में बहुत अधिक शोध होता है।

— sybreon
स्रोत