एम्बेडेड सिस्टम के लिए फॉल्ट मॉडलिंग


10

मेरे पास एक माइक्रोकंट्रोलर और 2.4 गीगाहर्ट्ज़ ट्रांसीवर मॉड्यूल के साथ एक वायरलेस सेंसर सर्किट है , कुछ एकीकृत सेंसर I²C इंटरफ़ेस, एक UART पोर्ट और आवश्यक असतत घटकों के साथ हैं।

इस बोर्ड को सौर (पीवी) पैनल से लीपो बैटरी और शंट चार्जर से बिजली की अदला-बदली के लिए बनाया गया है । यह सेंसर को स्वयं संचालित करने और अनिश्चित समय के लिए संचालन करने की अनुमति देता है, कम से कम संभव रखरखाव की आवश्यकता होती है।

मैं इस तरह की प्रणाली में होने वाले संभावित दोषों का पता लगाना चाहता हूं, और यह उम्र बढ़ने, पर्यावरणीय चश्मे के उल्लंघन (तापमान, आर्द्रता और इतने पर) या गलत रखरखाव (डिजाइन मुद्दों / कीड़े नहीं) के उल्लंघन में हो सकता है। अपने ऑपरेशन को अधिकतम करने के लिए आजीवन।

जिस वातावरण में सेंसर नोड संचालित होता है वह एक इमारत है, जिसे छत या दीवारों से चिपका दिया जाता है। इसलिए अत्यधिक तापमान या बारिश को नहीं माना जाता है।

मैं कुछ दोषों के साथ आया हूं जिन्हें मैं संक्षेप में बताने की कोशिश कर रहा हूं:

  • घटक टूट गया -> खुला \ शॉर्ट सर्किट
  • सेंसर दोषपूर्ण -> गलत आउटपुट मान (लेकिन कितना गलत है?)
  • धूल के कारण अलगाव अलग हो जाना - पानी का रिसाव बढ़ जाना
  • तापमान सीमा से बाहर -> ???

मैं कैसे अनुमान लगा सकता हूं कि सेंसर नोड कैसे विफल हो रहा है, और क्यों?


यह मत भूलो कि सेंसर को सिर्फ / जो भी और यंत्रवत रूप से तोड़ा जा सकता है, जो आपके द्वारा की गई किसी भी दोष का कारण बन सकता है।
शार्प्यूट

हां, अब तक मैं भी छेड़छाड़ की उपेक्षा कर रहा था, क्योंकि यह एक सीमा मामला है ... लेकिन किसी भी सुझाव का स्वागत है!
clabacchio

सौर पैनल का पिघलना और पर्याप्त बिजली का उत्पादन नहीं होना। मुझे यकीन है कि कुछ एमईएमएस डिवाइस पर जीवन पर्यावरण के प्रति बहुत संवेदनशील है ... अनुमान लगा रहा है।
केनी

आपके अध्ययन का उद्देश्य क्या है? उदाहरण के लिए, विफलता दर को कम करना, विफलता प्रभाव को कम करना (असफल होना), जोखिम को कम करना (असफलता के बजाय असफलता का पता लगाना), आदि, जो सभी को अलग-अलग दृष्टिकोण की आवश्यकता होती है।
राउटर वैन ऊइजेन

जवाबों:


7

"सभी" संभावित दोषों को समझने के लिए बहुत अधिक डिग्री-से-स्वतंत्रता हैं। हालाँकि, डिज़ाइन चक्र (यानी विस्तृत रिलीज़ से पहले) में दोषों की पहचान करने और उन्हें कम करने की तकनीकें हैं।

डिज़ाइन-टाइम एक्टिविटीज़ (प्री-हार्डवेयर)

पीयर रिव्यू हमेशा बग्स को खोजने का एक शानदार तरीका है। क्या किसी और ने आपके डिजाइन का विश्लेषण किया है, और अपने सवालों के खिलाफ बचाव करने के लिए तैयार रहें (या स्वीकार करें कि उन्हें एक बग मिला है, और इसे ठीक करें!) जांच का कोई विकल्प नहीं है, और ताजा आँखें अक्सर उन चीजों को देखती हैं जो थके हुए लोगों द्वारा याद की जाती हैं। यह हार्डवेयर और सॉफ्टवेयर दोनों के लिए काम करता है - स्कीमाटिक्स की समीक्षा आसानी से स्रोत कोड के रूप में की जा सकती है।

हार्डवेयर के लिए, जैसा कि दूसरों ने कहा है, एक DFMEA ( डिजाइन विफलता मोड और प्रभाव विश्लेषण ) एक अच्छी सिफारिश है। प्रत्येक घटक के लिए, अपने आप से पूछें "क्या होता है अगर यह छोटा हो जाता है" और "क्या होता है अगर यह ओपन-सर्किट हो जाता है", और अपने विश्लेषण का रिकॉर्ड बनाएं। आईसी के लिए, यह भी कल्पना करें कि क्या होता है यदि आसन्न पिन एक दूसरे के लिए छोटा हो (मिलाप पुलों, आदि)

फर्मवेयर के लिए, स्थिर कोड विश्लेषण उपकरण (MISRA, लिंट, आदि) का उपयोग कोड में छिपे हुए बग को प्रकट करने के लिए किया जा सकता है। फ़्लोटिंग पॉइंटर्स और समानता-बजाए-की-तुलना (= बनाम ==) जैसी चीजें आम 'ऊप्स' हैं कि ये उपकरण याद नहीं करेंगे।

हार्डवेयर और सॉफ्टवेयर दोनों के लिए ऑपरेशन का एक लिखित सिद्धांत भी बहुत उपयोगी है। ऑपरेशन के एक सिद्धांत को काफी उच्च स्तर में वर्णन करना चाहिए कि सिस्टम कैसे काम करता है, सुरक्षा कैसे काम करता है, अनुक्रमण करता है, आदि शब्दों को सीधे शब्दों में कहें कि तर्क को कैसे प्रवाहित किया जाना चाहिए, इससे यह पता चलता है कि कुछ मामले छूट गए हैं ("उम, Waitasec, इस स्थिति के बारे में क्या? ")

प्रोटोटाइप स्तर परीक्षण

एक बार जब आप हाथ में हार्डवेयर प्राप्त करते हैं, तो यह "काम" करने का समय है।

सभी के बाद सैद्धांतिक विश्लेषण किया जाता है, यह सटीक रूप से वर्णन करना महत्वपूर्ण है कि डिवाइस कल्पना के भीतर कैसे संचालित होता है । इसे आमतौर पर सत्यापन परीक्षण या योग्यता के रूप में जाना जाता है। सभी स्वीकार्य चरम सीमाओं का परीक्षण करने की आवश्यकता है।

एक अन्य महत्वपूर्ण योग्यता गतिविधि घटक तनाव विश्लेषण है। प्रत्येक भाग का मूल्यांकन एक निर्धारित ऑपरेटिंग स्थिति में, अधिकतम वोल्टेज / करंट / तापमान के विरुद्ध किया जाता है। मजबूती सुनिश्चित करने के लिए, एक उपयुक्त व्युत्पन्न दिशानिर्देश लागू किया जाना चाहिए (80% वोल्टेज, 70% शक्ति, आदि से अधिक नहीं)

केवल एक बार जब आप जानते हैं कि सामान्य परिस्थितियों में चीजें कैसे होती हैं, तो आप बाहरी असामान्यताओं, या कई असामान्यताओं जैसे कि आप वर्णन कर रहे हैं, के बारे में अनुमान लगाना शुरू कर सकते हैं। फिर, DFMEA मॉडल (एक्स होता है तो क्या होता है) एक अच्छा तरीका है। किसी भी संभावित चीज के बारे में सोचें जो एक उपयोगकर्ता इकाई के लिए कर सकता है - लघु आउटपुट, एक साथ सिग्नल टाई, उस पर पानी गिराएं - उन्हें आज़माएं, और देखें कि क्या होता है।

इन प्रकार की प्रणालियों के लिए एक एचएएलटी परीक्षण ( अत्यधिक त्वरित जीवन परीक्षण ) भी उपयोगी है। इकाई को एक पर्यावरणीय कक्ष में रखा जाता है और कंपन के साथ न्यूनतम से अधिकतम तापमान, न्यूनतम और अधिकतम इनपुट और आउटपुट तक व्यायाम किया जाता है। इससे इलेक्ट्रिकल और मैकेनिकल दोनों तरह के मुद्दे मिलेंगे।

यह कुछ एम्बेडेड फ़ज़ टेस्टिंग करने का भी एक अच्छा समय है - सभी इनपुट्स का उनकी अपेक्षित सीमाओं से परे अच्छी तरह से अभ्यास करें, तर्क में छेद खोजने के लिए UARTs / I2C, आदि के माध्यम से जिबरिश भेजें। (बिट-बैक्ड I2C दिनचर्या बस को लॉक करने के लिए कुख्यात है, उदाहरण के लिए।)

मजबूती का प्रदर्शन करने के लिए स्ट्रिफ़ टेस्टिंग एक अच्छा तरीका है। किसी भी सुरक्षा सुविधाओं जैसे कि अतिव्यापी, अधिभार आदि को अक्षम करें और कुछ टूटने तक तनाव लागू करें। यूनिट को तापमान में उतना ही ऊपर ले जाएं, जब तक कि यह विफल हो जाए या कुछ अनिश्चित व्यवहार न हो जाए। पावरट्रेन के विफल होने तक यूनिट को ओवरलोड करें। यदि कुछ पैरामीटर केवल सबसे खराब स्थिति से थोड़ा ऊपर विफल हो जाता है, तो इसका कुछ हद तक हाशिए का संकेत और कुछ डिजाइन पर विचार करना पड़ सकता है।

आप अगले स्तर के दृष्टिकोण को भी ले सकते हैं और शारीरिक रूप से अपने DFMEA के कुछ निष्कर्षों का परीक्षण कर सकते हैं - वास्तव में शॉर्ट्स और खोलता है और पिन-शॉर्ट्स करते हैं और देखते हैं कि क्या चल रहा है।

आगे की पढाई

मेरी पृष्ठभूमि सत्ता परिवर्तन में है। हमारे पास IPC-9592A नामक एक उद्योग मानक है जो यह निर्धारित करने का एक प्रयास है कि उत्पादों को किस परीक्षण के संदर्भ में योग्य होना चाहिए और उन्हें कैसे किया जाना चाहिए। इस दस्तावेज़ द्वारा संदर्भित कई प्रकार के परीक्षण और कार्यप्रणाली आसानी से अन्य विद्युत विषयों में उपयोग की जा सकती हैं।


6

I2C इंटरफ़ेस पर कई उपकरणों के साथ आपको "बड़बड़ा बेवकूफ" समस्या की संभावना है जहां एक उपकरण विफल हो जाता है, I2C को हॉग करता है, और अन्य सभी I2C प्रसारण को मारता है।

पर्यावरण परीक्षण के साथ संयुक्त सोख परीक्षण विफलता विश्लेषण का एक अलग रूप प्रदान करेगा। सीमांत घटकों का उपयोग करते हुए, अधिकतम / न्यूनतम / उतार-चढ़ाव वाले तापमान, विभिन्न आर्द्रता, गंदे बिजली की आपूर्ति, समय की अवधि के दौरान शोर आरएफ वातावरण आदि सामान्य उपयोग की एक लंबी अवधि का अनुकरण करते हैं। सिस्टम में वास्तविक विफलताएं होंगी और विफलता दर की गणना की जा सकती है।


3

सबसे अधिक संभावना गलती फर्मवेयर बग है। मैंने जो कुछ किया है वह सब कुछ था।

सुनिश्चित करें कि आपके पास वॉचडॉग टाइमर सक्षम है, और "कुत्ते को पेटिंग" करने से पहले सभी महत्वपूर्ण दोहराए जाने वाले कार्यों की आवश्यकता है। मुझे टाइमर बाधा में एक ध्वज सेट करना और मुख्य लूप में वॉचडॉग को साफ़ करने के लिए उपयोग करना पसंद है।

रीसेट चक्र पर भी अपने फर्मवेयर रिकवरी का परीक्षण करें।

चूंकि स्टार्टअप तब होता है जब बहुत सारी विफलताएं होती हैं, मुझे रिले के माध्यम से बिजली पसंद है, फिर बिजली चक्र के लिए एक त्वरित स्क्रिप्ट लिखो, रेडियो को प्रतीक्षा, पुनरावृत्ति का संकेत देने के लिए प्रतीक्षा करें। फिर ऐसा 10000 चक्रों तक करें।


परीक्षण पर बहुत दिलचस्प शक्ति। मेरी आखिरी कंपनी की एक परियोजना थी जिसे कई वर्षों तक चलाना पड़ा और एक गूंगा ट्रांसमीटर के समतुल्य रहना पड़ा और उस दौरान गलती नहीं हो सकती थी, फर्मवेयर कीड़े को हटाना शायद सबसे कठिन हिस्सा था।
कोर्तुक

2

कुछ स्पष्ट:

  • बैटरी की खराबी। इलेक्ट्रोलाइट के संभवतः नुकसान इलेक्ट्रॉनिक्स के संदूषण के लिए अग्रणी
  • पीवी सिस्टम से ओवरवॉल्टेज
  • यह चलती है या मशीनरी के पास? फिर झटका / कंपन
  • बाहरी वातावरण के कारण संचार का नुकसान (बारिश / बर्फ को अवशोषित करने वाले संकेत, आदि)।

यदि आप एक FMEA कर रहे हैं, तो आपको पहले यह विचार करने की आवश्यकता है कि सिस्टम कितना महत्वपूर्ण है इससे पहले कि आप यह तय कर सकें कि गलती क्या है।


2

मुझे आश्चर्य है कि किसी ने त्वरित जीवन परीक्षण और अत्यधिक त्वरित जीवन परीक्षण का उल्लेख नहीं किया है ।

आपके पास अपने निपटान में महत्वपूर्ण उपकरणों में से एक यह है कि तापमान में प्रत्येक 10 डिग्री सेंटीग्रेड वृद्धि के लिए, औसत विश्वसनीयता 50 प्रतिशत तक कम हो जाती है। आप अपने उत्पाद के जीवन का कुछ विचार बहुत बढ़े हुए तापमान पर परीक्षण करके प्राप्त कर सकते हैं। आपको इसका लाभ लेने के लिए उनके रेटेड तापमान से परे घटकों का परीक्षण करने की आवश्यकता नहीं है ।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.