बग का कारण बनने के लिए हस्ताक्षरित इंट के बजाय एक अहस्ताक्षरित का उपयोग कर रहा है? क्यों?

Question 1

में गूगल सी ++ स्टाइल गाइड , "अहस्ताक्षरित पूर्णांकों" के विषय पर, यह सुझाव दिया है कि

ऐतिहासिक दुर्घटना के कारण, C ++ मानक कंटेनरों के आकार का प्रतिनिधित्व करने के लिए अहस्ताक्षरित पूर्णांक का उपयोग करता है - मानक निकाय के कई सदस्य इसे गलती मानते हैं, लेकिन इस बिंदु पर इसे ठीक करना असंभव है। तथ्य यह है कि अहस्ताक्षरित अंकगणित एक साधारण पूर्णांक के व्यवहार को मॉडल नहीं करता है, लेकिन इसके बजाय मॉडल मॉड्यूलर अंकगणित (अतिप्रवाह / अंडरफ्लो पर चारों ओर लपेटने) के मानक द्वारा परिभाषित किया गया है, इसका मतलब है कि संकलक द्वारा बग के महत्वपूर्ण वर्ग का निदान नहीं किया जा सकता है।

मॉड्यूलर अंकगणित में क्या गलत है? एक अहस्ताक्षरित int का अपेक्षित व्यवहार नहीं है?

किस प्रकार के कीड़े (एक महत्वपूर्ण वर्ग) गाइड को संदर्भित करता है? अतिप्रवाह कीड़े?

एक अहस्ताक्षरित प्रकार का उपयोग केवल यह दावा करने के लिए न करें कि एक चर गैर-नकारात्मक है।

एक कारण यह है कि मैं हस्ताक्षरित int का उपयोग अहस्ताक्षरित int पर करने के बारे में सोच सकता हूं, यह है कि अगर यह अतिप्रवाह (नकारात्मक) करता है, तो इसका पता लगाना आसान है।

Question 2

जवाब में से कुछ यहाँ पर हस्ताक्षर किए और अहस्ताक्षरित मूल्यों के बीच आश्चर्य की बात पदोन्नति नियमों का उल्लेख है, लेकिन यह है कि अधिक से संबंधित एक समस्या की तरह लगता है मिश्रण पर हस्ताक्षर किए और अहस्ताक्षरित मूल्यों, और जरूरी स्पष्ट नहीं होता क्यों हस्ताक्षर किए चर से अधिक प्राथमिकता दी जाएगी अहस्ताक्षरित परिदृश्यों मिश्रण के बाहर।

मेरे अनुभव में, मिश्रित तुलना और पदोन्नति नियमों के बाहर, दो प्राथमिक कारण हैं कि अहस्ताक्षरित मान बग मैग्नेट निम्नानुसार हैं।

अहस्ताक्षरित मानों में शून्य पर असंतोष है, प्रोग्रामिंग में सबसे आम मूल्य है

अहस्ताक्षरित और हस्ताक्षर किए गए पूर्णांक दोनों में उनके न्यूनतम और अधिकतम मूल्यों पर एक कटाव होता है, जहां वे चारों ओर लपेटते हैं (अहस्ताक्षरित) या अपरिभाषित व्यवहार (हस्ताक्षरित) का कारण बनते हैं। के लिए unsignedइन बिंदुओं पर कर रहे हैं शून्य और UINT_MAX। के लिए intवे कर रहे हैं INT_MINऔर INT_MAX। की विशिष्ट मूल्यों INT_MINऔर INT_MAX4 बाइट के साथ सिस्टम पर intमान हैं -2^31और 2^31-1, और एक ऐसी प्रणाली पर UINT_MAXआम तौर पर है 2^32-1।

प्राथमिक बग-उत्प्रेरण समस्या unsignedजो इसके साथ लागू नहीं होती है int, वह यह है कि इसमें शून्य पर असंतोष है । शून्य, ज़ाहिर है, कार्यक्रमों में एक बहुत ही सामान्य मूल्य है, साथ ही अन्य छोटे मूल्य जैसे 1,2,3। विभिन्न निर्माणों में, विशेष रूप से 1, छोटे मानों को जोड़ना और घटाना सामान्य है, और यदि आप किसी भी चीज़ को किसी unsignedमूल्य से घटाते हैं और यह शून्य होता है, तो आपको एक बड़े पैमाने पर सकारात्मक मूल्य और लगभग एक निश्चित बग मिला है।

पिछले ^0.5 को छोड़कर सूचकांक द्वारा वेक्टर के सभी मूल्यों पर कोड पुनरावृत्तियों पर विचार करें :

for (size_t i = 0; i < v.size() - 1; i++) { // do something }

यह ठीक काम करता है जब तक कि एक दिन आप एक खाली वेक्टर में नहीं गुजरते। शून्य पुनरावृत्तियों करने के बजाय, आपको v.size() - 1 == a giant number¹ मिलता है और आप 4 बिलियन पुनरावृत्तियाँ करेंगे और लगभग एक बफर अतिप्रवाह भेद्यता होगी।

आपको इसे इस तरह लिखना होगा:

for (size_t i = 0; i + 1 < v.size(); i++) { // do something }

तो यह इस मामले में "तय" किया जा सकता है, लेकिन केवल बिना ध्यान दिए हुए प्रकृति के बारे में सोचकर size_t। कभी-कभी आप ऊपर दिए गए फ़िक्सेस को लागू नहीं कर सकते हैं क्योंकि एक स्थिर के बजाय आपके पास कुछ वैरिएबल ऑफ़सेट हैं जिन्हें आप लागू करना चाहते हैं, जो सकारात्मक या नकारात्मक हो सकता है: इसलिए तुलना के "पक्ष" जो आपको इसे लागू करने की आवश्यकता है, हस्ताक्षर पर निर्भर करता है - अब कोड वास्तव में गड़बड़ हो जाता है ।

कोड के साथ एक समान समस्या है जो शून्य तक और इसमें शामिल करने की कोशिश करता है। कुछ while (index-- > 0)ठीक काम करता है, लेकिन स्पष्ट रूप से समतुल्य while (--index >= 0)एक अहस्ताक्षरित मूल्य के लिए कभी समाप्त नहीं होगा। आपका कंपाइलर आपको चेतावनी दे सकता है जब दाहिने हाथ की ओर शाब्दिक शून्य है, लेकिन निश्चित रूप से नहीं अगर यह रनटाइम पर निर्धारित मूल्य है।

मुकाबला

कुछ लोग यह तर्क दे सकते हैं कि हस्ताक्षरित मूल्यों में भी दो विसंगतियां हैं, इसलिए अहस्ताक्षरित क्यों चुनें? अंतर यह है कि दोनों असंतोष शून्य से बहुत दूर (अधिकतम) हैं। मैं वास्तव में इसे "अतिप्रवाह" की एक अलग समस्या मानता हूं, दोनों हस्ताक्षरित और अहस्ताक्षरित मूल्य बहुत बड़े मूल्यों पर बह सकते हैं। कई मामलों में मूल्यों की संभावित सीमा पर बाधाओं के कारण अतिप्रवाह असंभव है, और कई 64-बिट मानों का अतिप्रवाह शारीरिक रूप से असंभव हो सकता है)। यदि संभव हो तो, अतिप्रवाह से संबंधित बग की संभावना "शून्य पर" बग की तुलना में अक्सर माइनसक्यूल होती है , और अहस्ताक्षरित मानों के लिए भी अतिप्रवाह होता है । इसलिए अहस्ताक्षरित दोनों दुनिया के सबसे बुरे को जोड़ती है: संभावित रूप से बहुत बड़े परिमाण मूल्यों के साथ अतिप्रवाह, और शून्य पर एक असंतोष। हस्ताक्षर केवल पूर्व के पास है।

कई लोग अहस्ताक्षरित के साथ "आप थोड़ा खो देंगे" का तर्क देंगे। यह अक्सर सच होता है - लेकिन हमेशा नहीं (यदि आपको अहस्ताक्षरित मूल्यों के बीच अंतर का प्रतिनिधित्व करने की आवश्यकता है तो आप उस बिट बिट को खो देंगे: तो कई 32-बिट चीजें 2 GiB तक सीमित हैं, या आपके पास एक अजीब ग्रे क्षेत्र होगा, जहां कहेंगे एक फ़ाइल 4 GiB हो सकती है, लेकिन आप दूसरे 2 GiB आधे पर कुछ API का उपयोग नहीं कर सकते हैं)।

यहां तक कि उन मामलों में जहां अहस्ताक्षरित आपको थोड़ा खरीदता है: यह आपको ज्यादा नहीं खरीदता है: यदि आपको 2 बिलियन से अधिक "चीजों" का समर्थन करना था, तो आपको जल्द ही 4 बिलियन से अधिक का समर्थन करना होगा।

तार्किक रूप से, अहस्ताक्षरित मूल्य हस्ताक्षरित मूल्यों का सबसेट हैं

गणितीय रूप से, अहस्ताक्षरित मान (गैर-नकारात्मक पूर्णांक) हस्ताक्षरित पूर्णांक (बस _integers) कहा जाता है। ^२ । फिर भी हस्ताक्षर किए गए मान स्वाभाविक रूप से केवल अहस्ताक्षरित मानों, जैसे घटाव पर संचालन से बाहर निकलते हैं । हम कह सकते हैं कि अहस्ताक्षरित मान घटाव के तहत बंद नहीं हैं । हस्ताक्षरित मूल्यों का सच नहीं है।

एक फ़ाइल में दो अहस्ताक्षरित अनुक्रमित के बीच "डेल्टा" खोजना चाहते हैं? खैर आप सही क्रम में घटाव को बेहतर करते हैं, अन्यथा आपको गलत उत्तर मिलेगा। बेशक, आपको सही ऑर्डर निर्धारित करने के लिए अक्सर रनटाइम चेक की आवश्यकता होती है! जब संख्या के रूप में अहस्ताक्षरित मानों के साथ काम करते हैं, तो आप अक्सर पाएंगे कि (तार्किक रूप से) हस्ताक्षरित मूल्य वैसे भी दिखाई देते हैं, इसलिए आप हस्ताक्षर के साथ शुरू कर सकते हैं।

मुकाबला

जैसा कि ऊपर फुटनोट (2) में उल्लेख किया गया है, सी ++ में हस्ताक्षरित मूल्य वास्तव में एक ही आकार के अहस्ताक्षरित मूल्यों का एक उपसमूह नहीं हैं, इसलिए अहस्ताक्षरित मान उन परिणामों की समान संख्या का प्रतिनिधित्व कर सकते हैं जो हस्ताक्षर किए गए मान कर सकते हैं।

सच है, लेकिन सीमा कम उपयोगी है। घटाव पर विचार करें, और 0 से 2N की सीमा के साथ अहस्ताक्षरित संख्याएँ, और -N की सीमा के साथ -N पर संख्याओं के साथ हस्ताक्षर किए। मनमाना घटाव परिणाम में परिणाम -2N से 2N में _both मामलों में होता है, और या तो पूर्णांक का केवल प्रतिनिधित्व कर सकते हैं इसका आधा। वैसे यह पता चला है कि एन-एन के शून्य के आसपास केंद्रित क्षेत्र आमतौर पर 0 से 2N की सीमा की तुलना में अधिक उपयोगी होता है (वास्तविक दुनिया कोड में अधिक वास्तविक परिणाम होता है)। वर्दी (लॉग, जिप्फ़ियन, सामान्य, जो) के अलावा अन्य किसी भी सामान्य वितरण पर विचार करें और उस वितरण से बेतरतीब ढंग से चयनित मूल्यों को घटाने पर विचार करें: जिस तरह से [0, 2N] की तुलना में [-एन, एन] में अधिक मूल्य समाप्त होते हैं (वास्तव में, परिणामस्वरूप वितरण हमेशा शून्य पर केंद्रित है)।

64-बिट संख्याओं के रूप में हस्ताक्षर किए गए मानों का उपयोग करने के कई कारणों से दरवाजा बंद कर देता है

मुझे लगता है कि उपरोक्त तर्क 32-बिट मूल्यों के लिए पहले से ही मजबूर थे, लेकिन अतिप्रवाह के मामले, जो विभिन्न थ्रेसहोल्ड पर हस्ताक्षरित और अहस्ताक्षरित दोनों को प्रभावित करते हैं, 32-बिट मान के लिए होते हैं, क्योंकि "2 बिलियन" एक संख्या है जो कई से अधिक हो सकती है सार और भौतिक मात्रा (अरबों डॉलर, अरबों नैनोसेकंड, अरबों तत्वों के साथ सरणियाँ)। इसलिए अगर किसी को अहस्ताक्षरित मूल्यों के लिए सकारात्मक सीमा के दोगुने होने का यकीन है, तो वे ऐसा मामला बना सकते हैं जो अतिप्रवाह मायने रखता है और यह थोड़ा अहस्ताक्षरित है।

विशेष डोमेन के बाहर 64-बिट मान काफी हद तक इस चिंता को दूर करते हैं। हस्ताक्षरित 64-बिट मानों की ऊपरी सीमा 9,223,372,036,854,775,807 - नौ क्विंटल से अधिक है । यह बहुत अधिक नैनोसेकंड (लगभग 292 साल), और बहुत सारा पैसा है। यह किसी भी कंप्यूटर की तुलना में एक बड़ी सरणी है जिसमें लंबे समय तक एक सुसंगत पते के स्थान में रैम होने की संभावना है। तो शायद 9 क्विंटल हर किसी के लिए पर्याप्त है (अभी के लिए)?

अहस्ताक्षरित मूल्यों का उपयोग कब करें

ध्यान दें कि स्टाइल गाइड निषिद्ध संख्याओं के उपयोग को मना या आवश्यक नहीं करता है। इसके साथ समाप्त होता है:

एक अहस्ताक्षरित प्रकार का उपयोग केवल यह दावा करने के लिए न करें कि एक चर गैर-नकारात्मक है।

वास्तव में, अहस्ताक्षरित चर के लिए अच्छे उपयोग हैं:

जब आप एन-बिट मात्रा को पूर्णांक के रूप में नहीं, बल्कि बस एक "बिट्स के बैग" के रूप में व्यवहार करना चाहते हैं। उदाहरण के लिए, एक बिटमास्क या बिटमैप या एन बुलियन मान या जो भी हो। यह उपयोग अक्सर निश्चित चौड़ाई प्रकारों के साथ हाथ से हाथ जाता है uint32_tऔर uint64_tचूंकि आप अक्सर चर के सटीक आकार को जानना चाहते हैं। एक संकेत है कि एक विशेष चर इस इलाज के हकदार है कि आप केवल के साथ साथ इस पर काम करते है बिटवाइज़ जैसे ऑपरेटरों ~, |, &, ^, >>और इतने पर, और नहीं अंकगणितीय आपरेशनों जैसे के साथ +, -, *, /आदि

अनसाइनड यहाँ आदर्श है क्योंकि बिटवाइज़ ऑपरेटरों का व्यवहार अच्छी तरह से परिभाषित और मानकीकृत है। हस्ताक्षर किए गए मानों में कई समस्याएं हैं, जैसे कि स्थानांतरण के समय अपरिभाषित और अनिर्दिष्ट व्यवहार और एक अनिर्दिष्ट प्रतिनिधित्व।
जब आप वास्तव में मॉड्यूलर अंकगणित चाहते हैं। कभी-कभी आप वास्तव में 2 ^ एन मॉड्यूलर अंकगणित चाहते हैं। इन मामलों में "अतिप्रवाह" एक विशेषता है, बग नहीं। अहस्ताक्षरित मान आपको वही देते हैं जो आप यहां चाहते हैं क्योंकि वे मॉड्यूलर अंकगणित का उपयोग करने के लिए परिभाषित किए गए हैं। क्योंकि वे एक अनिर्दिष्ट प्रतिनिधित्व है और अतिप्रवाह अपरिभाषित है पर हस्ताक्षरित मान (आसानी से, कुशलता से) का उपयोग नहीं किया जा सकता है।

^०.५ मैंने इसे लिखने के बाद महसूस किया कि यह जैरोड के उदाहरण के लगभग समान है , जिसे मैंने नहीं देखा था - और अच्छे कारण के लिए, यह एक अच्छा उदाहरण है!

¹ हम size_tयहां बात कर रहे हैं आमतौर पर 2 ^ 32-1 एक 32-बिट सिस्टम पर या 2 ^ 64-1 64-बिट एक पर।

² सी + + में यह बिल्कुल मामला नहीं है क्योंकि अहस्ताक्षरित मानों में संबंधित हस्ताक्षरित प्रकार की तुलना में ऊपरी छोर पर अधिक मूल्य होते हैं, लेकिन मूल समस्या मौजूद है कि अहस्ताक्षरित मानों में हेरफेर करने के परिणामस्वरूप (तार्किक रूप से) हस्ताक्षरित मान हो सकते हैं, लेकिन कोई संगत मुद्दा नहीं है। हस्ताक्षरित मूल्यों के साथ (क्योंकि हस्ताक्षरित मूल्यों में पहले से ही अहस्ताक्षरित मूल्य शामिल हैं)।

Question 3

जैसा कि कहा गया है, मिश्रण unsignedऔर signedअप्रत्याशित व्यवहार को जन्म दे सकता है (भले ही अच्छी तरह से परिभाषित हो)।

मान लीजिए कि आप पिछले पांच को छोड़कर वेक्टर के सभी तत्वों पर चलना चाहते हैं, तो आप गलत तरीके से लिख सकते हैं:

for (int i = 0; i < v.size() - 5; ++i) { foo(v[i]); } // Incorrect
// for (int i = 0; i + 5 < v.size(); ++i) { foo(v[i]); } // Correct

मान लीजिए v.size() < 5, फिर, जैसा कि v.size()है unsigned, s.size() - 5एक बहुत बड़ी संख्या होगी, और इसलिए मूल्य के अधिक अपेक्षित रेंज के लिए i < v.size() - 5होगा । और UB तब जल्दी से होता है (एक बार बाउंड एक्सेस से बाहर )trueii >= v.size()

यदि v.size()हस्ताक्षरित मूल्य वापस होगा, तो s.size() - 5नकारात्मक होगा, और उपरोक्त मामले में, स्थिति तुरंत झूठी होगी।

दूसरी तरफ, सूचकांक के बीच होना चाहिए [0; v.size()[इसलिए unsignedसमझ में आता है। एक हस्ताक्षरित नकारात्मक संख्या के सही बदलाव के लिए अतिप्रवाह या कार्यान्वयन-परिभाषित व्यवहार के साथ हस्ताक्षरित UB के रूप में अपना स्वयं का मुद्दा भी है, लेकिन पुनरावृत्ति के लिए बग का कम लगातार स्रोत।

Question 4

त्रुटि के सबसे अधिक बालों को बढ़ाने वाले उदाहरणों में से एक है जब आपने MIX हस्ताक्षरित और अहस्ताक्षरित मान:

#include <iostream>
int main()  {
    auto qualifier = -1 < 1u ? "makes" : "does not make";
    std::cout << "The world " << qualifier << " sense" << std::endl;
}

उत्पादन:

दुनिया को इससे कोई मतलब नहीं है

जब तक आपके पास एक तुच्छ अनुप्रयोग नहीं है, तब तक यह अपरिहार्य है कि आप हस्ताक्षरित और अहस्ताक्षरित मूल्यों (परिणामस्वरूप रनटाइम त्रुटियों) के बीच या तो खतरनाक मिश्रणों के साथ समाप्त हो जाएंगे या यदि आप चेतावनियों को क्रैंक करते हैं और उन्हें संकलन-समय की त्रुटियां बनाते हैं, तो आप बहुत सारे के साथ समाप्त हो जाते हैं अपने कोड में static_casts। इसलिए गणित या तार्किक तुलना के प्रकारों के लिए हस्ताक्षरित पूर्णांक का सख्ती से उपयोग करना सबसे अच्छा है। केवल बिटमास्क और बिट प्रतिनिधित्व वाले प्रकारों के लिए अहस्ताक्षरित का उपयोग करें।

अपने नंबरों के मूल्यों के अपेक्षित डोमेन के आधार पर अहस्ताक्षरित होने के लिए मॉडलिंग करना एक बुरा विचार है। अधिकांश संख्याएं 0 से अधिक के करीब हैं, क्योंकि वे 2 बिलियन हैं, इसलिए अहस्ताक्षरित प्रकारों के साथ, आपके बहुत सारे मूल्य मान्य सीमा के किनारे के करीब हैं। चीजों को बदतर बनाने के लिए, अंतिम मूल्य एक ज्ञात सकारात्मक सीमा में हो सकता है, लेकिन अभिव्यक्तियों का मूल्यांकन करते समय, मध्यवर्ती मूल्य कम हो सकते हैं और यदि वे मध्यवर्ती रूप में उपयोग किए जाते हैं तो बहुत गलत मान हो सकते हैं। अंत में, भले ही आपके मूल्य हमेशा सकारात्मक होने की उम्मीद हो, इसका मतलब यह नहीं है कि वे अन्य चर के साथ बातचीत नहीं करेंगे जो नकारात्मक हो सकते हैं, और इसलिए आप हस्ताक्षर किए गए और अहस्ताक्षरित प्रकारों के मिश्रण की एक मजबूर स्थिति के साथ समाप्त होते हैं, जो है सबसे खराब जगह है।

Question 5

एक हस्ताक्षरित int का उपयोग करने की तुलना में बग के कारण बग के लिए अहस्ताक्षरित int का उपयोग करने की अधिक संभावना क्यों है?

एक अहस्ताक्षरित प्रकार का उपयोग करने से कुछ प्रकार के कार्यों के साथ हस्ताक्षरित प्रकार का उपयोग करने की तुलना में बग पैदा होने की अधिक संभावना नहीं है।

इस काम के लिए सही उपकरण का उपयोग करें।

मॉड्यूलर अंकगणित में क्या गलत है? एक अहस्ताक्षरित int का अपेक्षित व्यवहार नहीं है?
एक हस्ताक्षरित int का उपयोग करने की तुलना में बग के कारण बग के लिए अहस्ताक्षरित int का उपयोग करने की अधिक संभावना क्यों है?

यदि कार्य अच्छी तरह से मेल खाता है: कुछ भी गलत नहीं है। नहीं, अधिक संभावना नहीं है।

सुरक्षा, एन्क्रिप्शन, और प्रमाणीकरण एल्गोरिथ्म अहस्ताक्षरित मॉड्यूलर गणित पर भरोसा करते हैं।

संपीड़न / अपघटन एल्गोरिदम भी और साथ ही विभिन्न ग्राफिक प्रारूप लाभान्वित होते हैं और अहस्ताक्षरित गणित के साथ कम छोटी गाड़ी होती है ।

किसी भी समय बिट-वार ऑपरेटरों और पारियों का उपयोग किया जाता है, बिना हस्ताक्षर किए गए हस्ताक्षरित गणित के साइन-एक्सटेंशन मुद्दों के साथ गड़बड़ नहीं होते हैं ।

हस्ताक्षरित पूर्णांक गणित में सहज ज्ञान युक्त रूप है और सभी शिक्षार्थियों द्वारा कोडिंग के लिए आसानी से समझ में आते हैं। C / C ++ मूल रूप से लक्षित नहीं था और न ही अब इसे इंट्रो-भाषा होना चाहिए। तेजी से कोडिंग के लिए जो अतिप्रवाह से संबंधित सुरक्षा जाल का उपयोग करते हैं, अन्य भाषाएं बेहतर अनुकूल हैं। लीन फास्ट कोड के लिए, C यह मानता है कि कोडर्स जानते हैं कि वे क्या कर रहे हैं (वे अनुभवी हैं)।

हस्ताक्षरित गणित का एक नुकसान आज सर्वव्यापी 32-बिट है intजो इतनी सारी समस्याओं के साथ - साथ आम कार्यों के लिए काफी हद तक व्यापक है। यह शालीनता की ओर जाता है कि अतिप्रवाह के खिलाफ कोड नहीं किया गया है। इसके बजाय, for (int i=0; i < n; i++) int len = strlen(s);ओके के रूप में देखा जाता है क्योंकि nयह माना जाता है कि < INT_MAXऔर स्ट्रिंग्स कभी भी बहुत लंबे नहीं होंगे, बजाय पहले मामले में पूर्ण रक्षित या उपयोग किए गए size_t, unsignedया यहां तक long longकि 2 में संरक्षित ।

C / C ++ एक ऐसे युग में विकसित हुआ जिसमें 16-बिट के साथ-साथ 32-बिट भी शामिल थे intऔर अतिरिक्त बिट्स का एक बिट-बिट size_tप्रतिरूप महत्वपूर्ण था। समस्याओं के अतिप्रवाह के संबंध में ध्यान देने की आवश्यकता थी intया यह हो सकता है unsigned।

गैर-16 बिट int/unsignedप्लेटफार्मों पर Google के 32-बिट (या व्यापक) अनुप्रयोगों के साथ , intइसकी पर्याप्त रेंज के +/- ओवरफ्लो पर ध्यान देने की कमी को हल करता है । यह इस तरह के अनुप्रयोगों को intखत्म करने के लिए प्रोत्साहित करता है unsigned। फिर भी intगणित अच्छी तरह से संरक्षित नहीं है।

संकीर्ण 16-बिट int/unsignedचिंताएं आज चुनिंदा एम्बेडेड अनुप्रयोगों के साथ लागू होती हैं।

Google के दिशानिर्देश उस कोड के लिए अच्छी तरह से लागू होते हैं जो वे आज लिखते हैं। यह C / C ++ कोड के बड़े दायरे के लिए एक निश्चित दिशानिर्देश नहीं है।

एक कारण यह है कि मैं हस्ताक्षरित int का उपयोग अहस्ताक्षरित int पर करने के बारे में सोच सकता हूं, यह है कि अगर यह अतिप्रवाह (नकारात्मक) करता है, तो इसका पता लगाना आसान है।

C / C ++ में, हस्ताक्षरित इंट गणित अतिप्रवाह अपरिभाषित व्यवहार है और इसलिए अहस्ताक्षरित गणित के परिभाषित व्यवहार की तुलना में निश्चित रूप से पता लगाना आसान नहीं है ।

जैसा कि @Chris उज़ाद्विनियों ने अच्छी तरह से टिप्पणी की है, हस्ताक्षरित और अहस्ताक्षरित मिश्रण को सभी (विशेषकर शुरुआती) से बचा जाता है और अन्यथा जरूरत पड़ने पर सावधानी से कोडित किया जाता है।

Question 6

मुझे Google के स्टाइल गाइड, AKA द हिचहाइकर गाइड टू इनसाइन डाइरेक्टिव्स टू बैड प्रोग्रामर्स हू गॉट इन द कंपनी इन ए लॉन्ग लॉन्ग टाइम एगो के साथ कुछ अनुभव है। यह विशेष दिशानिर्देश उस पुस्तक के दर्जनों अखरोट के नियमों का सिर्फ एक उदाहरण है।

यदि आप उनके साथ अंकगणित करने की कोशिश करते हैं (तो क्रिस उज़ाद्विनियाँ ऊपर देखें), यदि आप उन्हें संख्याओं के रूप में उपयोग करते हैं, तो त्रुटिपूर्ण प्रकार से त्रुटियां होती हैं। अनसाइन किए गए प्रकारों का उपयोग संख्यात्मक मात्राओं को संग्रहीत करने के लिए उपयोग नहीं किया जाता है, उनका उद्देश्य ऐसे कंटेनरों के आकार की गणना करना है , जो कभी भी नकारात्मक नहीं हो सकते, और उनका उपयोग उस उद्देश्य के लिए किया जा सकता है।

कंटेनर आकार को संग्रहीत करने के लिए अंकगणितीय प्रकार (जैसे हस्ताक्षर किए गए पूर्णांक) का उपयोग करने का विचार मूर्खतापूर्ण है। क्या आप किसी सूची के आकार को संग्रहीत करने के लिए दोहरे का उपयोग करेंगे? कि Google में कंटेनर के आकार के लोग अंकगणितीय प्रकारों का उपयोग कर रहे हैं और दूसरों को कंपनी के बारे में कुछ कहने की आवश्यकता है। इस तरह के हुक्मरानों के बारे में एक बात जो मुझे ध्यान में आती है, वह यह है कि वे जितने सख्त हैं, उतने ही उन्हें सख्त नियमों का पालन करने की जरूरत है क्योंकि अन्यथा सामान्य बुद्धि वाले लोग नियम की अनदेखी करेंगे।

Question 7

गैर-नकारात्मक मानों का प्रतिनिधित्व करने के लिए अहस्ताक्षरित प्रकारों का उपयोग करना ...

अन्य उत्तर प्रदर्शित और गहराई से चर्चा के रूप में, हस्ताक्षरित और अहस्ताक्षरित मानों का उपयोग करते समय, प्रकार के प्रचार को शामिल करने वाले कीड़े होने की अधिक संभावना है, लेकिन
है कम संभावना है undersirable / अनुमति नहीं मान प्रतिनिधित्व करने में सक्षम डोमेन के साथ प्रकार के विकल्प को शामिल कारण कीड़े के लिए। कुछ स्थानों पर आप मान लेंगे कि मूल्य डोमेन में है, और किसी भी तरह से अन्य मूल्य छीने जाने पर अप्रत्याशित और संभावित रूप से खतरनाक व्यवहार हो सकता है।

Google कोडिंग दिशानिर्देश पहली तरह के विचार पर जोर देता है। अन्य दिशानिर्देश सेट, जैसे कि C ++ कोर दिशानिर्देश , दूसरे बिंदु पर अधिक जोर देते हैं। उदाहरण के लिए, कोर दिशानिर्देश I.12 पर विचार करें :

I.12: एक ऐसे पॉइंटर की घोषणा करें जो कि अशक्त नहीं होना चाहिए not_null

कारण

डेलीफ्रेंसिंग nullptr त्रुटियों से बचने में मदद करने के लिए। के लिए निरर्थक चेकों से बचने के प्रदर्शन में सुधार करने nullptr।

उदाहरण
int length(const char* p);            // it is not clear whether length(nullptr) is valid
length(nullptr);                      // OK?
int length(not_null<const char*> p);  // better: we can assume that p cannot be nullptr
int length(const char* p);            // we must assume that p can be nullptr
स्रोत में इरादे को बताते हुए, कार्यान्वयनकर्ता और उपकरण बेहतर निदान प्रदान कर सकते हैं, जैसे कि स्थैतिक विश्लेषण के माध्यम से त्रुटियों के कुछ वर्ग ढूंढना, और अनुकूलन करना, जैसे शाखाओं और अशक्त परीक्षणों को हटाना।

बेशक, आप non_negativeपूर्णांकों के लिए एक आवरण के लिए तर्क कर सकते हैं, जो त्रुटियों की दोनों श्रेणियों से बचता है, लेकिन इसके अपने मुद्दे होंगे ...

Question 8

Google स्टेटमेंट कंटेनर के लिए एक आकार प्रकार के रूप में अहस्ताक्षरित का उपयोग करने के बारे में है । इसके विपरीत, प्रश्न अधिक सामान्य प्रतीत होता है। कृपया इसे ध्यान में रखें, जबकि आप पढ़ते हैं।

चूंकि अधिकांश उत्तर अब तक Google स्टेटमेंट पर प्रतिक्रिया व्यक्त करते हैं, इसलिए बड़े प्रश्न से कम, मैं नकारात्मक कंटेनर आकारों के बारे में अपना जवाब शुरू करूंगा और बाद में किसी को भी समझाने की कोशिश करूंगा (निराशाजनक, मुझे पता है ...) कि अहस्ताक्षरित अच्छा है।

कंटेनर के आकार पर हस्ताक्षर किए

चलो मान लेते हैं कि किसी ने बग को कोडित किया है, जिसके परिणामस्वरूप एक नकारात्मक कंटेनर इंडेक्स होता है। परिणाम या तो अपरिभाषित व्यवहार है या अपवाद / पहुंच उल्लंघन है। क्या यह वास्तव में अपरिभाषित व्यवहार या अपवाद / पहुंच उल्लंघन से बेहतर है जब सूचकांक प्रकार अहस्ताक्षरित था? मेरे ख़्याल से नहीं।

अब, ऐसे लोगों का एक वर्ग है जो गणित के बारे में बात करना पसंद करते हैं और इस संदर्भ में "प्राकृतिक" क्या है। नकारात्मक संख्या के साथ एक अभिन्न प्रकार किसी चीज़ का वर्णन करने के लिए स्वाभाविक कैसे हो सकता है, जो स्वाभाविक रूप से> = 0 है? नकारात्मक आकारों के साथ सरणियों का उपयोग करना? IMHO, विशेष रूप से गणितीय रूप से इच्छुक लोगों को यह शब्दार्थ का बेमेल आकार (आकार / सूचकांक प्रकार कहता है कि नकारात्मक संभव है, जबकि एक नकारात्मक आकार की सरणी की कल्पना करना कठिन है) परेशान है।

तो, केवल एक ही सवाल, इस मामले पर शेष है अगर - जैसा कि Google टिप्पणी में कहा गया है - एक संकलक वास्तव में इस तरह के कीड़े को खोजने में सक्रिय रूप से सहायता कर सकता है। और विकल्प से भी बेहतर, जो कि बिना सोचे-समझे संरक्षित पूर्णांक (x86-64 असेंबली) के अंडरफ़्लो होगा और शायद अन्य आर्किटेक्चर के पास इसे प्राप्त करने का साधन है, केवल C / C ++ उन साधनों का उपयोग नहीं करता है)। एक ही तरीका है कि मैं थाह कर सकता हूं, यदि कंपाइलर स्वचालित रूप से रन टाइम चेक ( if (index < 0) throwOrWhatever) जोड़ देता है या संकलित समय क्रियाओं के मामले में संभावित रूप से गलत सकारात्मक चेतावनी / त्रुटियां उत्पन्न करता है "इस सरणी पहुंच के लिए सूचकांक नकारात्मक हो सकता है।" मुझे अपने संदेह हैं, यह मददगार होगा।

इसके अलावा, जो लोग वास्तव में अपने सरणी / कंटेनर सूचकांकों के लिए रनटाइम चेक लिखते हैं, यह हस्ताक्षरित पूर्णांक से निपटने के लिए अधिक काम है। लिखने के बजाय if (index < container.size()) { ... }अब आपको लिखना होगा if (index >= 0 && index < container.size()) { ... }:। लगता है कि मेरे लिए मज़दूर मजबूर हैं और सुधार की तरह नहीं ...

अहस्ताक्षरित प्रकारों के बिना भाषाएँ चूसना ...

हाँ, यह जावा में एक छुरा है। अब, मैं एम्बेडेड प्रोग्रामिंग पृष्ठभूमि से आता हूं और हमने फील्ड बसों के साथ बहुत काम किया है, जहां बाइनरी ऑपरेशंस (और, या, एक्सोर, ...) और बिट वैल्यूज़ ऑफ वैल्यूज़ का शाब्दिक अर्थ है रोटी और बटर। हमारे उत्पादों में से एक के लिए, हम - या बल्कि एक ग्राहक - एक जावा पोर्ट चाहते थे ... और मैं सौभाग्य से बहुत सक्षम आदमी के विपरीत बैठ गया जिसने बंदरगाह किया था (मैंने इनकार कर दिया ...)। उन्होंने रचनाबद्ध रहने का प्रयास किया ... और चुप्पी में पीड़ित रहे ... लेकिन दर्द था, वह लगातार हस्ताक्षरित अभिन्न मूल्यों से निपटने के कुछ दिनों के बाद कोसना बंद नहीं कर सके, जो अप्रमाणित होना चाहिए ... यहां तक कि इकाई परीक्षण भी लिखना वे परिदृश्य दर्दनाक हैं और मेरे लिए, व्यक्तिगत रूप से मुझे लगता है कि जावा बेहतर होता अगर वे हस्ताक्षर किए गए पूर्णांक को छोड़ देते थे और सिर्फ अहस्ताक्षरित की पेशकश करते थे ... कम से कम तब, आपको साइन एक्सटेंशन आदि के बारे में परवाह नहीं है ...

इस मामले पर मेरे 5 सेंट हैं।

बग का कारण बनने के लिए हस्ताक्षरित इंट के बजाय एक अहस्ताक्षरित का उपयोग कर रहा है? क्यों?

अहस्ताक्षरित मानों में शून्य पर असंतोष है, प्रोग्रामिंग में सबसे आम मूल्य है

मुकाबला

तार्किक रूप से, अहस्ताक्षरित मूल्य हस्ताक्षरित मूल्यों का सबसेट हैं

मुकाबला

64-बिट संख्याओं के रूप में हस्ताक्षर किए गए मानों का उपयोग करने के कई कारणों से दरवाजा बंद कर देता है

अहस्ताक्षरित मूल्यों का उपयोग कब करें

I.12: एक ऐसे पॉइंटर की घोषणा करें जो कि अशक्त नहीं होना चाहिए not_null

कंटेनर के आकार पर हस्ताक्षर किए

अहस्ताक्षरित प्रकारों के बिना भाषाएँ चूसना ...

I.12: एक ऐसे पॉइंटर की घोषणा करें जो कि अशक्त नहीं होना चाहिए `not_null`