सामान्य फ़्लोटिंग पॉइंट कार्यान्वयन में, एकल ऑपरेशन का परिणाम उत्पन्न होता है जैसे कि ऑपरेशन को अनंत परिशुद्धता के साथ किया गया था, और फिर निकटतम फ़्लोटिंग-पॉइंट नंबर पर गोल किया गया।
की तुलना और ख + एक : अनंत परिशुद्धता के साथ प्रदर्शन प्रत्येक ऑपरेशन का परिणाम एक ही है, इसलिए इन समान अनंत सटीक परिणाम एक समान तरीके से गोल कर रहे हैं। दूसरे शब्दों में, फ्लोटिंग-पॉइंट जोड़ सराहनीय है।a+bb+a
टेक : ख एक फ्लोटिंग प्वाइंट संख्या है। साथ द्विआधारी चल बिन्दु संख्या, 2 ख भी एक फ्लोटिंग प्वाइंट नंबर (प्रतिपादक एक करके बड़ा है), इसलिए है ख + ख किसी भी गोलाई त्रुटि के बिना जोड़ा जाता है। फिर a को सटीक मान b + b में जोड़ा जाता है । परिणाम सटीक मान 2 बी + ए है , जो निकटतम फ्लोटिंग-पॉइंट नंबर पर गोल है।b+b+ab2bb+bab+b2b+a
लो : एक + ख जोड़ा जाता है, और एक गोलाई त्रुटि होगी आर , तो हम परिणाम प्राप्त एक + ख + आर । बी जोड़ें , और परिणाम सटीक मान 2 बी + ए + आर है , जो निकटतम फ्लोटिंग-पॉइंट नंबर पर गोल है।a+b+ba+bra+b+rb2b+a+r
तो एक मामले में, , गोल। दूसरे मामले में, 2 बी + ए + आर , गोल।2b+a2b+a+r
पुनश्च। दो विशेष संख्याओं के लिए और बी दोनों गणना एक ही परिणाम देती हैं या नहीं यह संख्याओं पर निर्भर करता है, और गणना में ए + बी में गोल त्रुटि पर , और आमतौर पर भविष्यवाणी करना मुश्किल है। एकल या दोहरी परिशुद्धता का उपयोग करने से सिद्धांत में समस्या पर कोई फर्क नहीं पड़ता है, लेकिन चूंकि गोलाई की त्रुटियां अलग-अलग होती हैं, इसलिए a और b के मान होंगे जहां एकल परिशुद्धता में परिणाम बराबर होते हैं और दोहरी सटीकता में वे नहीं होते हैं, या इसके विपरीत। परिशुद्धता बहुत अधिक होगी, लेकिन समस्या यह है कि दो अभिव्यक्ति गणितीय रूप से समान हैं लेकिन फ्लोटिंग-पॉइंट अंकगणित में समान नहीं हैं।aba+b
पी पी एस। कुछ भाषाओं में, फ़्लोटिंग पॉइंट अंकगणित को उच्च सटीकता या वास्तविक विवरणों द्वारा दी गई संख्याओं की उच्च श्रेणी के साथ प्रदर्शित किया जा सकता है। उस मामले में, यह बहुत अधिक संभावना होगी (लेकिन अभी भी गारंटी नहीं है) कि दोनों रकम एक ही परिणाम देते हैं।
PPPS। एक टिप्पणी में पूछा गया है कि क्या हमें यह पूछना चाहिए कि फ्लोटिंग पॉइंट नंबर समान हैं या नहीं। बिल्कुल अगर आप जानते हैं कि आप क्या कर रहे हैं। उदाहरण के लिए, यदि आप एक सरणी को सॉर्ट करते हैं, या एक सेट को लागू करते हैं, तो आप अपने आप को भयानक परेशानी में डालते हैं यदि आप "लगभग बराबर" की कुछ धारणा का उपयोग करना चाहते हैं। एक ग्राफिकल यूजर इंटरफेस में, आपको ऑब्जेक्ट के आकारों को पुनर्गणना करने की आवश्यकता हो सकती है यदि किसी ऑब्जेक्ट का आकार बदल गया है - आप उस पुनर्गणना से बचने के लिए पुरानेसाइज == को नया आकार दें, यह जानते हुए कि व्यवहार में आपके पास लगभग समान आकार कभी नहीं हैं, और आपका प्रोग्राम सही है भले ही एक अनैच्छिक पुनर्वितरण हो।