फ्लोट और दोहरी तुलना के लिए सबसे प्रभावी तरीका क्या है?


524

दो doubleया दो floatमूल्यों की तुलना करने का सबसे कारगर तरीका क्या होगा ?

बस ऐसा करना सही नहीं है:

bool CompareDoubles1 (double A, double B)
{
   return A == B;
}

लेकिन कुछ इस तरह:

bool CompareDoubles2 (double A, double B) 
{
   diff = A - B;
   return (diff < EPSILON) && (-diff < EPSILON);
}

बेकार प्रसंस्करण लगता है।

किसी को भी एक फ्लोट तुलना तुलना में पता है?


2
> समारोह की शुरुआत में इसे जोड़ना अधिक कुशल होगा? <invoke Knuth>सभी बुराईयो की जड़ समयपूर्व इष्टतमीकरण है।</invoke Knuth>बस एब्स (ab) <EPS के साथ ऊपर जाएं, यह स्पष्ट और समझने में आसान है।
बजे एंड्रयू कोलेसन

2
यहाँ यह बूस्ट टेस्ट लाइब्रेरी में लागू किया गया तरीका है: http://www.boost.org/doc/libs/1_36_0/libs/test/doc/html/utf/testing-tools/floating_point_comparison.html
Alessandro Jacopson

2
मूल पोस्टर के कार्यान्वयन के बारे में एकमात्र बात यह है कि इसमें && पर एक अतिरिक्त शाखा शामिल है। OJ का उत्तर इष्टतम है। फैब्स एक आंतरिक है जो x87 पर एक एकल निर्देश है, और मुझे लगता है कि लगभग कुछ और पर भी। पहले से ही OJ के उत्तर को स्वीकार करें!
ईई

3
यदि आप कर सकते हैं, तो फ़्लोटिंग पॉइंट को छोड़ दें और निश्चित बिंदुओं का उपयोग करें। उदाहरण के लिए, {फ़्लोटिंग पॉइंट} मीटर के बजाय {फिक्स्ड पॉइंट} मिलीमीटर का उपयोग करें।
थॉमस मैथ्यूज

33
"बस ऐसा करना सही नहीं है" - यह केवल बकवास है, बेशक इसका उपयोग ==पूरी तरह से सही हो सकता है, लेकिन यह पूरी तरह से प्रश्न में दिए गए संदर्भ पर निर्भर करता है। जब तक उस संदर्भ को नहीं जाना जाता है, तब ==भी वह "सबसे कुशल तरीका" है
क्रिश्चियन राऊ

जवाबों:


459

किसी भी अन्य सुझाव का उपयोग करते हुए बेहद सावधान रहें। यह सब संदर्भ पर निर्भर करता है।

मैंने एक सिस्टम में बग्स को ट्रेस करने के लिए एक लंबा समय बिताया है, जो कि a==bयदि माना जाता है |a-b|<epsilon। अंतर्निहित समस्याएं थीं:

  1. एक एल्गोरिथ्म में निहित अनुमान है कि अगर a==bऔरb==c फिर a==c

  2. इंच में मापी गई लाइनों और मिल्स (.001 इंच) में मापी गई लाइनों के लिए समान एप्सिलॉन का उपयोग करना। वह है a==bलेकिन1000a!=1000b । (यही वजह है कि लगभग EEEEPAL2sCom कार्यान्वयन एप्सिलॉन या अधिकतम ULPS के लिए पूछता है)।

  3. कोणों के कोसाइन और लाइनों की लंबाई दोनों के लिए एक ही एप्सिलॉन का उपयोग!

  4. एक संग्रह में आइटम को सॉर्ट करने के लिए इस तरह के तुलना फ़ंक्शन का उपयोग करना। (इस मामले में निर्मित सी + ऑपरेटर == का उपयोग करके डबल्स के लिए सही परिणाम तैयार किए गए।)

जैसा मैंने कहा: यह सब संदर्भ और अपेक्षित आकार पर निर्भर करता है a है और b

Btw, std::numeric_limits<double>::epsilon() "मशीन एप्सिलॉन" है। यह 1.0 और अगले मूल्य के बीच का अंतर है जो एक डबल द्वारा दर्शाया गया है। मुझे लगता है कि यह तुलना फ़ंक्शन में इस्तेमाल किया जा सकता है लेकिन केवल तभी जब अपेक्षित मान 1 से कम हों (यह @ सीडीवी के जवाब के जवाब में है ...)

इसके अलावा, यदि आप मूल रूप से intअंकगणित में हैं doubles(यहाँ हम कुछ मामलों में अंतर मान रखने के लिए डबल्स का उपयोग करते हैं) तो आपका अंकगणित सही होगा। उदाहरण के लिए 4.0 / 2.0 1.0 + 1.0 के समान होगा। यह तब तक है जब तक आप उन चीजों को नहीं करते हैं जिनके परिणामस्वरूप अंश (4.0 / 3.0) होते हैं या एक इंट के आकार से बाहर नहीं जाते हैं।


10
+1 स्पष्ट इंगित करने के लिए (जिसे अक्सर अनदेखा कर दिया जाता है)। एक सामान्य विधि के लिए, आप एप्सिलॉन को सापेक्ष बना सकते हैं fabs(a)+fabs(b)लेकिन NaN, 0 राशि और अतिप्रवाह की भरपाई के साथ, यह काफी जटिल हो जाता है।
पीटरचेन

4
मेरी समझ में कुछ ऐसा होना चाहिए। ठेठ float/ doubleहै अपूर्णांश एक्स 2 ^ ऍक्स्पepsilonप्रतिपादक पर निर्भर करेगा। उदाहरण के लिए यदि अपूर्णांश 24bits और प्रतिपादक 8 बिट पर हस्ताक्षर किए है, तो 1/(2^24)*2^127या ~2^103एक है epsilonकुछ मूल्यों के लिए; या यह एक न्यूनतम एप्सिलॉन का जिक्र है ?
आर्टलेस शोर

3
एक सेकंड रुको। क्या मैंने कहा कि तुम क्या मतलब है? आप कह रहे हैं क्यों |a-b|<epsilon, सही नहीं है। कृपया इस लिंक को अपने उत्तर में जोड़ें; अगर आप सहमत हैं cygnus-software.com/papers/comparingfloats/comparingfloats.htm और मैं अपनी गूंगी टिप्पणियों को हटा सकता हूं।
आर्टलेस शोर

3
यह एक बहुत लंबी टिप्पणी है, अपने आप में एक जवाब नहीं है। क्या सभी संदर्भों के लिए कैनोनिकल उत्तर (ओं) का एक सेट है?
मेरलिन मॉर्गन-ग्राहम

2
पुराना लिंक अप्रचलित प्रतीत हो रहा है, नया पृष्ठ यहां randomascii.wordpress.com/2012/02/25/…
Marson Mao

174

एक एप्सिलॉन मूल्य के साथ तुलना जो ज्यादातर लोग करते हैं (गेम प्रोग्रामिंग में भी)।

आपको अपना कार्यान्वयन थोड़ा बदलना चाहिए:

bool AreSame(double a, double b)
{
    return fabs(a - b) < EPSILON;
}

संपादित करें: क्रिस्टर ने हाल ही में ब्लॉग पोस्ट पर इस विषय पर महान जानकारी का एक स्टैक जोड़ा है । का आनंद लें।


@OJ: पहले कोड के नमूने में कुछ गड़बड़ है? मैंने सोचा था कि एकमात्र समस्या इस तरह की स्थिति में थी: float a = 3.4; if(a == 3.4){...}जब आप एक संग्रहीत फ़्लोटिंग बिंदु की तुलना शाब्दिक रूप से करते हैं इस स्थिति में, दोनों संख्याओं को संग्रहीत किया जाता है, इसलिए उनके पास समान प्रतिनिधित्व होगा, यदि बराबर है, तो ऐसा करने में नुकसान क्या है a == b?
लेज़र

11
@DonReba: केवल तभी EPSILONके रूप में परिभाषित किया गया है DBL_EPSILON। आम तौर पर यह तुलना की आवश्यक सटीकता के आधार पर चुना गया एक विशिष्ट मूल्य होगा।
निमो 157

7
EPSILONजब फ्लोट्स बड़े होते हैं तो तुलना काम नहीं करती है, क्योंकि लगातार फ्लोट्स के बीच का अंतर भी बड़ा हो जाता है। इस लेख को देखें ।
केविंटोडिस्को

22
कोई आश्चर्य नहीं कि कुछ खेलों में जेड-फाइटिंग होती है जब बैटलफील्ड में टेक्सचर / ऑब्जेक्ट्स बहुत दूर होते हैं, जैसे 4. अंतर के साथ तुलना करना EPSILONबहुत बेकार है। आपको एक सीमा के साथ तुलना करने की आवश्यकता है जो हाथ में इकाइयों के लिए समझ में आता है। इसके अलावा, उपयोग करें std::absक्योंकि यह विभिन्न फ्लोटिंग पॉइंट प्रकारों के लिए अतिभारित है।
मैक्सिम इगोरुशिन

11
मैं उदाहरण कोड को दिखाता है क्योंकि प्रोग्रामर बहुसंख्यकों द्वारा दोहराए जाने वाले विशिष्ट बग को दोहराया जाता है। फ़्लोटिंग पॉइंट हमेशा सापेक्ष त्रुटियों के बारे में होता है, क्योंकि यह फ़्लोटिंग पॉइंट (निश्चित बिंदु नहीं) होता है। तो यह एक निश्चित त्रुटि (एप्सिलॉन) के साथ सही ढंग से काम नहीं करेगा।
user2261015

115

मैंने पाया कि Google C ++ टेस्टिंग फ्रेमवर्क में लगभग एक अच्छा क्रॉस-प्लेटफ़ॉर्म टेम्प्लेट-आधारित कार्यान्वयन है जो लगभग अलंकृत 2sComplement करता है जो डबल्स और फ्लोट दोनों पर काम करता है। यह देखते हुए कि यह बीएसडी लाइसेंस के तहत जारी किया गया है, इसे अपने कोड में उपयोग करने से कोई समस्या नहीं होनी चाहिए, जब तक आप लाइसेंस को बनाए रखते हैं। मैंने नीचे कोड http://code.google.com/p/googletest/source/browse/trunk/include/gtest/internal/gtest-internal.h https://github.com/google/googletest/blob से निकाला /master/googletest/include/gtest/internal/gtest-internal.h और लाइसेंस को ऊपर से जोड़ा।

#Define GTEST_OS_WINDOWS को कुछ मान के लिए सुनिश्चित करें (या कोड को बदलने के लिए जहां इसका उपयोग आपके कोडबेस पर फिट होने वाली चीज़ के लिए किया जाता है - यह बीएसडी लाइसेंस प्राप्त है)।

उपयोग उदाहरण:

double left  = // something
double right = // something
const FloatingPoint<double> lhs(left), rhs(right);

if (lhs.AlmostEquals(rhs)) {
  //they're equal!
}

यहाँ कोड है:

// Copyright 2005, Google Inc.
// All rights reserved.
//
// Redistribution and use in source and binary forms, with or without
// modification, are permitted provided that the following conditions are
// met:
//
//     * Redistributions of source code must retain the above copyright
// notice, this list of conditions and the following disclaimer.
//     * Redistributions in binary form must reproduce the above
// copyright notice, this list of conditions and the following disclaimer
// in the documentation and/or other materials provided with the
// distribution.
//     * Neither the name of Google Inc. nor the names of its
// contributors may be used to endorse or promote products derived from
// this software without specific prior written permission.
//
// THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
// "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
// LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
// A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
// OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
// SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
// LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
// DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
// THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
// (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
// OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
//
// Authors: wan@google.com (Zhanyong Wan), eefacm@gmail.com (Sean Mcafee)
//
// The Google C++ Testing Framework (Google Test)


// This template class serves as a compile-time function from size to
// type.  It maps a size in bytes to a primitive type with that
// size. e.g.
//
//   TypeWithSize<4>::UInt
//
// is typedef-ed to be unsigned int (unsigned integer made up of 4
// bytes).
//
// Such functionality should belong to STL, but I cannot find it
// there.
//
// Google Test uses this class in the implementation of floating-point
// comparison.
//
// For now it only handles UInt (unsigned int) as that's all Google Test
// needs.  Other types can be easily added in the future if need
// arises.
template <size_t size>
class TypeWithSize {
 public:
  // This prevents the user from using TypeWithSize<N> with incorrect
  // values of N.
  typedef void UInt;
};

// The specialization for size 4.
template <>
class TypeWithSize<4> {
 public:
  // unsigned int has size 4 in both gcc and MSVC.
  //
  // As base/basictypes.h doesn't compile on Windows, we cannot use
  // uint32, uint64, and etc here.
  typedef int Int;
  typedef unsigned int UInt;
};

// The specialization for size 8.
template <>
class TypeWithSize<8> {
 public:
#if GTEST_OS_WINDOWS
  typedef __int64 Int;
  typedef unsigned __int64 UInt;
#else
  typedef long long Int;  // NOLINT
  typedef unsigned long long UInt;  // NOLINT
#endif  // GTEST_OS_WINDOWS
};


// This template class represents an IEEE floating-point number
// (either single-precision or double-precision, depending on the
// template parameters).
//
// The purpose of this class is to do more sophisticated number
// comparison.  (Due to round-off error, etc, it's very unlikely that
// two floating-points will be equal exactly.  Hence a naive
// comparison by the == operation often doesn't work.)
//
// Format of IEEE floating-point:
//
//   The most-significant bit being the leftmost, an IEEE
//   floating-point looks like
//
//     sign_bit exponent_bits fraction_bits
//
//   Here, sign_bit is a single bit that designates the sign of the
//   number.
//
//   For float, there are 8 exponent bits and 23 fraction bits.
//
//   For double, there are 11 exponent bits and 52 fraction bits.
//
//   More details can be found at
//   http://en.wikipedia.org/wiki/IEEE_floating-point_standard.
//
// Template parameter:
//
//   RawType: the raw floating-point type (either float or double)
template <typename RawType>
class FloatingPoint {
 public:
  // Defines the unsigned integer type that has the same size as the
  // floating point number.
  typedef typename TypeWithSize<sizeof(RawType)>::UInt Bits;

  // Constants.

  // # of bits in a number.
  static const size_t kBitCount = 8*sizeof(RawType);

  // # of fraction bits in a number.
  static const size_t kFractionBitCount =
    std::numeric_limits<RawType>::digits - 1;

  // # of exponent bits in a number.
  static const size_t kExponentBitCount = kBitCount - 1 - kFractionBitCount;

  // The mask for the sign bit.
  static const Bits kSignBitMask = static_cast<Bits>(1) << (kBitCount - 1);

  // The mask for the fraction bits.
  static const Bits kFractionBitMask =
    ~static_cast<Bits>(0) >> (kExponentBitCount + 1);

  // The mask for the exponent bits.
  static const Bits kExponentBitMask = ~(kSignBitMask | kFractionBitMask);

  // How many ULP's (Units in the Last Place) we want to tolerate when
  // comparing two numbers.  The larger the value, the more error we
  // allow.  A 0 value means that two numbers must be exactly the same
  // to be considered equal.
  //
  // The maximum error of a single floating-point operation is 0.5
  // units in the last place.  On Intel CPU's, all floating-point
  // calculations are done with 80-bit precision, while double has 64
  // bits.  Therefore, 4 should be enough for ordinary use.
  //
  // See the following article for more details on ULP:
  // http://www.cygnus-software.com/papers/comparingfloats/comparingfloats.htm.
  static const size_t kMaxUlps = 4;

  // Constructs a FloatingPoint from a raw floating-point number.
  //
  // On an Intel CPU, passing a non-normalized NAN (Not a Number)
  // around may change its bits, although the new value is guaranteed
  // to be also a NAN.  Therefore, don't expect this constructor to
  // preserve the bits in x when x is a NAN.
  explicit FloatingPoint(const RawType& x) { u_.value_ = x; }

  // Static methods

  // Reinterprets a bit pattern as a floating-point number.
  //
  // This function is needed to test the AlmostEquals() method.
  static RawType ReinterpretBits(const Bits bits) {
    FloatingPoint fp(0);
    fp.u_.bits_ = bits;
    return fp.u_.value_;
  }

  // Returns the floating-point number that represent positive infinity.
  static RawType Infinity() {
    return ReinterpretBits(kExponentBitMask);
  }

  // Non-static methods

  // Returns the bits that represents this number.
  const Bits &bits() const { return u_.bits_; }

  // Returns the exponent bits of this number.
  Bits exponent_bits() const { return kExponentBitMask & u_.bits_; }

  // Returns the fraction bits of this number.
  Bits fraction_bits() const { return kFractionBitMask & u_.bits_; }

  // Returns the sign bit of this number.
  Bits sign_bit() const { return kSignBitMask & u_.bits_; }

  // Returns true iff this is NAN (not a number).
  bool is_nan() const {
    // It's a NAN if the exponent bits are all ones and the fraction
    // bits are not entirely zeros.
    return (exponent_bits() == kExponentBitMask) && (fraction_bits() != 0);
  }

  // Returns true iff this number is at most kMaxUlps ULP's away from
  // rhs.  In particular, this function:
  //
  //   - returns false if either number is (or both are) NAN.
  //   - treats really large numbers as almost equal to infinity.
  //   - thinks +0.0 and -0.0 are 0 DLP's apart.
  bool AlmostEquals(const FloatingPoint& rhs) const {
    // The IEEE standard says that any comparison operation involving
    // a NAN must return false.
    if (is_nan() || rhs.is_nan()) return false;

    return DistanceBetweenSignAndMagnitudeNumbers(u_.bits_, rhs.u_.bits_)
        <= kMaxUlps;
  }

 private:
  // The data type used to store the actual floating-point number.
  union FloatingPointUnion {
    RawType value_;  // The raw floating-point number.
    Bits bits_;      // The bits that represent the number.
  };

  // Converts an integer from the sign-and-magnitude representation to
  // the biased representation.  More precisely, let N be 2 to the
  // power of (kBitCount - 1), an integer x is represented by the
  // unsigned number x + N.
  //
  // For instance,
  //
  //   -N + 1 (the most negative number representable using
  //          sign-and-magnitude) is represented by 1;
  //   0      is represented by N; and
  //   N - 1  (the biggest number representable using
  //          sign-and-magnitude) is represented by 2N - 1.
  //
  // Read http://en.wikipedia.org/wiki/Signed_number_representations
  // for more details on signed number representations.
  static Bits SignAndMagnitudeToBiased(const Bits &sam) {
    if (kSignBitMask & sam) {
      // sam represents a negative number.
      return ~sam + 1;
    } else {
      // sam represents a positive number.
      return kSignBitMask | sam;
    }
  }

  // Given two numbers in the sign-and-magnitude representation,
  // returns the distance between them as an unsigned number.
  static Bits DistanceBetweenSignAndMagnitudeNumbers(const Bits &sam1,
                                                     const Bits &sam2) {
    const Bits biased1 = SignAndMagnitudeToBiased(sam1);
    const Bits biased2 = SignAndMagnitudeToBiased(sam2);
    return (biased1 >= biased2) ? (biased1 - biased2) : (biased2 - biased1);
  }

  FloatingPointUnion u_;
};

EDIT: यह पद 4 साल पुराना है। यह शायद अभी भी मान्य है, और कोड अच्छा है, लेकिन कुछ लोगों ने सुधार पाया। बेस्ट गो AlmostEqualsको Google टेस्ट सोर्स कोड से दाईं ओर का नवीनतम संस्करण मिलता है , न कि यहां जो मैंने पेस्ट किया है।


3
+1: मैं मानता हूं कि यह सही है। हालाँकि, यह क्यों नहीं समझाता है। यहाँ देखें: cygnus-software.com/papers/comparingfloats/comparingfloats.htm मैंने इस ब्लॉग पोस्ट को पढ़ने के बाद मैंने यहां शीर्ष स्कोर पर अपनी टिप्पणी लिखी; मेरा मानना ​​है कि यह एक ही बात कहता है और ऊपर लागू किया गया तर्कसंगत / समाधान प्रदान करता है। क्योंकि इतना कोड है, लोग जवाब देने से चूक जाएंगे।
आर्टलेस शोर

वहाँ कुछ बुरा चीजें हैं जो तब हो सकती हैं जब निहित जाति फ्लोटप्वाइंट <डबल> fp (0.03f) कह रही हो। मैंने इसे रोकने में मदद करने के लिए कुछ संशोधन किए। टेम्पलेट <टाइपनेम U> स्पष्ट फ़्लोटिंगपॉइंट (const U & x) {if (टाइपिड (U) .name ()! = टाइपिड (RawType) .name ()) {std :: cerr << "आप एक अंतर्निहित रूपांतरण कर रहे हैं। फ्लोटिंगपॉइंट, डोंट "<< std :: endl; मुखर (टाइपिड (U) .name) () == टाइपिड (रॉ टाइप) .name ()); } u_.value_ = x; }
जेफहर्टर

2
अच्छा खोजो! मुझे लगता है कि Google टेस्ट में उनका योगदान देना सबसे अच्छा होगा, हालाँकि, यह कोड कहाँ से चुराया गया था। मैं यह दर्शाने के लिए पोस्ट अपडेट करूंगा कि शायद एक नया संस्करण है। यदि Google लोग खुजली का कार्य करते हैं, तो क्या आप इसे GitHub gist में रख सकते हैं? मैं उस के साथ भी लिंक कर दूँगा।
स्क्रेबेल

3
नवीनतम कोड स्निपेट के लिए, यहां और यहां देखें ।
जेएजे

1
मैंने एक जिस्ट फाइल के लिए आवश्यक लाइनें निकाली हैं। यहां से कोई भी पहुंच सकता है
युसुफ़ तारिक गुनायदीन

111

के लिए फ्लोटिंग पॉइंट संख्याओं की तुलना करना संदर्भ पर निर्भर करता है। चूंकि संचालन के क्रम को बदलने से भी अलग-अलग परिणाम मिल सकते हैं, इसलिए यह जानना महत्वपूर्ण है कि आप "समान" कैसे संख्याओं को चाहते हैं।

ब्रूस डावसन द्वारा फ्लोटिंग पॉइंट नंबरों की तुलना फ्लोटिंग पॉइंट तुलना को देखते हुए शुरू करने के लिए एक अच्छी जगह है।

नूथ द्वारा कंप्यूटर प्रोग्रामिंग की कला से निम्नलिखित परिभाषाएं हैं :

bool approximatelyEqual(float a, float b, float epsilon)
{
    return fabs(a - b) <= ( (fabs(a) < fabs(b) ? fabs(b) : fabs(a)) * epsilon);
}

bool essentiallyEqual(float a, float b, float epsilon)
{
    return fabs(a - b) <= ( (fabs(a) > fabs(b) ? fabs(b) : fabs(a)) * epsilon);
}

bool definitelyGreaterThan(float a, float b, float epsilon)
{
    return (a - b) > ( (fabs(a) < fabs(b) ? fabs(b) : fabs(a)) * epsilon);
}

bool definitelyLessThan(float a, float b, float epsilon)
{
    return (b - a) > ( (fabs(a) < fabs(b) ? fabs(b) : fabs(a)) * epsilon);
}

बेशक, एप्सिलॉन का चयन करना संदर्भ पर निर्भर करता है, और यह निर्धारित करता है कि आप संख्याओं के बराबर होना चाहते हैं।

फ्लोटिंग पॉइंट नंबरों की तुलना करने का एक और तरीका है, संख्याओं के ULP (अंतिम स्थान पर इकाइयाँ) को देखना। तुलना के साथ विशेष रूप से व्यवहार नहीं करते हुए, प्रत्येक कंप्यूटर वैज्ञानिक को फ्लोटिंग पॉइंट नंबरों के बारे में क्या पता होना चाहिए, यह समझने के लिए एक अच्छा संसाधन है कि फ्लोटिंग पॉइंट कैसे काम करता है और क्या नुकसान हैं, जिसमें ULP भी शामिल है।


1
पोस्टिंग के लिए धन्यवाद कि कैसे निर्धारित किया जाए कि कौन सी संख्या छोटी / बड़ी है!
टमाटर

1
fabs(a - b) <= ( (fabs(a) < fabs(b) ? fabs(b) : fabs(a)) * epsilon);मेरा जीना बचा लिया। LOL ध्यान दें कि इस संस्करण (मैंने दूसरों के लिए भी लागू किया गया है अगर जाँच नहीं की है) भी परिवर्तन है कि अस्थायी बिंदु संख्या के अभिन्न अंग में हो सकता है पर विचार करता है (उदाहरण: 2147352577.9999997616 == 2147352576.0000000000जहाँ आप स्पष्ट रूप से देख सकते हैं कि लगभग एक अंतर है 2दो नंबरों के बीच) जो काफी अच्छा है! यह तब होता है जब संचित गोलाई त्रुटि संख्या के दशमलव भाग को ओवरफ्लो करती है।
rbaleksandar

ब्रूस डॉसन द्वारा बहुत अच्छा और उपयोगी लेख, धन्यवाद!
बॉबमोरेन

2
यह देखते हुए कि इस प्रश्न को C ++ टैग किया गया है, आपके चेक को std::max(std::abs(a), std::abs(b))(या साथ std::min()) लिखा जाना आसान होगा ; std::absसी ++ में फ्लोट और डबल प्रकार के साथ अतिभारित है, इसलिए यह ठीक काम करता है (आप हमेशा fabsपठनीयता के लिए रख सकते हैं )।
रजाखेल

1
समस्या यह बताती है कि मेरे कोड में मूल अपेक्षित मूल्य और पार्स स्ट्रिंग के बीच अंतर था।
mwpowellhtx

47

अधिक गहराई तक पहुंच के लिए फ्लोटिंग पॉइंट संख्याओं की तुलना करें । यहाँ उस लिंक से कोड स्निपेट दिया गया है:

// Usable AlmostEqual function    
bool AlmostEqual2sComplement(float A, float B, int maxUlps)    
{    
    // Make sure maxUlps is non-negative and small enough that the    
    // default NAN won't compare as equal to anything.    
    assert(maxUlps > 0 && maxUlps < 4 * 1024 * 1024);    
    int aInt = *(int*)&A;    
    // Make aInt lexicographically ordered as a twos-complement int    
    if (aInt < 0)    
        aInt = 0x80000000 - aInt;    
    // Make bInt lexicographically ordered as a twos-complement int    
    int bInt = *(int*)&B;    
    if (bInt < 0)    
        bInt = 0x80000000 - bInt;    
    int intDiff = abs(aInt - bInt);    
    if (intDiff <= maxUlps)    
        return true;    
    return false;    
}

14
अधिकतम मूल्य का सुझाया गया मूल्य क्या है?
unj2

6
क्या *(int*)&A;सख्त अलियासिंग नियम का उल्लंघन होगा ?
osgx

3
के अनुसार gtest (ULP के लिए खोज), 4 एक स्वीकार्य संख्या है।
मई जेक

4
और यहाँ ब्रूस डावसन कागज (जिनमें से एक कागज का परिचय में जुड़ा हुआ है) के लिए एक जोड़े को अपडेट कर रहे हैं: randomascii.wordpress.com/2012/02/25/... और randomascii.wordpress.com/2012/06/26/...
माइकल बूर

3
मुझे यह पता लगाने में थोड़ी देर
लगी

27

यह महसूस करना एक पुराना धागा है लेकिन यह लेख उन सबसे सीधे फॉरवर्ड में से एक है जो मैंने फ़्लोटिंग पॉइंट नंबरों की तुलना करने पर पाया है और यदि आप अधिक अन्वेषण करना चाहते हैं तो इसके साथ ही अधिक विस्तृत संदर्भ भी हैं और यह मुख्य साइट मुद्दों की एक पूरी श्रृंखला को कवर करती है। फ्लोटिंग पॉइंट नंबरों के साथ काम करना फ्लोटिंग-पॉइंट गाइड: तुलना

हम फ्लोटिंग-पॉइंट टॉलरेंस में कुछ हद तक व्यावहारिक लेख पा सकते हैं , जिसमें पुनरावृत्ति और नोटों में पूर्ण सहिष्णुता परीक्षण है, जो C ++ में इसके लिए उबलता है:

bool absoluteToleranceCompare(double x, double y)
{
    return std::fabs(x - y) <= std::numeric_limits<double>::epsilon() ;
}

और रिश्तेदार सहिष्णुता परीक्षण:

bool relativeToleranceCompare(double x, double y)
{
    double maxXY = std::max( std::fabs(x) , std::fabs(y) ) ;
    return std::fabs(x - y) <= std::numeric_limits<double>::epsilon()*maxXY ;
}

लेख नोटों पूर्ण परीक्षण में विफल रहता है जब कि xऔर yबड़े हैं और रिश्तेदार मामले में विफल रहता है, जब वे छोटे हैं। यह मानते हुए कि वह पूर्ण और सापेक्ष सहिष्णुता है एक ही संयुक्त परीक्षण इस तरह दिखेगा:

bool combinedToleranceCompare(double x, double y)
{
    double maxXYOne = std::max( { 1.0, std::fabs(x) , std::fabs(y) } ) ;

    return std::fabs(x - y) <= std::numeric_limits<double>::epsilon()*maxXYOne ;
}

25

C ++ में एप्सिलॉन प्राप्त करने का पोर्टेबल तरीका है

#include <limits>
std::numeric_limits<double>::epsilon()

तब तुलनात्मक कार्य बन जाता है

#include <cmath>
#include <limits>

bool AreSame(double a, double b) {
    return std::fabs(a - b) < std::numeric_limits<double>::epsilon();
}

34
आप सबसे अधिक संभावना है कि एप्सिलॉन के कई चाहते हैं।
user7116

11
क्या आप सिर्फ std :: abs का उपयोग नहीं कर सकते? AFAIK, std :: abs भी डबल्स के लिए अतिभारित है। कृपया मुझे चेतावनी दें यदि मैं गलत हूं।
कोलीस्टिव्रा

3
@kolistivra, आप गलत हैं। 'Fabs' में 'f' का मतलब फ्लोट टाइप नहीं है। आप शायद C फ़ंक्शंस fabsf () और fabsl () के बारे में सोच रहे हैं।
जेकोफैंड

9
दरअसल ब्रूस के लेख में उल्लिखित कारणों के लिए एप्सिलॉन जैसे कि फ्लोटिंग पॉइंट वैल्यू बड़ा हो जाता है। वह हिस्सा देखें जहां वह कहता है "2.0 से अधिक संख्या के लिए फ़्लोट्स के बीच का अंतर बड़ा हो जाता है और यदि आप फ़्लोट_ईप्सिलॉन का उपयोग करके फ़्लोट्स की तुलना करते हैं तो आप अधिक महंगी और कम-स्पष्ट समानता की जाँच कर रहे हैं।"
बोबोबो

5
मुझे पता है कि यह पुराना है लेकिन std :: abs को cmath में फ्लोटिंग पॉइंट प्रकारों के लिए अतिभारित किया जाता है।
मोलज़मन

18

मैंने इस महान धागे में सामग्री के माध्यम से जाने में काफी समय बिताया। मुझे संदेह है कि हर कोई इतना समय बिताना चाहता है, इसलिए मैंने जो कुछ सीखा, उसके सारांश और मेरे द्वारा लागू किए गए समाधान पर प्रकाश डाला जाएगा।

त्वरित सारांश

  1. 1e-8 लगभग 1e-16 के समान है? यदि आप शोर सेंसर डेटा को देख रहे हैं तो शायद हां लेकिन अगर आप आणविक सिमुलेशन कर रहे हैं तो हो सकता है कि नहीं! नीचे पंक्ति: आपको हमेशा विशिष्ट फ़ंक्शन कॉल के संदर्भ में सहिष्णुता मूल्य के बारे में सोचना होगा और न केवल इसे सामान्य ऐप-वाइड हार्ड-कोडिंग स्थिर बनाना होगा।
  2. सामान्य पुस्तकालय कार्यों के लिए, डिफ़ॉल्ट सहिष्णुता के साथ पैरामीटर होना अभी भी अच्छा है । एक विशिष्ट पसंद हैnumeric_limits::epsilon() जो फ्लोट में FLT_EPSILON के समान है। यह हालांकि समस्याग्रस्त है क्योंकि 1.0 जैसे मूल्यों की तुलना करने के लिए एप्सिलॉन 1E9 जैसे मूल्यों के लिए एप्सिलॉन के समान नहीं है। FLT_EPSILON 1.0 के लिए परिभाषित किया गया है।
  3. संख्या के भीतर सहिष्णुता है fabs(a-b) <= epsilonया नहीं यह जांचने के लिए स्पष्ट कार्यान्वयन हालांकि यह काम नहीं करता है क्योंकि डिफ़ॉल्ट एप्सिलॉन 1.0 के लिए परिभाषित किया गया है। हमें ए और बी के संदर्भ में एप्सिलॉन को ऊपर या नीचे स्केल करना होगा।
  4. इस समस्या के दो समाधान हैं: या तो आप एप्सिलॉन को आनुपातिक रूप से सेट करते हैं max(a,b)या आप एक के आसपास अगले प्रतिनिधित्व करने योग्य संख्या प्राप्त कर सकते हैं और फिर देख सकते हैं कि बी उस सीमा में आता है या नहीं। पूर्व को "सापेक्ष" विधि कहा जाता है और बाद में ULP विधि कहा जाता है।
  5. 0. के साथ तुलना करने पर दोनों तरीके वास्तव में वैसे भी विफल हो जाते हैं। इस मामले में, आवेदन को सही सहिष्णुता की आपूर्ति करनी चाहिए।

उपयोगिता कार्य कार्यान्वयन (C ++ 11)

//implements relative method - do not use for comparing with zero
//use this most of the time, tolerance needs to be meaningful in your context
template<typename TReal>
static bool isApproximatelyEqual(TReal a, TReal b, TReal tolerance = std::numeric_limits<TReal>::epsilon())
{
    TReal diff = std::fabs(a - b);
    if (diff <= tolerance)
        return true;

    if (diff < std::fmax(std::fabs(a), std::fabs(b)) * tolerance)
        return true;

    return false;
}

//supply tolerance that is meaningful in your context
//for example, default tolerance may not work if you are comparing double with float
template<typename TReal>
static bool isApproximatelyZero(TReal a, TReal tolerance = std::numeric_limits<TReal>::epsilon())
{
    if (std::fabs(a) <= tolerance)
        return true;
    return false;
}


//use this when you want to be on safe side
//for example, don't start rover unless signal is above 1
template<typename TReal>
static bool isDefinitelyLessThan(TReal a, TReal b, TReal tolerance = std::numeric_limits<TReal>::epsilon())
{
    TReal diff = a - b;
    if (diff < tolerance)
        return true;

    if (diff < std::fmax(std::fabs(a), std::fabs(b)) * tolerance)
        return true;

    return false;
}
template<typename TReal>
static bool isDefinitelyGreaterThan(TReal a, TReal b, TReal tolerance = std::numeric_limits<TReal>::epsilon())
{
    TReal diff = a - b;
    if (diff > tolerance)
        return true;

    if (diff > std::fmax(std::fabs(a), std::fabs(b)) * tolerance)
        return true;

    return false;
}

//implements ULP method
//use this when you are only concerned about floating point precision issue
//for example, if you want to see if a is 1.0 by checking if its within
//10 closest representable floating point numbers around 1.0.
template<typename TReal>
static bool isWithinPrecisionInterval(TReal a, TReal b, unsigned int interval_size = 1)
{
    TReal min_a = a - (a - std::nextafter(a, std::numeric_limits<TReal>::lowest())) * interval_size;
    TReal max_a = a + (std::nextafter(a, std::numeric_limits<TReal>::max()) - a) * interval_size;

    return min_a <= b && max_a >= b;
}

isDefinitelyLessThanचेक diff < tolerance, जिसका अर्थ है कि ए और बी लगभग बराबर हैं (और इसलिए ए निश्चित रूप से बी से कम नहीं है)। क्या दोनों मामलों में अंतर> सहिष्णुता की जांच करना अधिक समझदारी नहीं है? या शायद एक orEqualToतर्क जोड़ते हैं जो नियंत्रित करता है कि अनुमानित समानता की जांच सही लौटना चाहिए या नहीं।
मैट चेम्बर्स 21

14

आपके द्वारा लिखा गया कोड बगयुक्त है:

return (diff < EPSILON) && (-diff > EPSILON);

सही कोड होगा:

return (diff < EPSILON) && (diff > -EPSILON);

(... और हां यह अलग है)

मुझे आश्चर्य है कि अगर fabs आप किसी मामले में आलसी मूल्यांकन खोना नहीं होगा। मैं कहूंगा कि यह कंपाइलर पर निर्भर करता है। तुम दोनों की कोशिश करना चाहते हो सकता है। यदि वे औसत के बराबर हैं, तो फैब्स के साथ कार्यान्वयन करें।

यदि आपके पास कुछ जानकारी है कि दोनों में से किस पर फ्लोट होने की संभावना है, तो अन्य की तुलना में बड़ा होने पर, आप आलसी मूल्यांकन का बेहतर लाभ उठाने के लिए तुलना के क्रम पर खेल सकते हैं।

अंत में आप इस फ़ंक्शन को सम्मिलित करके बेहतर परिणाम प्राप्त कर सकते हैं। हालांकि ज्यादा सुधार की संभावना नहीं है ...

संपादित करें: OJ, आपके कोड को सही करने के लिए धन्यवाद। मैंने अपनी टिप्पणी उसी के अनुसार मिटा दी


13

`रिटर्न फ़ैब्स (ए - बी) <EPSILON;

यह ठीक है अगर:

  • आपके इनपुट के परिमाण का क्रम बहुत अधिक नहीं बदलता है
  • विपरीत संकेतों की बहुत कम संख्या को समान माना जा सकता है

लेकिन अन्यथा यह आपको परेशानी में डाल देगा। डबल सटीक संख्याओं में लगभग 16 दशमलव स्थानों का एक रिज़ॉल्यूशन होता है। यदि आप जिस दो संख्याओं की तुलना कर रहे हैं, वह EPSILON * 1.0E16 की तुलना में परिमाण में बड़ी है, तो आप कह सकते हैं:

return a==b;

मैं एक अलग दृष्टिकोण की जांच करूँगा जो मानता है कि आपको पहले मुद्दे के बारे में चिंता करने की ज़रूरत है और दूसरा यह मान लें कि आपका आवेदन ठीक है। एक समाधान कुछ इस तरह होगा:

#define VERYSMALL  (1.0E-150)
#define EPSILON    (1.0E-8)
bool AreSame(double a, double b)
{
    double absDiff = fabs(a - b);
    if (absDiff < VERYSMALL)
    {
        return true;
    }

    double maxAbs  = max(fabs(a) - fabs(b));
    return (absDiff/maxAbs) < EPSILON;
}

यह कम्प्यूटेशनल रूप से महंगा है, लेकिन कभी-कभी इसे कहा जाता है। यह वही है जो हमें अपनी कंपनी में करना है क्योंकि हम एक इंजीनियरिंग लाइब्रेरी के साथ काम करते हैं और इनपुट परिमाण के कुछ दर्जन आदेशों से भिन्न हो सकते हैं।

वैसे भी, बिंदु यह है (और व्यावहारिक रूप से हर प्रोग्रामिंग समस्या पर लागू होता है): मूल्यांकन करें कि आपकी आवश्यकताएं क्या हैं, फिर अपनी आवश्यकताओं को संबोधित करने के लिए एक समाधान के साथ आएं - मान लें कि आसान उत्तर आपकी आवश्यकताओं को पूरा नहीं करेगा। यदि आपके मूल्यांकन के बाद आपको लगता है कि fabs(a-b) < EPSILONपर्याप्त होगा, सही - इसका उपयोग करें! लेकिन इसकी कमियों और अन्य संभावित समाधानों से भी अवगत रहें।


3
Fmax ()) में टाइपोस (s / - /, / अनुपस्थित अल्पविराम) के अलावा, इस कार्यान्वयन में शून्य के पास संख्याओं के लिए एक बग है जो कि EPSILON के भीतर है, लेकिन अभी तक बहुत VERYSMALL नहीं है। उदाहरण के लिए, AreSame (1.0E-10, 1.0E-9) झूठी रिपोर्ट करता है क्योंकि सापेक्ष त्रुटि बहुत बड़ी है। आप अपनी कंपनी में हीरो बन जाते हैं।
ब्रैकडॉक

1
@brlcad आपको फ़्लोटिंग पॉइंट की बात नहीं मिली । 1.0E-10 और 1.0E-9 10. के परिमाण से भिन्न होते हैं। इसलिए यह सच है कि वे समान नहीं हैं। फ़्लोटिंग पॉइंट हमेशा सापेक्ष त्रुटियों के बारे में होता है । यदि आपके पास एक प्रणाली है जो 1.0E-10 और 1.0E-9 को लगभग समान मानता है, क्योंकि दोनों "शून्य के बहुत करीब हैं" (जो मनुष्यों के लिए उचित लगता है लेकिन गणितीय रूप से कुछ भी नहीं है), तो उस EPSILON को उपयुक्त के रूप में समायोजित करने की आवश्यकता है ऐसी व्यवस्था के लिए।
user2261015

8

जैसा कि दूसरों ने बताया है, एक निश्चित-प्रतिपादक एप्सिलॉन (जैसे 0.0000001) का उपयोग करना एप्सिलॉन मान से दूर मूल्यों के लिए बेकार होगा । उदाहरण के लिए, यदि आपके दो मूल्य 10000.000977 और 10000 हैं, तो NO हैं इन दोनों संख्याओं के बीच 32-बिट फ़्लोटिंग-पॉइंट मान हैं - 10000 और 10000.000977 उतने ही नज़दीक हैं जितने कि आप संभवतः बिट-फॉर-बिट समान होने के बिना प्राप्त कर सकते हैं। यहां, 0.0009 से कम का एप्सिलॉन अर्थहीन है; आप सीधे समानता ऑपरेटर का उपयोग कर सकते हैं।

इसी तरह, जैसे ही दोनों मान आकार में एप्सिलॉन के पास आते हैं, सापेक्ष त्रुटि 100% तक बढ़ जाती है।

इस प्रकार, फ्लोटिंग-पॉइंट वैल्यू (जहां एक्सपोज़र मनमाना है) के साथ एक निश्चित बिंदु संख्या जैसे 0.00001 को मिलाने की कोशिश करना एक व्यर्थ अभ्यास है। यह केवल तभी काम करेगा जब आपको यह आश्वासन दिया जा सके कि ऑपरेंड मान एक संकीर्ण डोमेन (जो कुछ विशिष्ट घातांक के करीब है) के भीतर है, और यदि आप ठीक से उस विशिष्ट परीक्षा के लिए एप्सिलॉन मान का चयन करते हैं। यदि आप एक संख्या को हवा से बाहर निकालते हैं ("अरे! 0.00001 छोटा है, तो यह अच्छा होना चाहिए!"), आप संख्यात्मक त्रुटियों के लिए बर्बाद हैं। मैंने बहुत समय खराब संख्यात्मक कोड डिबग करने में बिताया है, जहां कुछ खराब schmuck यादृच्छिक एप्सिलॉन मूल्यों में अभी तक एक और परीक्षण केस काम करने के लिए टॉस करता है।

यदि आप किसी भी प्रकार की संख्यात्मक प्रोग्रामिंग करते हैं और मानते हैं कि आपको निश्चित-बिंदु एप्सिलों तक पहुंचने की आवश्यकता है, तो फ़्लोरिंग-प्वाइंट नंबरों की गणना पर संक्षिप्त विवरण पढ़ें।

फ्लोटिंग पॉइंट नंबरों की तुलना


5

Qt दो कार्यों को लागू करता है, शायद आप उनसे सीख सकते हैं:

static inline bool qFuzzyCompare(double p1, double p2)
{
    return (qAbs(p1 - p2) <= 0.000000000001 * qMin(qAbs(p1), qAbs(p2)));
}

static inline bool qFuzzyCompare(float p1, float p2)
{
    return (qAbs(p1 - p2) <= 0.00001f * qMin(qAbs(p1), qAbs(p2)));
}

और आपको निम्न कार्यों की आवश्यकता हो सकती है, क्योंकि

ध्यान दें कि जहाँ p1 या P2 में मानों की तुलना करना 0.0 है, वह काम नहीं करेगा और न ही उन मूल्यों की तुलना करता है जहाँ कोई मान NaN या अनंत है। यदि मानों में से एक हमेशा 0.0 है, तो इसके बजाय qFuzzyIsNull का उपयोग करें। यदि मूल्यों में से एक 0.0 होने की संभावना है, तो एक समाधान दोनों मानों में 1.0 जोड़ना है।

static inline bool qFuzzyIsNull(double d)
{
    return qAbs(d) <= 0.000000000001;
}

static inline bool qFuzzyIsNull(float f)
{
    return qAbs(f) <= 0.00001f;
}

3

फ्लोटिंग-पॉइंट नंबरों की सामान्य-प्रयोजन तुलना आम तौर पर अर्थहीन है। तुलना करना वास्तव में हाथ पर एक समस्या पर निर्भर करता है। कई समस्याओं में, किसी दिए गए सहिष्णुता के भीतर उनकी तुलना करने की अनुमति देने के लिए संख्याओं को पर्याप्त रूप से विवेकाधीन किया जाता है। दुर्भाग्य से, वहाँ बस के रूप में कई समस्याएं हैं, जहां ऐसी चाल वास्तव में काम नहीं करती है। एक उदाहरण के लिए, सवाल में एक नंबर के हीविसाइड (चरण) फ़ंक्शन के साथ काम करने पर विचार करें (डिजिटल स्टॉक विकल्प दिमाग में आते हैं) जब आपकी टिप्पणियां बाधा के बहुत करीब होती हैं। सहिष्णुता-आधारित तुलना का प्रदर्शन बहुत अच्छा नहीं होगा, क्योंकि यह प्रभावी रूप से मूल बाधा से दो नए लोगों को समस्या को स्थानांतरित कर देगा। फिर, ऐसी समस्याओं के लिए कोई सामान्य उद्देश्य समाधान नहीं है और स्थिरता प्राप्त करने के लिए संख्यात्मक समाधान को बदलने के लिए विशेष समाधान की आवश्यकता हो सकती है।


3

दुर्भाग्य से, यहां तक ​​कि आपका "बेकार" कोड भी गलत है। EPSILON सबसे छोटा मूल्य है जिसे 1.0 में जोड़ा जा सकता है और इसका मूल्य बदल सकता है । मान 1.0 बहुत महत्वपूर्ण है - बड़ी संख्या तब परिवर्तित नहीं होती है जब EPSILON में जोड़ा जाता है। अब, आप इस मूल्य को उन संख्याओं में माप सकते हैं, जिनकी आप यह बताने के लिए तुलना कर रहे हैं कि वे अलग हैं या नहीं। दो युगल की तुलना के लिए सही अभिव्यक्ति है:

if (fabs(a - b) <= DBL_EPSILON * fmax(fabs(a), fabs(b)))
{
    // ...
}

यह न्यूनतम पर है। सामान्य तौर पर, हालांकि, आप अपनी गणना में शोर को ध्यान में रखना चाहेंगे और कम से कम महत्वपूर्ण बिट्स को अनदेखा करेंगे, इसलिए अधिक यथार्थवादी तुलना इस तरह दिखाई देगी:

if (fabs(a - b) <= 16 * DBL_EPSILON * fmax(fabs(a), fabs(b)))
{
    // ...
}

यदि तुलनात्मक प्रदर्शन आपके लिए बहुत महत्वपूर्ण है और आप अपने मूल्यों की सीमा जानते हैं, तो आपको इसके बजाय निश्चित बिंदु संख्याओं का उपयोग करना चाहिए।


2
"EPSILON सबसे छोटा मूल्य है जिसे 1.0 में जोड़ा जा सकता है और इसके मूल्य को बदल सकता है": वास्तव में, यह सम्मान 0.5 * EPSILON के उत्तराधिकारी को जाता है (डिफ़ॉल्ट दौर से निकटतम मोड में)। blog.frama-c.com/index.php?post/2013/05/09/FLT_EPSILON
पास्कल कूक

आपको ऐसा क्यों लगता है कि EPSILONप्रश्न में DBL_EPSILONया है FLT_EPSILON? समस्या आपकी अपनी कल्पना में है, जहां आपने DBL_EPSILONकोड का उपयोग किया है (जो वास्तव में गलत विकल्प होगा) कोड में इसका उपयोग नहीं किया था।
बेन Voigt

@BenVoigt, आप सही कह रहे हैं, यह उस समय मेरे दिमाग में कुछ था, और मैंने उस प्रकाश में प्रश्न की व्याख्या की।
डॉन रेबा

2

पहले से पोस्ट किए गए उत्तरों के आधार पर मेरी कक्षा। Google के कोड के समान ही लेकिन मैं एक पूर्वाग्रह का उपयोग करता हूं जो सभी NaN मानों को 0xFF000000 से ऊपर धकेलता है। यह NaN के लिए तेज़ जाँच की अनुमति देता है।

यह कोड अवधारणा को प्रदर्शित करने के लिए है, सामान्य समाधान नहीं है। Google का कोड पहले से ही दिखाता है कि सभी प्लेटफ़ॉर्म विशिष्ट मानों की गणना कैसे करें और मैं वह सब डुप्लिकेट नहीं करना चाहता था। मैंने इस कोड पर सीमित परीक्षण किया है।

typedef unsigned int   U32;
//  Float           Memory          Bias (unsigned)
//  -----           ------          ---------------
//   NaN            0xFFFFFFFF      0xFF800001
//   NaN            0xFF800001      0xFFFFFFFF
//  -Infinity       0xFF800000      0x00000000 ---
//  -3.40282e+038   0xFF7FFFFF      0x00000001    |
//  -1.40130e-045   0x80000001      0x7F7FFFFF    |
//  -0.0            0x80000000      0x7F800000    |--- Valid <= 0xFF000000.
//   0.0            0x00000000      0x7F800000    |    NaN > 0xFF000000
//   1.40130e-045   0x00000001      0x7F800001    |
//   3.40282e+038   0x7F7FFFFF      0xFEFFFFFF    |
//   Infinity       0x7F800000      0xFF000000 ---
//   NaN            0x7F800001      0xFF000001
//   NaN            0x7FFFFFFF      0xFF7FFFFF
//
//   Either value of NaN returns false.
//   -Infinity and +Infinity are not "close".
//   -0 and +0 are equal.
//
class CompareFloat{
public:
    union{
        float     m_f32;
        U32       m_u32;
    };
    static bool   CompareFloat::IsClose( float A, float B, U32 unitsDelta = 4 )
                  {
                      U32    a = CompareFloat::GetBiased( A );
                      U32    b = CompareFloat::GetBiased( B );

                      if ( (a > 0xFF000000) || (b > 0xFF000000) )
                      {
                          return( false );
                      }
                      return( (static_cast<U32>(abs( a - b ))) < unitsDelta );
                  }
    protected:
    static U32    CompareFloat::GetBiased( float f )
                  {
                      U32    r = ((CompareFloat*)&f)->m_u32;

                      if ( r & 0x80000000 )
                      {
                          return( ~r - 0x007FFFFF );
                      }
                      return( r + 0x7F800000 );
                  }
};

2

यहाँ सबूत है कि उपयोग std::numeric_limits::epsilon()करना उत्तर नहीं है - यह एक से अधिक मूल्यों के लिए विफल रहता है:

ऊपर मेरी टिप्पणी का सबूत:

#include <stdio.h>
#include <limits>

double ItoD (__int64 x) {
    // Return double from 64-bit hexadecimal representation.
    return *(reinterpret_cast<double*>(&x));
}

void test (__int64 ai, __int64 bi) {
    double a = ItoD(ai), b = ItoD(bi);
    bool close = std::fabs(a-b) < std::numeric_limits<double>::epsilon();
    printf ("%.16f and %.16f %s close.\n", a, b, close ? "are " : "are not");
}

int main()
{
    test (0x3fe0000000000000L,
          0x3fe0000000000001L);

    test (0x3ff0000000000000L,
          0x3ff0000000000001L);
}

इस उत्पादन को चलाने से उत्पादन:

0.5000000000000000 and 0.5000000000000001 are  close.
1.0000000000000000 and 1.0000000000000002 are not close.

ध्यान दें कि दूसरे मामले में (एक और केवल एक से बड़ा), दो इनपुट मान जितने करीब हो सकते हैं, और फिर भी तुलना न करें। इस प्रकार, 1.0 से अधिक मूल्यों के लिए, आप एक समानता परीक्षण का उपयोग कर सकते हैं। फ़्लोट-पॉइंट मानों की तुलना करते समय निश्चित एप्सिलॉन आपको नहीं बचाएगा।


मेरा मानना ​​है कि return *(reinterpret_cast<double*>(&x));हालांकि यह आमतौर पर काम करता है, वास्तव में अपरिभाषित व्यवहार है।
जाप वर्स्टीघ

फेयर पॉइंट, हालांकि यह कोड निराशाजनक है, इसलिए numeric_limits<>::epsilonIEEE 754 फ़्लोरिंग पॉइंट के लिए समस्या प्रदर्शित करने के लिए पर्याप्त है ।
स्टीव होलास्च

इसके अलावा एक निष्पक्ष बिंदु, लेकिन यह स्टैच ओवरफ्लो पर पोस्ट करने के लिए बुद्धिमान imho नहीं है कि इस तरह की अंतर्दृष्टि की उम्मीद है। कोड को नेत्रहीन रूप से कॉपी किया जाएगा जिससे यह कभी-कभी सामान्य पैटर्न को मिटाने के लिए कठिन हो जाएगा - पूरी तरह से संघ की चाल के साथ - जिसे केवल सभी यूडी से बचा जाना चाहिए।
जाप वेरस्टीघ

1

एक और दिलचस्प कार्यान्वयन मिला: https://en.cppreference.com/w/cpp/types/numeric_limits/epsilon

#include <cmath>
#include <limits>
#include <iomanip>
#include <iostream>
#include <type_traits>
#include <algorithm>



template<class T>
typename std::enable_if<!std::numeric_limits<T>::is_integer, bool>::type
    almost_equal(T x, T y, int ulp)
{
    // the machine epsilon has to be scaled to the magnitude of the values used
    // and multiplied by the desired precision in ULPs (units in the last place)
    return std::fabs(x-y) <= std::numeric_limits<T>::epsilon() * std::fabs(x+y) * ulp
        // unless the result is subnormal
        || std::fabs(x-y) < std::numeric_limits<T>::min();
}

int main()
{
    double d1 = 0.2;
    double d2 = 1 / std::sqrt(5) / std::sqrt(5);
    std::cout << std::fixed << std::setprecision(20) 
        << "d1=" << d1 << "\nd2=" << d2 << '\n';

    if(d1 == d2)
        std::cout << "d1 == d2\n";
    else
        std::cout << "d1 != d2\n";

    if(almost_equal(d1, d2, 2))
        std::cout << "d1 almost equals d2\n";
    else
        std::cout << "d1 does not almost equal d2\n";
}

0

मैं इनमें से किसी भी उत्तर से बहुत सावधान रहूंगा जिसमें फ़्लोटिंग पॉइंट सबट्रैक्शन (उदाहरण के लिए, फ़ैब्स (अब) <एप्सिलॉन) शामिल है। सबसे पहले, फ़्लोटिंग पॉइंट संख्या अधिक परिमाण में अधिक विरल हो जाती है और उच्च पर्याप्त परिमाण पर जहाँ स्पेस एप्सिलॉन से अधिक होता है, आप शायद केवल एक == बी कर रहे होंगे। दूसरा, दो बहुत करीबी फ़्लोटिंग पॉइंट नंबरों को घटाते हुए (जैसा कि ये हो जाएगा, यह देखते हुए कि आप समानता के लिए देख रहे हैं) ठीक उसी तरह है जैसे आपको भयावह निरस्तीकरण मिलता है

पोर्टेबल न होते हुए, मुझे लगता है कि इन मुद्दों से बचने के लिए ग्रोम का जवाब सबसे अच्छा काम करता है।


1
अच्छी जानकारी के लिए +1। हालाँकि, मैं यह देखने में विफल हूं कि आप सापेक्ष त्रुटि को बढ़ाकर समानता की तुलना कैसे कर सकते हैं; IMHO त्रुटि केवल घटाव के परिणाम में महत्वपूर्ण हो जाती है, हालांकि यह दो ऑपरेंड के सापेक्ष परिमाण का क्रम है, जिसे घटाया जाना अभी भी समानता का न्याय करने के लिए पर्याप्त विश्वसनीय होना चाहिए। जब तक कि रिज़ॉल्यूशन को समग्र रूप से अधिक होना चाहिए, लेकिन उस मामले में एकमात्र समाधान मंटिसा में अधिक महत्वपूर्ण बिट्स के साथ एक फ्लोटिंग पॉइंट प्रतिनिधित्व में स्थानांतरित करना है।
sehe

लगभग दो-समान संख्याओं को घटाना विनाशकारी निरस्तीकरण का कारण नहीं बनता है - वास्तव में, यह किसी भी त्रुटि (qv Sterbenz के प्रमेय) को प्रस्तुत नहीं करता है। पहले aऔर bस्वयं की गणना के दौरान भयावह निरस्तीकरण होता है । फ़ज़ी तुलना के हिस्से के रूप में फ्लोटिंग पॉइंट घटाव का उपयोग करने में कोई समस्या नहीं है (जैसा कि अन्य लोगों ने कहा है, किसी दिए गए उपयोग के मामले के लिए एक पूर्ण एप्सिलॉन मान उपयुक्त हो सकता है या नहीं भी हो सकता है।)
स्नेफ़ेल

0

संख्यात्मक सॉफ्टवेयर में वास्तव में ऐसे मामले हैं जहां आप जांचना चाहते हैं कि क्या दो फ्लोटिंग पॉइंट नंबर बिल्कुल बराबर हैं। मैंने इसे इसी तरह के सवाल पर पोस्ट किया है

https://stackoverflow.com/a/10973098/1447411

इसलिए आप यह नहीं कह सकते कि "तुलनात्मक रूप से" 1 सामान्य रूप से गलत है।


वास्तव में एक अच्छे जवाब के लिए एक बहुत ही ठोस संदर्भ, हालांकि पूर्णता को न समझने के लिए वैज्ञानिक कंप्यूटिंग या संख्यात्मक विश्लेषण पृष्ठभूमि (Ie LAPACK, BLAS) के बिना किसी को सीमित करने के लिए बहुत विशिष्ट है। या दूसरे शब्दों में, यह मानता है कि आपने बर्डन एंड फेयर द्वारा न्यूमेरिकल रेसिपी का परिचय या न्यूमेरिकल एनालिसिस जैसा कुछ पढ़ा है ।
mctylr

0

यह इस बात पर निर्भर करता है कि आप कितना सटीक होना चाहते हैं। यदि आप समान संख्या के लिए तुलना करना चाहते हैं, तो बस == के साथ जाएं। (आप लगभग ऐसा कभी नहीं करना चाहते हैं जब तक कि आप वास्तव में एक ही नंबर नहीं चाहते हैं।) किसी भी सभ्य मंच पर आप निम्न कार्य भी कर सकते हैं:

diff= a - b; return fabs(diff)<EPSILON;

के रूप में fabsबहुत तेजी से हो जाता है। बहुत तेजी से मेरा मतलब है कि यह मूल रूप से एक बिटवाइज़ है और इसलिए यह बेहतर है कि यह तेज़ हो।

और डबल्स और फ्लोट्स की तुलना करने के लिए पूर्णांक तरकीबें अच्छी हैं लेकिन विभिन्न सीपीयू पाइपलाइनों को प्रभावी ढंग से संभालने के लिए इसे और अधिक कठिन बनाते हैं। और यह निश्चित रूप से इन-ऑर्डर आर्किटेक्चर पर इन दिनों तेजी से नहीं है, जो कि अक्सर उपयोग किए जा रहे मानों के लिए अस्थायी भंडारण क्षेत्र के रूप में स्टैक का उपयोग करने के कारण होता है। (देखभाल करने वालों के लिए लोड-हिट-स्टोर।)


0

मात्राओं के पैमाने के संदर्भ में:

यदि epsilonकुछ भौतिक अर्थों में मात्राओं के परिमाण (अर्थात सापेक्ष मूल्य) के कुछ अंश Aऔर Bप्रकार एक ही अर्थ में तुलनीय हैं, तो मुझे लगता है, कि निम्नलिखित काफी सही है:

#include <limits>
#include <iomanip>
#include <iostream>

#include <cmath>
#include <cstdlib>
#include <cassert>

template< typename A, typename B >
inline
bool close_enough(A const & a, B const & b,
                  typename std::common_type< A, B >::type const & epsilon)
{
    using std::isless;
    assert(isless(0, epsilon)); // epsilon is a part of the whole quantity
    assert(isless(epsilon, 1));
    using std::abs;
    auto const delta = abs(a - b);
    auto const x = abs(a);
    auto const y = abs(b);
    // comparable generally and |a - b| < eps * (|a| + |b|) / 2
    return isless(epsilon * y, x) && isless(epsilon * x, y) && isless((delta + delta) / (x + y), epsilon);
}

int main()
{
    std::cout << std::boolalpha << close_enough(0.9, 1.0, 0.1) << std::endl;
    std::cout << std::boolalpha << close_enough(1.0, 1.1, 0.1) << std::endl;
    std::cout << std::boolalpha << close_enough(1.1,    1.2,    0.01) << std::endl;
    std::cout << std::boolalpha << close_enough(1.0001, 1.0002, 0.01) << std::endl;
    std::cout << std::boolalpha << close_enough(1.0, 0.01, 0.1) << std::endl;
    return EXIT_SUCCESS;
}

0

मैं इस कोड का उपयोग करता हूं:

bool AlmostEqual(double v1, double v2)
    {
        return (std::fabs(v1 - v2) < std::fabs(std::min(v1, v2)) * std::numeric_limits<double>::epsilon());
    }

2
जो है, उसके लिए नहीं epsilonहै।
स्नेफेल

1
क्यों नहीं? क्या आप इसे समझा सकते हैं?
पहली

2
@debuti epsilonकेवल 1 और 1. सबसे अच्छा में बाद अगले प्रदर्शनीय संख्या के बीच की दूरी है, कि कोड सिर्फ जांच करने के लिए है कि क्या दोनों संख्याएं कोशिश कर रहा है वास्तव में एक दूसरे के बराबर है, लेकिन क्योंकि 2 के गैर शक्तियों से गुणा किया जा रहा है epsilon, यह वह भी सही ढंग से नहीं कर रहा है।
स्नेफेल

2
ओह, और std::fabs(std::min(v1, v2))गलत है - नकारात्मक इनपुट के लिए यह बड़े परिमाण के साथ एक को चुनता है।
स्नेफेल

0

मैं इसे जावा के लिए लिखता हूं, लेकिन शायद आप इसे उपयोगी पाते हैं। यह डबल्स के बजाय लॉन्ग का उपयोग करता है, लेकिन NaN, सबनॉर्मल आदि का ध्यान रखता है।

public static boolean equal(double a, double b) {
    final long fm = 0xFFFFFFFFFFFFFL;       // fraction mask
    final long sm = 0x8000000000000000L;    // sign mask
    final long cm = 0x8000000000000L;       // most significant decimal bit mask
    long c = Double.doubleToLongBits(a), d = Double.doubleToLongBits(b);        
    int ea = (int) (c >> 52 & 2047), eb = (int) (d >> 52 & 2047);
    if (ea == 2047 && (c & fm) != 0 || eb == 2047 && (d & fm) != 0) return false;   // NaN 
    if (c == d) return true;                            // identical - fast check
    if (ea == 0 && eb == 0) return true;                // ±0 or subnormals
    if ((c & sm) != (d & sm)) return false;             // different signs
    if (abs(ea - eb) > 1) return false;                 // b > 2*a or a > 2*b
    d <<= 12; c <<= 12;
    if (ea < eb) c = c >> 1 | sm;
    else if (ea > eb) d = d >> 1 | sm;
    c -= d;
    return c < 65536 && c > -65536;     // don't use abs(), because:
    // There is a posibility c=0x8000000000000000 which cannot be converted to positive
}
public static boolean zero(double a) { return (Double.doubleToLongBits(a) >> 52 & 2047) < 3; }

ध्यान रखें कि कई फ्लोटिंग-पॉइंट ऑपरेशंस के बाद, हम जो उम्मीद करते हैं, उससे बहुत अलग संख्या हो सकती है। जिसे ठीक करने के लिए कोई कोड नहीं है।


0

इस बारे में कैसा है?

template<typename T>
bool FloatingPointEqual( T a, T b ) { return !(a < b) && !(b < a); }

मैंने विभिन्न दृष्टिकोण देखे हैं - लेकिन यह कभी नहीं देखा, इसलिए मैं किसी भी टिप्पणी को सुनने के लिए उत्सुक हूं!



-1
/// testing whether two doubles are almost equal. We consider two doubles
/// equal if the difference is within the range [0, epsilon).
///
/// epsilon: a positive number (supposed to be small)
///
/// if either x or y is 0, then we are comparing the absolute difference to
/// epsilon.
/// if both x and y are non-zero, then we are comparing the relative difference
/// to epsilon.
bool almost_equal(double x, double y, double epsilon)
{
    double diff = x - y;
    if (x != 0 && y != 0){
        diff = diff/y; 
    }

    if (diff < epsilon && -1.0*diff < epsilon){
        return true;
    }
    return false;
}

मैंने अपने छोटे प्रोजेक्ट के लिए इस फ़ंक्शन का उपयोग किया और यह काम करता है, लेकिन निम्नलिखित पर ध्यान दें:

डबल सटीक त्रुटि आपके लिए एक आश्चर्य पैदा कर सकती है। मान लें कि एप्सिलॉन = 1.0e-6, तो 1.0 और 1.000001 को उपरोक्त कोड के अनुसार समान नहीं माना जाना चाहिए, लेकिन मेरी मशीन पर फ़ंक्शन उन्हें समान मानता है, ऐसा इसलिए है क्योंकि 1.000001 को बाइनरी प्रारूप में ठीक से अनुवाद नहीं किया जा सकता है। यह शायद 1.0000009xxx है। मैं इसे 1.0 और 1.0000011 के साथ परीक्षण करता हूं और इस बार मुझे अपेक्षित परिणाम मिला है।


-1

यह लंबोदर के साथ एक और उपाय है:

#include <cmath>
#include <limits>

auto Compare = [](float a, float b, float epsilon = std::numeric_limits<float>::epsilon()){ return (std::fabs(a - b) <= epsilon); };

यह बिल्कुल अन्य उत्तरों के समान है, सिवाय इसके कि यह लंबोदर है और इसकी कोई व्याख्या नहीं है, इसलिए यह उत्तर के रूप में बहुत अधिक मूल्य नहीं जोड़ता है।
टिजिन

-2

मेरा तरीका सही नहीं है लेकिन उपयोगी हो सकता है

दोनों फ्लोट को स्ट्रिंग्स में बदलें और फिर स्ट्रिंग तुलना करें

bool IsFlaotEqual(float a, float b, int decimal)
{
    TCHAR form[50] = _T("");
    _stprintf(form, _T("%%.%df"), decimal);


    TCHAR a1[30] = _T(""), a2[30] = _T("");
    _stprintf(a1, form, a);
    _stprintf(a2, form, b);

    if( _tcscmp(a1, a2) == 0 )
        return true;

    return false;

}

ऑपरेटर ओवरलोlaडग भी की जा सकती है


+1: हे, मैं इसके साथ गेम प्रोग्रामिंग नहीं करने जा रहा हूं, लेकिन ब्रूस डॉसन के ब्लॉग (ग्रंथ?: D) में कई बार राउंड-ट्रिपिंग फ़्लोट्स का विचार आया, और यदि आप इसमें फंसे हैं? एक कमरा और कोई व्यक्ति आपके सिर में एक बंदूक रखता है और कहता है "अरे, आपको एक्स महत्वपूर्ण आंकड़ों के भीतर दो झांकियों की तुलना करनी है, आपके पास 5 मिनट हैं, जीओ!" यह शायद विचार करने के लिए एक है। ;)
शेलीबटरफ्लाई

@shelleybutterfly फिर दो अस्थायी बिंदु संख्याओं की तुलना करने के सबसे कुशल तरीके के लिए सवाल था ।
टॉमी एंडरसन

@ टॉमी लोल शायद, लेकिन मैंने शर्त लगाई कि ट्रिपिंग-ट्रिपिंग का कारण दक्षता-संबंधी कारणों से नहीं है। हालांकि मेरा अंतर्ज्ञान यह है कि यह HW fp गणित की तुलना में अकुशल होगा, लेकिन यह भी कहता है कि सॉफ़्टवेयर fp में algoritihms में कम से कम एक bigO अंतर होने की संभावना नहीं है। मुझे उस विश्लेषण का बेसब्री से इंतजार है जो आपने उस मामले में दक्षता संबंधी चिंताओं को दिखाते हुए किया है जो महत्वपूर्ण हैं। इसके अलावा, कभी-कभी कम-से-इष्टतम भी अभी भी एक मूल्यवान उत्तर हो सकता है, और जैसा कि इसे अस्वीकृत किया गया था - एक वैध तकनीक होने के बावजूद जो कि इस विषय पर डावसन के ब्लॉग द्वारा भी उल्लेख किया गया था, इसलिए मुझे लगा कि यह एक उत्थान के योग्य है।
शेलीबटरफ्लाई

-2

आप doubleएक निश्चित के साथ दो की तुलना नहीं कर सकते EPSILON। के मूल्य पर निर्भर करता है double, EPSILONबदलता है।

एक बेहतर दोहरी तुलना होगी:

bool same(double a, double b)
{
  return std::nextafter(a, std::numeric_limits<double>::lowest()) <= b
    && std::nextafter(a, std::numeric_limits<double>::max()) >= b;
}

-2

अधिक सामान्य तरीके से:

template <typename T>
bool compareNumber(const T& a, const T& b) {
    return std::abs(a - b) < std::numeric_limits<T>::epsilon();
}

4
इस पद्धति में कई कमजोरियां हैं, जैसे कि यदि संख्याएं aऔर bपहले से ही छोटी हैं तो epsilon()अंतर अभी भी महत्वपूर्ण हो सकता है। इसके विपरीत यदि संख्याएँ बहुत बड़ी हैं, तो भी त्रुटि के बिट्स की एक जोड़ी तुलना को विफल कर देगी, भले ही आप संख्याओं को समान माना जाना चाहते हों। यह उत्तर बिल्कुल "जेनेरिक" तुलना एल्गोरिथ्म का प्रकार है जिससे आप बचना चाहते हैं।
सरगुई

-3

बिटवाइज़ XOR क्यों नहीं करते? यदि उनके संबंधित बिट समान हैं, तो दो फ़्लोटिंग पॉइंट नंबर बराबर हैं। मुझे लगता है, दो फ्लोट की तुलना में तेजी लाने के लिए मंटिसा से पहले प्रतिपादक बिट्स लगाने का निर्णय किया गया था। मुझे लगता है, यहाँ कई उत्तर एप्सिलॉन तुलना के बिंदु को याद कर रहे हैं। एप्सिलॉन मान केवल इस बात पर निर्भर करता है कि सटीक फ्लोटिंग पॉइंट संख्या की तुलना क्या है। उदाहरण के लिए, फ्लोट्स के साथ कुछ अंकगणित करने के बाद आपको दो नंबर मिलते हैं: 2.5642943554342 और 2.5642943554345। वे समान नहीं हैं, लेकिन समाधान के लिए केवल 3 दशमलव अंक मायने रखते हैं तो वे समान हैं: 2.564 और 2.564। इस स्थिति में आप 0.001 के बराबर एप्सिलॉन चुनते हैं। बिट्स XOR के साथ एप्सिलॉन की तुलना भी संभव है। अगर मैं ग़लत हूं तो मेरी गलती सुझाएं।


कृपया एक से अधिक प्रश्नों के उत्तर न जोड़ें। सर्वश्रेष्ठ का उत्तर दें और बाकी को डुप्लिकेट के रूप में चिह्नित करें। देखें meta.stackexchange.com/questions/104227/...
भार्गव राव

मुझे नहीं लगता कि एक्सो (और एक या दो तुलना) का उपयोग करके "एप्सिलॉन तुलना" संभव है, यहां तक ​​कि एक ही प्रारूप में सामान्यीकृत अभ्यावेदन तक सीमित है।
ग्रेबियर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.