एंकरों ने समझाया
लंगर
कुछ समय के लिए, "संदर्भ बक्से के पिरामिड" के फैंसी शब्द को नजरअंदाज करें, एंकर क्षेत्र प्रस्ताव नेटवर्क को खिलाए जाने के लिए निश्चित आकार के आयतों के अलावा कुछ भी नहीं हैं। एंकरों को अंतिम फीचर मानचित्र पर परिभाषित किया जाता है, जिसका अर्थ है कि उनमें से हैं, लेकिन वे छवि के अनुरूप हैं। प्रत्येक एंकर के लिए तब आरपीएन सामान्य रूप से एक ऑब्जेक्ट रखने की संभावना की भविष्यवाणी करता है और चार एंकर को सही स्थिति में ले जाने और आकार बदलने के लिए समन्वय करता है। लेकिन एंकरों की ज्यामिति को आरपीएन के साथ कुछ भी कैसे करना है? (एचचई एक टी यू आर ई मीटर एक पी*डब्ल्यूचई एक टी यू आर ई मीटर एक पी) * ( कश्मीर )
एंकर वास्तव में लॉस फंक्शन में दिखाई देते हैं
आरपीएन को प्रशिक्षित करते समय, पहले एक बाइनरी क्लास लेबल प्रत्येक एंकर को सौंपा जाता है। ग्राउंड-ट्रुथ बॉक्स के साथ इन्टर्सेक्शन -ओवर-यूनियन ( IoU ) ओवरलैप वाले एंकर एक निश्चित सीमा से अधिक होते हैं, उन्हें एक सकारात्मक लेबल दिया जाता है (इसी प्रकार दिए गए थ्रेशोल्ड से कम IoU के साथ एंकर नकारात्मक रूप से लेबल किए जाएंगे)। इन लेबल का उपयोग आगे चलकर नुकसान के कार्य की गणना के लिए किया जाता है:
पी आरपीएन का वर्गीकरण प्रधान आउटपुट है जो किसी ऑब्जेक्ट को समाहित करने के लिए एंकर की संभावना को निर्धारित करता है। नकारात्मक के रूप में लेबल किए गए एंकर के लिए, प्रतिगमन - से कोई नुकसान नहीं हुआ है , जमीनी सच्चाई लेबल शून्य है। दूसरे शब्दों में, नेटवर्क नकारात्मक एंकरों के लिए आउटपुट निर्देशांक के बारे में परवाह नहीं करता है और जब तक यह उन्हें सही ढंग से वर्गीकृत करता है तब तक खुश है। सकारात्मक एंकर के मामले में, प्रतिगमन हानि को ध्यान में रखा जाता है। आरपीएन का प्रतिगमन हेड आउटपुट है, एक वेक्टर जो अनुमानित बाउंडिंग बॉक्स के 4 मापदंडों वाले निर्देशांक का प्रतिनिधित्व करता है। पैरामीटर एंकर ज्यामिति पर निर्भर करता है और निम्नानुसार है:पी*टी
जहां और h बॉक्स के केंद्र निर्देशांक और उसकी चौड़ाई और ऊंचाई को दर्शाते हैं। चर और क्रमशः अनुमानित बॉक्स, लंगर बॉक्स और जमीनी सच्चाई बॉक्स के लिए हैं (इसी तरह )।एक्स , वाई, w ,x ,एक्सए,एक्स*y, डब्ल्यू , एच
बिना लेबल वाले नोटिस एंकरों को न तो वर्गीकृत किया जाता है और न ही पुनर्परिभाषित किया जाता है और RPM बस उन्हें संगणना से बाहर फेंक देता है। एक बार RPN का काम पूरा हो जाता है, और प्रस्ताव तैयार हो जाते हैं, बाकी फास्ट R-CNN के समान होता है।