डेटा वृद्धि करने के कई तरीके हैं, जैसे कि लोकप्रिय क्षैतिज रूप से फ़्लिपिंग, यादृच्छिक फसलें और रंग घबराना। इसके अलावा,
आप
एक ही समय में रोटेशन और रैंडम स्केलिंग करते हुए , कई अलग-अलग प्रसंस्करण के संयोजन की कोशिश कर सकते हैं । इसके अलावा,
आप
सभी पिक्सेल के संतृप्ति और मान ( HSV रंग स्थान के S और V घटक ) को 0.25 और 4 (
पैच के भीतर सभी पिक्सेल के लिए समान) बढ़ाने की कोशिश कर सकते हैं , इन मानों को
0.7 के बीच एक कारक से गुणा करें। और 1.4, और उन्हें -0.1 और 0.1 के बीच मान जोड़ें।
इसके अलावा, आप
छवि या पैच में सभी पिक्सल के hue (एच घटक) के लिए [-0.1, 0.1] के बीच एक मूल्य जोड़ सकते हैं ।
क्रिज़ेव्स्की एट अल। 2012 में प्रसिद्ध एलेक्स-नेट का प्रशिक्षण देते समय 1 प्रस्तावित पीसीए। फैंसी पीसीए
प्रशिक्षण छवियों में आरजीबी चैनलों की तीव्रता को बदल देता है । व्यवहार में, आप अपने प्रशिक्षण चित्रों में आरजीबी पिक्सेल मूल्यों के सेट पर सबसे पहले पीसीए का प्रदर्शन कर सकते हैं। और
फिर, प्रत्येक प्रशिक्षण छवि के लिए, बस
प्रत्येक RGB छवि पिक्सेल में निम्न मात्रा जोड़ें (जैसे, I_ {xy} = [I_ {xy} ^ R, I_ {xy} ^ G, I_ {xy} ^ B]: T) ):
[bf {p} _1, bf {p} _2, bf {p} _3] [Alpha_1 lambda_1, alp_2 lambda_2, alp_3
lambda_3] ^ T कहाँ, b {{p} _i और lambda_i i-th eigenvector और
eigenvalue हैं
क्रमशः आरजीबी पिक्सेल मानों के 3times 3 सहसंयोजक मैट्रिक्स , और अल्फा_ आई एक यादृच्छिक चर है जो गॉसियन से लिया गया है
औसत शून्य और मानक विचलन 0.1 के साथ। कृपया ध्यान दें कि, प्रत्येक
अल्फ़ाज़ी_ एक विशेष
प्रशिक्षण छवि के सभी पिक्सल के लिए केवल एक बार तैयार किया जाता है, जब तक कि उस छवि को फिर से प्रशिक्षण के लिए उपयोग नहीं किया जाता है। यह
कहना है, जब मॉडल फिर से एक ही प्रशिक्षण छवि को पूरा करता है, तो यह
डेटा वृद्धि के लिए बेतरतीब ढंग से एक और Alpha_i का उत्पादन करेगा । में 1 , वे
दावा किया कि "कल्पना पीसीए लगभग एक महत्वपूर्ण ले सकता है
प्राकृतिक छवियों की संपत्ति, अर्थात्, उस वस्तु पहचान तीव्रता और रोशनी के रंग में बदलाव के लिए अपरिवर्तनीय है।" करने के लिए
वर्गीकरण प्रदर्शन, इस योजना के ऊपर से 1 त्रुटि दर कम
ImageNet 2012 की प्रतियोगिता में 1% से अधिक द्वारा।