एक असतत कोसाइन रूपांतरण से सुविधाओं का उपयोग करके छवि की बनावट को वर्गीकृत करना कितना व्यवहार्य होगा? Googling "बनावट वर्गीकरण dct" केवल इस विषय पर एक एकल शैक्षणिक पेपर पाता है , एक तंत्रिका नेटवर्क का उपयोग कर।
मेरे आवेदन के लिए, मेरे पास लेबल वाली छवियों का एक बड़ा समूह है, जिसमें पूरी छवि एक सुसंगत बनावट है (जैसे कंबल, पेड़ की छाल, एक घास का मैदान, आदि का क्लोज-अप शॉट्स)।
पिछले प्रश्न के उत्तर से प्रेरित होकर , मैं निम्नलिखित दृष्टिकोण पर विचार कर रहा था:
- पिक्सेल के NxN ब्लॉकों में प्रत्येक छवि को विभाजित करें
- प्रत्येक ब्लॉक का डीसीटी लें
- प्रत्येक DCT को 1xM सरणी में समतल करें और इसे K-Means क्लस्टरिंग एल्गोरिथ्म में फ़ीड करें, और प्रत्येक DCT के लिए क्लस्टर लेबल प्राप्त करें
- # 3 से छवि के अनुसार प्रत्येक लेबल की गिनती करके प्रत्येक छवि के लिए क्लस्टरिंग लेबल के एक हिस्टोग्राम की गणना करें
- [(हिस्टोग्राम, इमेज लेबल)] का एक सेट खिलाकर एसवीएम क्लासिफायर ट्रेन करें
यह कितना अच्छा काम करेगा? मैंने एक समान प्रणाली लागू की, SIFT / SURF एल्गोरिदम के माध्यम से निकाली गई विशेषताओं का उपयोग करते हुए, लेकिन मैं केवल 60% सटीकता प्राप्त करने में सक्षम था।
बनावट को वर्गीकृत करने के लिए मैं डीसीटी का उपयोग किन अन्य तरीकों से कर सकता हूं?