हम कहते हैं कि मेरे पास एक वर्गीकरण समस्या के लिए पंक्तियों का एक समूह है:
कहाँ पे सुविधाएँ / भविष्यवाणियों और हैं पंक्ति का फीचर संयोजन किस श्रेणी का है।
कई फीचर संयोजन और उनकी कक्षाएं डेटासेट में दोहराई जाती हैं, जिसका उपयोग मैं एक क्लासिफायरफायर फिट करने के लिए कर रहा हूं। मैं सिर्फ सोच रहा हूं कि क्या डुप्लिकेट को हटाने के लिए स्वीकार्य है (मैं मूल रूप group by X1 ... XN Y
से एसक्यूएल में प्रदर्शन करता हूं )? धन्यवाद।
पुनश्च:
यह केवल द्विआधारी उपस्थिति के लिए है जहां कक्षा पुजारी काफी तिरछे होते हैं