मैं मशीन लर्निंग और केरस पर नौसिखिया हूं और अब केरस का उपयोग करके एक बहु-श्रेणी छवि वर्गीकरण समस्या का काम कर रहा हूं। इनपुट को टैग की गई छवि है। कुछ पूर्व प्रसंस्करण के बाद, प्रशिक्षण डेटा को पायथन सूची में निम्न रूप में दर्शाया गया है:
[["dog", "path/to/dog/imageX.jpg"],["cat", "path/to/cat/imageX.jpg"], ["bird", "path/to/cat/imageX.jpg"]]
"कुत्ता", "बिल्ली", और "पक्षी" वर्ग लेबल हैं। मुझे लगता है कि इस समस्या के लिए एक-हॉट एन्कोडिंग का उपयोग किया जाना चाहिए, लेकिन इन स्ट्रिंग लेबल के साथ इसे कैसे निपटना है, मैं इस बारे में बहुत स्पष्ट नहीं हूं। मैंने sklearn के LabelEncoder () को इस तरह आज़माया है:
encoder = LabelEncoder()
trafomed_label = encoder.fit_transform(["dog", "cat", "bird"])
print(trafomed_label)
और आउटपुट [२ १ ०] है, जो अलग है कि मेरा कुछ [जैसे [१०,०,०], [०,१,०]], [०,०,१]]। यह कुछ कोडिंग के साथ किया जा सकता है, लेकिन मैं यह जानना चाहूंगा कि क्या इससे निपटने के लिए कुछ "मानक" या "पारंपरिक" तरीका है?