विवरण:
GPU : GTX 1080
प्रशिक्षण : ~ १० वर्गों से संबंधित १.१ मिलियन छवियां
मान्यता : ~ 150 हजार चित्र 10 वर्गों से संबंधित हैं
समय प्रति युग : ~ 10 घंटे
मैंने CUDA, cuDNN और Tensorflow (Tensorflow GPU साथ ही) सेटअप किया है।
मुझे नहीं लगता कि मेरा मॉडल वह जटिल है जो प्रति घंटे 10 घंटे लेता है। मैंने यह भी जाँच की कि क्या मेरी GPU समस्या थी, लेकिन यह नहीं था।
क्या प्रशिक्षण का समय पूरी तरह से जुड़ी परतों के कारण है?
मेरा मॉडल:
model = Sequential()
model.add()
model.add(Conv2D(64, (3, 3), padding="same", strides=2))
model.add(Activation('relu'))
model.add(Dropout(0.25))
model.add(Conv2D(64, (3, 3), padding="same", strides=2))
model.add(Activation('relu'))
model.add(Dropout(0.25))
model.add(Conv2D(32, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(3, 3), strides=2))
model.add(Flatten())
model.add(Dense(256))
model.add(Activation('relu'))
model.add(Dense(4096))
model.add(Activation('relu'))
model.add(Dense(10))
model.add(Activation('softmax'))
model.summary()
opt = keras.optimizers.rmsprop(lr=0.0001, decay=1e-6)
model.compile(loss='categorical_crossentropy',
optimizer=opt,
metrics=['accuracy']
)
क्योंकि वहाँ बहुत सारे डेटा मैं ImageDataGenerator का उपयोग किया है।
gen = ImageDataGenerator(
horizontal_flip=True
)
train_gen = gen.flow_from_directory(
'train/',
target_size=(512, 512),
batch_size=5,
class_mode="categorical"
)
valid_gen = gen.flow_from_directory(
'validation/',
target_size=(512, 512),
batch_size=5,
class_mode="categorical"
)