मुझे उम्मीद है कि यह प्रश्न इस साइट में सबसे उपयुक्त है ...
पाइथन में, आमतौर पर वर्ग नाम को उदाहरण के लिए पहले अक्षर के रूप में कैपिटल अक्षर का उपयोग करके परिभाषित किया जाता है
class Vehicle:
...
हालांकि, मशीन लर्निंग क्षेत्र में, अक्सर ट्रेन और परीक्षण डेटा को परिभाषित किया जाता है X
और Y
- x
और नहीं y
। उदाहरण के लिए, मैं अब केरस पर इस ट्यूटोरियल को पढ़ रहा हूं , लेकिन यह इसके चर के रूप में X
और इसका उपयोग करता है Y
:
from sklearn import datasets
mnist = datasets.load_digits()
X = mnist.data
Y = mnist.target
इन्हें क्यों बड़े अक्षरों में परिभाषित किया गया है? क्या मशीन सीखने के क्षेत्र में कोई सम्मेलन (कम से कम पायथन में) है कि इन चरों को परिभाषित करने के लिए बड़े अक्षर का उपयोग करना बेहतर है?
या हो सकता है कि लोग मशीन लर्निंग में अपर बनाम लोअर केस वेरिएबल को अलग करते हैं?
वास्तव में एक ही ट्यूटोरियल बाद में इन चरों को निम्नलिखित की तरह अलग करता है:
from sklearn.cross_validation import train_test_split
train_X, test_X, train_y, test_y = train_test_split(X, Y, train_size=0.7, random_state=0)