मुझे उम्मीद है कि यह प्रश्न इस साइट में सबसे उपयुक्त है ...
पाइथन में, आमतौर पर वर्ग नाम को उदाहरण के लिए पहले अक्षर के रूप में कैपिटल अक्षर का उपयोग करके परिभाषित किया जाता है
class Vehicle:
...
हालांकि, मशीन लर्निंग क्षेत्र में, अक्सर ट्रेन और परीक्षण डेटा को परिभाषित किया जाता है Xऔर Y- xऔर नहीं y। उदाहरण के लिए, मैं अब केरस पर इस ट्यूटोरियल को पढ़ रहा हूं , लेकिन यह इसके चर के रूप में Xऔर इसका उपयोग करता है Y:
from sklearn import datasets
mnist = datasets.load_digits()
X = mnist.data
Y = mnist.target
इन्हें क्यों बड़े अक्षरों में परिभाषित किया गया है? क्या मशीन सीखने के क्षेत्र में कोई सम्मेलन (कम से कम पायथन में) है कि इन चरों को परिभाषित करने के लिए बड़े अक्षर का उपयोग करना बेहतर है?
या हो सकता है कि लोग मशीन लर्निंग में अपर बनाम लोअर केस वेरिएबल को अलग करते हैं?
वास्तव में एक ही ट्यूटोरियल बाद में इन चरों को निम्नलिखित की तरह अलग करता है:
from sklearn.cross_validation import train_test_split
train_X, test_X, train_y, test_y = train_test_split(X, Y, train_size=0.7, random_state=0)