बड़े डेटाफ़्रेम के संपूर्ण आउटपुट को देखने का कोई कारण नहीं है। बड़े डेटाफ़्रेम को देखना या हेरफेर करना आपके कंप्यूटर संसाधनों की बड़ी मात्रा का अनावश्यक रूप से उपयोग करेगा।
जो भी आप कर रहे हैं वह लघु में किया जा सकता है। डेटा फ़्रेम छोटा होने पर डेटा को कोडिंग और मैनिप्युलेट करना बहुत आसान है। बड़े डेटा के साथ काम करने का सबसे अच्छा तरीका एक नया डेटा फ्रेम बनाना है जो केवल छोटे हिस्से या बड़े डेटा फ़्रेम का छोटा नमूना लेता है। फिर आप डेटा का पता लगा सकते हैं और छोटे डेटा फ्रेम पर अपनी कोडिंग कर सकते हैं। एक बार जब आप डेटा का पता लगा लेते हैं और अपना कोड काम कर लेते हैं, तो बस उस कोड का उपयोग बड़े डेटा फ्रेम पर करें।
सबसे आसान तरीका केवल सिर, () फ़ंक्शन का उपयोग करके डेटा फ्रेम से पहली पंक्तियों की संख्या, पहले n को लेना है। सिर फ़ंक्शन केवल n, प्रिंट की संख्या को प्रिंट करता है। आप बड़े डेटा फ़्रेम पर हेड फ़ंक्शन का उपयोग करके एक मिनी डेटा फ़्रेम बना सकते हैं। नीचे मैंने पहली 50 पंक्तियों का चयन करने और छोटे मान के लिए उनके मान को चुना है। यह मानता है कि बिगडाटा एक डेटा फ़ाइल है जो इस प्रोजेक्ट के लिए खोली गई लाइब्रेरी से आती है।
library(namedPackage)
df <- data.frame(BigData) # Assign big data to df
small_df <- head(df, 50) # Assign the first 50 rows to small_df
यह ज्यादातर समय काम करेगा, लेकिन कभी-कभी बड़े डेटा फ्रेम में प्रीसेटेड वेरिएबल्स या पहले से ग्रुप किए गए वेरिएबल्स आते हैं। यदि बड़ा डेटा ऐसा है, तो आपको बड़े डेटा से पंक्तियों का एक यादृच्छिक नमूना लेना होगा। फिर निम्न कोड का उपयोग करें:
df <- data.frame(BigData)
set.seed(1016) # set your own seed
df_small <- df[sample(nrow(df),replace=F,size=.03*nrow(df)),] # samples 3% rows
df_small # much smaller df