कठिनाई यह है कि कई संभावित तरीके हैं, जो नमूने की अज्ञात अनुपातों की वजह से जा सकते हैं जैसे फ़ाइल की गिनती बनाम अद्वितीय कोड बनाम कोड की एकल फ़ाइल बनाम फाइलें> 150 दिन बनाम नंबर की वितरण। प्रति कोड फाइलें, आदि सभी संभावित मामलों के लिए एक निश्चित समाधान डिजाइन करने की कोशिश करने के बजाय, मैं एक प्रक्रिया का वर्णन करूंगा जो आपको समाधान के लिए मिलेगा। प्रत्येक चरण में कई सरल तरीके हैं जो आप इसे एक्सेल में कर सकते हैं।
इसे तीन बर्तन समझें:
पॉट 1 आप व्यायाम के दौरान अपने चयनित नमूनों से भरेंगे (यह पॉट एक सूची के रूप में होगा जिसे आप चयनित फ़ाइल नाम के साथ बनाते हैं)। हम इसे नमूने की सूची कहेंगे।
पॉट 2 में यूनिक कोड्स का संग्रह है (यह पॉट यूनिक कोड्स की एक सूची के रूप में होगा; यह देखें कि डुप्लिकेट युक्त सूची से अनूठे मानों को कैसे निकालें, यदि आप नहीं जानते कि कैसे)। इसमें वे कोड होंगे जो अभी तक चयनित नमूने द्वारा नहीं दिखाए गए हैं। हम इसे कोड सूची कहेंगे।
बचे हुए नमूनों की आवश्यक संख्या के लिए पॉट 3 में "टोकन" है (यह पॉट सिर्फ एक सेल में एक संख्या होगी जिसे आप नमूनों का चयन करने के मुकाबले घटाते या मिलान करते हैं)। हम इसे शेष नमूने की गिनती कहेंगे। 20 या 20% से अधिक की गणना करें और उस नंबर को इस बर्तन में डालें।
यहाँ कदम हैं:
क्या उपयोग करने के लिए ओवरसैंपलिंग सीमा तय करें। आपका लक्ष्य 20% फाइलें हैं, लेकिन यादृच्छिक नमूनाकरण आपको सभी कोडों में एक समान 20% नहीं देगा (जब तक कि आप उसके लिए अतिरिक्त आवश्यकता नहीं जोड़ते हैं)। कुछ कोड 20% से कम चयनित होंगे, कुछ अधिक। गैर-यादृच्छिक नियम 20% से कोई संबंध नहीं रखेंगे। एकल फ़ाइल वाले कोड 100% सैंपल वाले होंगे। > 150 दिनों का नियम किसी दिए गए कोड के लिए 20% से अधिक फ़ाइलों का चयन कर सकता है। यदि आप इस नियम से 20% से अधिक का चयन करते हैं, तो वह कोड पहले ही ओवर-प्रतिनिधित्व हो जाएगा, इसलिए आप शायद उस कोड से बेतरतीब ढंग से नमूना लेना नहीं चाहते हैं। > 150 दिनों के नियम के लिए अधिकतम नमूना प्रतिशत (या नमूना गणना) पर निर्णय लें जिसके परे आप उस कोड को यादृच्छिक नमूने से बाहर करते हैं।
दिनों> 150 के साथ सभी फ़ाइलों का चयन करें और उन्हें नमूने सूची में ले जाएं। इन फ़ाइलों की गिनती द्वारा शेष नमूनों की गणना में कमी। कोड सूची से इन फ़ाइलों द्वारा प्रतिनिधित्व किए गए कोड निकालें (फ़ाइलों के इस संग्रह के लिए अद्वितीय कोड के आधार पर)।
यदि यह चरण किसी भी कोड में ओवर-सैंपलिंग सीमा से अधिक है, तो स्रोत सूची से इन कोड से जुड़ी सभी फ़ाइलों को हटा दें। ध्यान दें कि हटाने आलंकारिक है। अभिप्राय यह सुनिश्चित करना है कि उन फ़ाइलों में से कोई भी बाद में नमूना न हो। आप इसे एक तरह से कोड कर सकते हैं जिसमें वास्तव में फ़ाइलों को हटाने की आवश्यकता नहीं होती है।
कोड सूची में शेष फाइलों और कोडों में से, नमूने को किसी भी फाइल को सूचीबद्ध करें जहां वह कोड के लिए एकमात्र फ़ाइल है। इन फ़ाइलों की गिनती द्वारा शेष नमूनों की गणना में कमी। कोड सूची से इन फ़ाइलों द्वारा प्रस्तुत कोड निकालें। ध्यान दें कि चरण 5 लागू होने के आधार पर यह कदम कड़ाई से आवश्यक नहीं है। मैंने इसे स्पष्टता के लिए एक अलग चरण के रूप में तोड़ दिया और ताकि आपको किसी एक की सूची से बेतरतीब ढंग से चयन करने की आवश्यकता न हो।
कोड सूची में प्रत्येक शेष कोड के लिए, यादृच्छिक रूप से उस कोड के लिए एक फ़ाइल का चयन करें और इसे नमूने सूची में ले जाएं। इन फ़ाइलों की गिनती द्वारा शेष नमूनों की गणना में कमी। कोड सूची से इन फ़ाइलों द्वारा दर्शाए गए कोडों को हटा दें (कोड्स वैकल्पिक हो सकते हैं, यह निर्भर करता है कि आप इसे कैसे लागू करते हैं; एक बार यह चरण पूरा हो जाने के बाद, कोड सूची को और अधिक की आवश्यकता नहीं होती है)।
शेष नमूनों की संख्या में फ़ाइलों की संख्या के लिए, शेष फ़ाइलों से किसी फ़ाइल को बेतरतीब ढंग से चुनें और नमूने सूची में ले जाएं।
और आपने कल लिया।
यह आपके लिए संपूर्ण एप्लिकेशन को डिज़ाइन करने के लिए इस साइट पर एक प्रश्न के इच्छित दायरे से परे है। प्रत्येक चरण पर पहुंचने के कई तरीके हैं और उन्हें पूरा करने के सूत्र और तरीके साइट पर पिछले प्रश्नों में अच्छी तरह से दर्शाए गए हैं। यदि आप अटक जाते हैं, तो विशिष्ट समस्या के साथ मदद के लिए एक नया प्रश्न पूछें। उदाहरण के लिए, "मैं किसी सूची से किसी मान का कैसे चयन करूं?" एक प्रश्न का उपयुक्त पैमाना होगा।
CCCC
, और उस कोड के साथ केवल एक फ़ाइल है, तो, परिभाषा के अनुसार, आपके पास वह फ़ाइल है। (२) सूत्रों (उर्फ वर्कशीट फ़ंक्शंस) के साथ ऐसा करना बहुत मुश्किल हो सकता है। क्या VBA समाधान स्वीकार्य हैं?