मेरे पास लगभग 100000 छोटी फ़ाइलों के साथ एक निर्देशिका है (प्रत्येक फ़ाइल 1-3 लाइनों से है, प्रत्येक फ़ाइल एक पाठ फ़ाइल है)। आकार में निर्देशिका बहुत बड़ी नहीं है (<2GB)। यह डेटा पेशेवर रूप से प्रशासित NFS सर्वर में रहता है। सर्वर लिनक्स चलाता है। मुझे लगता है कि फाइलसिस्टम एक्स 3 है, लेकिन मुझे यकीन नहीं है। इसके अलावा, मेरे पास सर्वर तक रूट एक्सेस नहीं है।
ये फाइलें बड़े पैमाने पर वैज्ञानिक प्रयोग का आउटपुट हैं, जिन पर मेरा नियंत्रण नहीं है। हालांकि, मुझे परिणामों का विश्लेषण करना होगा।
इस निर्देशिका में कोई भी I / O ऑपरेशन / प्रसंस्करण बहुत धीमा है। एक फ़ाइल खोलना (अजगर में फ़ोपन), एक खुली फ़ाइल से पढ़ना, एक फ़ाइल को बंद करना, सभी बहुत धीमी गति से होते हैं। Bash ls, du, आदि में काम नहीं करते।
प्रश्न है:
लिनक्स में एक डायरेक्टरी में फ़ाइलों की अधिकतम संख्या इस तरह से है कि प्रोसेसिंग, फोपेन, रीड, आदि करना व्यावहारिक है? मैं समझता हूं कि उत्तर कई चीजों पर निर्भर करता है: एफएस प्रकार, कर्नेल संस्करण, सर्वर संस्करण, हार्डवेयर, आदि। मैं सिर्फ अंगूठे का नियम चाहता हूं, यदि संभव हो तो।