मेरे पास एक एप्लिकेशन है जिसे तुच्छ रूप से समानांतर किया जा सकता है लेकिन इसका प्रदर्शन काफी हद तक I / O बाध्य है। एप्लिकेशन एक फ़ाइल में संग्रहीत एकल इनपुट सरणी को पढ़ता है जो आम तौर पर 2-5 जीबी आकार में होता है (लेकिन मुझे उम्मीद है कि यह संख्या भविष्य में बढ़ने की संभावना है)। एक विशिष्ट संगणना उस पंक्ति के प्रत्येक पंक्ति या स्तंभ पर एक ही ऑपरेशन को लागू करती है। CPU- हेवी ऑपरेशंस के लिए, मुझे लगभग 100 प्रोसेसर तक बहुत अच्छे स्केलिंग मिलते हैं, लेकिन धीमे संचालन के लिए I / O और संबंधित संचार (NFS एक्सेस) हावी है और मैं कुछ प्रोसेसर से अधिक कुशलता से उपयोग नहीं कर सकता।
ऐसी स्थिति के लिए कुशल और पोर्टेबल (आदर्श रूप से कुशल रूप से कुशल) विकल्प क्या हैं? समानांतर HDF5 आशाजनक लगता है। क्या किसी को इसके साथ वास्तविक जीवन का अनुभव है?
क्या MPI-I / O कुछ देखने लायक होगा? क्या यह किसी दिए गए फ़ाइल लेआउट के साथ कुशलता से काम कर सकता है, या क्या मुझे सब कुछ अनुकूलित करना होगा?