जिसे अक्सर "मध्यम डेटा" प्रोजेक्ट कहा जा सकता था, उस पर काम करते हुए, मैं अपने कोड (ज्यादातर मॉडलिंग और पाइथन में भविष्यवाणी) के लिए 4 से 32 कोर तक कहीं भी एक ही सिस्टम पर समानांतर करने में सक्षम रहा हूं। अब मैं EC2 (शायद StarCluster / IPython के साथ, लेकिन साथ ही अन्य सुझावों के लिए खुला) पर क्लस्टर्स तक स्केलिंग देख रहा हूं, और एक क्लस्टर पर उदाहरणों बनाम डांस पर कोरस में काम का सामंजस्य स्थापित करने के तरीके से हैरान हूं।
क्या यह उदाहरणों के साथ-साथ प्रत्येक उदाहरण पर कोर के पार समानांतर करने के लिए भी व्यावहारिक है? यदि हां, तो क्या कोई व्यक्ति कुछ कोर के साथ कई उदाहरणों को चलाने के पेशेवरों + विपक्षों की त्वरित गति प्रदान कर सकता है? क्या प्रति उदाहरण कोर के लिए उदाहरणों का सही अनुपात चुनने के लिए अंगूठे का नियम है?
बैंडविड्थ और रैम मेरी परियोजनाओं में गैर-तुच्छ चिंताएं हैं, लेकिन यह आसान है जब उन अड़चनों और आसानी से पढ़े जाते हैं। यह बहुत कठिन है, मैं कल्पना करूँगा कि बार-बार परीक्षण किए बिना उदाहरणों के लिए कोर के सही मिश्रण को बेंचमार्क करना, और मेरी परियोजनाएं सभी परिस्थितियों पर लागू होने के लिए किसी भी एक परीक्षण के लिए बहुत भिन्न होती हैं। अग्रिम धन्यवाद, और अगर मैं अभी इसे ठीक से Google करने में विफल रहा हूं, तो मुझे कहीं और सही उत्तर देने के लिए स्वतंत्र महसूस करें!