S3 बाल्टी (उदाहरण के लिए s3fs का उपयोग करके) को सीधे "इंगित करना" एक बुरा विचार है। उदा। /programming/10801158/how-stable-is-s3fs-to-mount-an-amazon-s3-bucket-as-a-local-directory
ईबीएस लगभग निश्चित रूप से जियोसर्वर द्वारा एक्सेस के लिए डेटा स्टोर करने के लिए सही जगह है।
ईबीएस मानकों द्वारा 100 जीबी बहुत प्रबंधनीय है। (अधिकतम मात्रा का आकार 16 टेराबाइट्स है!)
मैं S3 में मूल डेटा को संग्रहीत करने का सुझाव दे सकता हूं और फिर अपने उदाहरणों पर दोहरा सकता हूं, एक कमांड के साथ S3 फ़ोल्डर की सामग्री को अपने स्थानीय उदाहरण में सिंक करने के लिए AWS CLI टूल का उपयोग कर सकता हूं। http://docs.aws.amazon.com/cli/latest/reference/s3/sync.html )। S3 यकीनन बेमानी है, लेकिन मुझे लगता है कि यह लचीलापन और सुविधा जोड़ता है।
साइड नोट: यदि आप वैसे भी बड़े मल्टी-कोर इंस्टेंस का उपयोग करने की योजना बना रहे हैं और आपको पता है कि डेटा की मात्रा अप्रत्याशित रूप से बढ़ने की संभावना नहीं है और आप अपने इंस्टेंस को ऑटो-बिल्ड करने में सक्षम हैं, तो आप वास्तव में इंस्टेंस स्टोरेज का उपयोग करने पर विचार कर सकते हैं ("अल्पकालिक भंडारण" ) क्योंकि आपका मूल डेटा S3 में सुरक्षित होगा, आप ईबीएस शुल्क पर बचत कर सकते हैं, और उदाहरण के लिए भंडारण कुछ मामलों में ईबीएस की तुलना में थोड़ा तेज हो सकता है।