मुझे PostgreSQL डेटाबेस में बाइनरी डेटा फ़ाइलों को संग्रहीत करने की आवश्यकता है जो एक उबंटू सर्वर पर चलती है। प्रारंभ में प्रत्येक में लगभग 250kb की कुछ दर्जन फाइलें होंगी। हालांकि, समय के साथ फाइलों की संख्या बढ़ती जाएगी। मुझे कई बार अन्य डाउनस्ट्रीम विश्लेषणों के लिए फाइलों से डेटा निकालने की आवश्यकता हो सकती है।
मैंने बाइनरी डेटा को BLOB या संदर्भ के रूप में संग्रहीत करने के आयु-पुराने प्रश्न के बारे में कुछ शोध किया है। दोनों के स्पष्ट रूप से अपने पक्ष और विपक्ष हैं। क्या PostgreSQL से संबंधित कोई विशेष समस्याएं हैं जिनके बारे में मुझे पता होना चाहिए? क्या एक तरीका या दूसरा बेहतर है अगर मैं फ़ाइलों से डेटा निकालना चाहता हूं, या तो पोस्टग्रेजक्यूएल फ़ंक्शन के माध्यम से या बाहरी पायथन प्रोग्राम के माध्यम से?
यदि मैं डेटाबेस में डेटा फ़ाइलों को सीधे स्टोर करने के लिए था, तो क्या उन्हें अन्य मुख्य क्षेत्रों वाली तालिका के बजाय "मुख्य" तालिका को संदर्भित करने वाली एक विदेशी कुंजी के साथ एक अलग तालिका में संग्रहीत करना बेहतर होगा?
मैंने यहाँ प्रश्न और उत्तर पढ़े हैं ; एक टिप्पणी से पता चलता है कि लिनक्स पर (फाइल सिस्टम में) संदर्भ द्वारा बाइनरी फ़ाइलों को संग्रहीत करना बेहतर है। यहाँ मेरे प्रश्न विशेष रूप से PostgreSQL से संबंधित हैं और विभिन्न विश्लेषणों के लिए फाइलों से डेटा निकालने के लिए।
अपडेट: इसी तरह का सवाल ।