इस पर काफी देर से आने पर, मुझे लगा कि अगर I / O पर लगातार बने रहने के लिए मेटाडेटा की जरूरत है तो यह मददगार हो सकता है। H5io नामक एक अपेक्षाकृत नया पैकेज है जिसे मैं इसे पूरा करने के लिए उपयोग कर रहा हूं।
यह आपको कुछ सामान्य प्रारूपों के लिए HDF5 से एक त्वरित पढ़ने / लिखने की अनुमति देना चाहिए, उनमें से एक डेटाफ्रेम है। इसलिए, उदाहरण के लिए, आप एक शब्दकोश में डेटाफ़्रेम डाल सकते हैं और मेटाडेटा को शब्दकोश में फ़ील्ड के रूप में शामिल कर सकते हैं। उदाहरण के लिए:
save_dict = dict(data=my_df, name='chris', record_date='1/1/2016')
h5io.write_hdf5('path/to/file.hdf5', save_dict)
in_data = h5io.read_hdf5('path/to/file.hdf5')
df = in_data['data']
name = in_data['name']
etc...
एक अन्य विकल्प एक्सरे जैसी परियोजना को देखना होगा , जो कुछ मायनों में अधिक जटिल है, लेकिन मुझे लगता है कि यह आपको मेटाडेटा का उपयोग करने देता है और डेटाफ़्रेम में कनवर्ट करना बहुत आसान है।