मान लीजिए कि मेरे पास संरचना के साथ एक नेस्टेड डिक्शनरी 'user_dict' है:
- लेवल 1: UserId (लॉन्ग इंटेगर)
- स्तर 2: श्रेणी (स्ट्रिंग)
- स्तर 3: मिश्रित विशेषताएँ (फ़्लोट्स, इनट्स, आदि ..)
उदाहरण के लिए, इस शब्दकोश की एक प्रविष्टि होगी:
user_dict[12] = {
"Category 1": {"att_1": 1,
"att_2": "whatever"},
"Category 2": {"att_1": 23,
"att_2": "another"}}
प्रत्येक आइटम में user_dict
समान संरचना होती है और user_dict
इसमें बड़ी संख्या में आइटम होते हैं, जिन्हें मैं एक पांडा डेटाफ़्रेम को खिलाना चाहता हूं, जो विशेषताओं से श्रृंखला का निर्माण करते हैं। इस मामले में एक पदानुक्रमित सूचकांक उपयोगी होगा।
विशेष रूप से, मेरा सवाल यह है कि क्या डेटाफ़्रेम निर्माता को यह समझने में मदद करने का कोई तरीका मौजूद है कि श्रृंखला को शब्दकोश में "स्तर 3" के मूल्यों से बनाया जाना चाहिए?
अगर मैं कुछ इस तरह की कोशिश करता हूं:
df = pandas.DataFrame(users_summary)
"स्तर 1" (उपयोगकर्ता आईडी) के आइटम को कॉलम के रूप में लिया जाता है, जो कि मैं जो हासिल करना चाहता हूं उसके विपरीत है (उपयोगकर्ता आईडी के सूचकांक के रूप में)।
मुझे पता है कि मैं डिक्शनरी प्रविष्टियों पर ध्यान देने के बाद श्रृंखला का निर्माण कर सकता हूं, लेकिन अगर अधिक सीधा रास्ता है तो यह बहुत उपयोगी होगा। एक समान प्रश्न पूछ रहा होगा कि क्या किसी फ़ाइल में सूचीबद्ध json ऑब्जेक्ट्स से पांडा डेटाफ़्रेम का निर्माण संभव है।