मान लीजिए कि मेरे पास संरचना के साथ एक नेस्टेड डिक्शनरी 'user_dict' है:
- लेवल 1: UserId (लॉन्ग इंटेगर)
- स्तर 2: श्रेणी (स्ट्रिंग)
- स्तर 3: मिश्रित विशेषताएँ (फ़्लोट्स, इनट्स, आदि ..)
उदाहरण के लिए, इस शब्दकोश की एक प्रविष्टि होगी:
user_dict[12] = {
"Category 1": {"att_1": 1,
"att_2": "whatever"},
"Category 2": {"att_1": 23,
"att_2": "another"}}
प्रत्येक आइटम में user_dictसमान संरचना होती है और user_dictइसमें बड़ी संख्या में आइटम होते हैं, जिन्हें मैं एक पांडा डेटाफ़्रेम को खिलाना चाहता हूं, जो विशेषताओं से श्रृंखला का निर्माण करते हैं। इस मामले में एक पदानुक्रमित सूचकांक उपयोगी होगा।
विशेष रूप से, मेरा सवाल यह है कि क्या डेटाफ़्रेम निर्माता को यह समझने में मदद करने का कोई तरीका मौजूद है कि श्रृंखला को शब्दकोश में "स्तर 3" के मूल्यों से बनाया जाना चाहिए?
अगर मैं कुछ इस तरह की कोशिश करता हूं:
df = pandas.DataFrame(users_summary)
"स्तर 1" (उपयोगकर्ता आईडी) के आइटम को कॉलम के रूप में लिया जाता है, जो कि मैं जो हासिल करना चाहता हूं उसके विपरीत है (उपयोगकर्ता आईडी के सूचकांक के रूप में)।
मुझे पता है कि मैं डिक्शनरी प्रविष्टियों पर ध्यान देने के बाद श्रृंखला का निर्माण कर सकता हूं, लेकिन अगर अधिक सीधा रास्ता है तो यह बहुत उपयोगी होगा। एक समान प्रश्न पूछ रहा होगा कि क्या किसी फ़ाइल में सूचीबद्ध json ऑब्जेक्ट्स से पांडा डेटाफ़्रेम का निर्माण संभव है।