PostgreSQL 9.2 का उपयोग करते हुए, मुझे अपेक्षाकृत बड़ी तालिका (200+ मिलियन पंक्तियों) पर धीमी क्वेरी के साथ परेशानी है। मैं कुछ भी पागल करने की कोशिश नहीं कर रहा हूं, सिर्फ ऐतिहासिक मूल्यों को जोड़ रहा हूं। नीचे क्वेरी और क्वेरी प्लान आउटपुट है।
मेरी तालिका लेआउट:
Table "public.energy_energyentry"
Column | Type | Modifiers
-----------+--------------------------+-----------------------------------------------------------------
id | integer | not null default nextval('energy_energyentry_id_seq'::regclass)
prop_id | integer | not null
timestamp | timestamp with time zone | not null
value | double precision | not null
Indexes:
"energy_energyentry_pkey" PRIMARY KEY, btree (id)
"energy_energyentry_prop_id" btree (prop_id)
"energy_energyentry_prop_id_timestamp_idx" btree (prop_id, "timestamp")
Foreign-key constraints:
"energy_energyentry_prop_id_fkey" FOREIGN KEY (prop_id) REFERENCES gateway_peripheralproperty(id) DEFERRABLE INITIALLY DEFERRED
डेटा 2012-01-01 से लेकर अब तक, नए डेटा के साथ लगातार जोड़ा जा रहा है। prop_id
समान रूप से वितरित विदेशी कुंजी में लगभग 2.2k अलग-अलग मूल्य हैं ।
मुझे लगता है कि पंक्ति का अनुमान बहुत दूर नहीं है, लेकिन लागत का अनुमान कारक 4x से बड़ा लगता है। यह शायद एक मुद्दा नहीं है, लेकिन क्या मैं इसके बारे में कुछ भी कर सकता हूं?
मुझे उम्मीद है कि डिस्क का उपयोग मुद्दा हो सकता है, क्योंकि मेज हर समय स्मृति में नहीं है।
EXPLAIN ANALYZE
SELECT SUM("value")
FROM "energy_energyentry"
WHERE
"prop_id"=82411
AND "timestamp">'2014-06-11'
AND "timestamp"<'2014-11-11'
;
Aggregate (cost=214481.45..214481.46 rows=1 width=8) (actual time=51504.814..51504.814 rows=1 loops=1) -> Index Scan using energy_energyentry_prop_id_timestamp_idx on energy_energyentry (cost=0.00..214434.08 rows=18947 width=8) (actual time=136.030..51488.321 rows=13578 loops=1) Index Cond: ((prop_id = 82411) AND ("timestamp" > '2014-06-11 00:00:00+00'::timestamp with time zone) AND ("timestamp" < '2014-11-11 00:00:00+00'::timestamp with time zone)) Total runtime: 51504.841 ms
किसी भी सुझाव यह कैसे तेजी से बनाने के लिए?
मैं भी सिर्फ सुनने के साथ ठीक हूँ मैं कुछ भी अजीब नहीं था।
prop_time_idx
, फिर भी तालिका परिभाषा दिखाता है entry_prop_id_timestamp_idx
। क्या यह वही सूचकांक है? कृपया ठीक करें।
prop
)? यदि बस एक छोटा सा प्रतिशत, शायद एक सूचकांक ("timestamp", prop)
बेहतर होगा। एक ही अग्रणी स्तंभ ( prop
आपके मामले में) के साथ कई सूचकांक भी अक्सर बेमानी होते हैं।