संपादित करें:
क्षमा याचना के साथ, मुझे अपने दावे को वापस लेने की आवश्यकता है कि स्वीकृत उत्तर हमेशा सही नहीं होता है - यह बताता है कि दृश्य हमेशा एक ही चीज़ के समान होता है जिसे उपश्रेणी के रूप में लिखा जाता है। मुझे लगता है कि यह निर्विवाद है, और मुझे लगता है कि मुझे अब पता है कि मेरे मामले में क्या हो रहा है।
मुझे अब यह भी लगता है कि मूल प्रश्न का बेहतर उत्तर है।
मूल प्रश्न यह है कि क्या विचारों का उपयोग करने के लिए मार्गदर्शक अभ्यास होना चाहिए (उदाहरण के लिए, उदाहरण के लिए, SQL को रूटीन में दोहराते हुए जिसे दो या अधिक बार बनाए रखने की आवश्यकता हो सकती है)।
मेरा उत्तर यह होगा कि "यदि आपकी क्वेरी विंडो फ़ंक्शंस या किसी और चीज़ का उपयोग करती है, जो ऑप्टिमाइज़र को क्वेरी के इलाज के लिए अलग-अलग तरीके से पेश करती है, जब यह एक सबक्विरी बन जाती है, क्योंकि सबक्विरी बनाने का बहुत कार्य (चाहे वह दृश्य के रूप में प्रस्तुत किया गया हो या नहीं) प्रदर्शन को कम कर सकता है यदि आप रनटाइम पर मापदंडों के साथ फ़िल्टर कर रहे हैं।
मेरे विंडो फ़ंक्शन की जटिलता अनावश्यक है। इसके लिए व्याख्या योजना:
SELECT DISTINCT ts.train_service_key,
pc.assembly_key,
count(*) OVER
(PARTITION BY ts.train_service_key) AS train_records
FROM staging.train_service ts
JOIN staging.portion_consist pc
USING (ds_code, train_service_key)
WHERE assembly_key = '185132';
इस से बहुत कम महंगा है:
SELECT *
FROM (SELECT DISTINCT ts.train_service_key,
pc.assembly_key,
count(*) OVER
(PARTITION BY ts.train_service_key) AS train_records
FROM staging.train_service ts
JOIN staging.portion_consist pc
USING (ds_code, train_service_key)) AS query
WHERE assembly_key = '185132';
उम्मीद है कि थोड़ा और अधिक विशिष्ट और उपयोगी है।
मेरे हाल के अनुभव (मुझे इस सवाल को खोजने के लिए) के कारण, ऊपर दिया गया स्वीकृत उत्तर सभी परिस्थितियों में सही नहीं है। मेरे पास अपेक्षाकृत सरल क्वेरी है जिसमें एक विंडो फ़ंक्शन शामिल है:
SELECT DISTINCT ts.train_service_key,
pc.assembly_key,
dense_rank() OVER (PARTITION BY ts.train_service_key
ORDER BY pc.through_idx DESC, pc.first_portion ASC,
((CASE WHEN (NOT ts.primary_direction)
THEN '-1' :: INTEGER
ELSE 1
END) * pc.first_seq)) AS coach_block_idx
FROM (staging.train_service ts
JOIN staging.portion_consist pc USING (ds_code, train_service_key))
अगर मैं यह फ़िल्टर जोड़ूँ:
where assembly_key = '185132'
मेरे द्वारा समझाई गई योजना इस प्रकार है:
QUERY PLAN
Unique (cost=11562.66..11568.77 rows=814 width=43)
-> Sort (cost=11562.66..11564.70 rows=814 width=43)
Sort Key: ts.train_service_key, (dense_rank() OVER (?))
-> WindowAgg (cost=11500.92..11523.31 rows=814 width=43)
-> Sort (cost=11500.92..11502.96 rows=814 width=35)
Sort Key: ts.train_service_key, pc.through_idx DESC, pc.first_portion, ((CASE WHEN (NOT ts.primary_direction) THEN '-1'::integer ELSE 1 END * pc.first_seq))
-> Nested Loop (cost=20.39..11461.57 rows=814 width=35)
-> Bitmap Heap Scan on portion_consist pc (cost=19.97..3370.39 rows=973 width=38)
Recheck Cond: (assembly_key = '185132'::text)
-> Bitmap Index Scan on portion_consist_assembly_key_index (cost=0.00..19.72 rows=973 width=0)
Index Cond: (assembly_key = '185132'::text)
-> Index Scan using train_service_pk on train_service ts (cost=0.43..8.30 rows=1 width=21)
Index Cond: ((ds_code = pc.ds_code) AND (train_service_key = pc.train_service_key))
यह ट्रेन सेवा तालिका पर प्राथमिक कुंजी सूचकांक और part_consist तालिका पर एक गैर-अद्वितीय सूचकांक का उपयोग कर रहा है। यह 90ms में निष्पादित होता है।
मैंने एक दृश्य बनाया (इसे यहां चिपकाना बिल्कुल स्पष्ट है लेकिन यह वस्तुतः एक दृश्य में प्रश्न है):
CREATE OR REPLACE VIEW staging.v_unit_coach_block AS
SELECT DISTINCT ts.train_service_key,
pc.assembly_key,
dense_rank() OVER (PARTITION BY ts.train_service_key
ORDER BY pc.through_idx DESC, pc.first_portion ASC, (
(CASE
WHEN (NOT ts.primary_direction)
THEN '-1' :: INTEGER
ELSE 1
END) * pc.first_seq)) AS coach_block_idx
FROM (staging.train_service ts
JOIN staging.portion_consist pc USING (ds_code, train_service_key))
जब मैं इस दृश्य को समान फ़िल्टर से क्वेरी करता हूं:
select * from staging.v_unit_coach_block
where assembly_key = '185132';
यह व्याख्या योजना है:
QUERY PLAN
Subquery Scan on v_unit_coach_block (cost=494217.13..508955.10 rows=3275 width=31)
Filter: (v_unit_coach_block.assembly_key = '185132'::text)
-> Unique (cost=494217.13..500767.34 rows=655021 width=43)
-> Sort (cost=494217.13..495854.68 rows=655021 width=43)
Sort Key: ts.train_service_key, pc.assembly_key, (dense_rank() OVER (?))
-> WindowAgg (cost=392772.16..410785.23 rows=655021 width=43)
-> Sort (cost=392772.16..394409.71 rows=655021 width=35)
Sort Key: ts.train_service_key, pc.through_idx DESC, pc.first_portion, ((CASE WHEN (NOT ts.primary_direction) THEN '-1'::integer ELSE 1 END * pc.first_seq))
-> Hash Join (cost=89947.40..311580.26 rows=655021 width=35)
Hash Cond: ((pc.ds_code = ts.ds_code) AND (pc.train_service_key = ts.train_service_key))
-> Seq Scan on portion_consist pc (cost=0.00..39867.86 rows=782786 width=38)
-> Hash (cost=65935.36..65935.36 rows=1151136 width=21)
-> Seq Scan on train_service ts (cost=0.00..65935.36 rows=1151136 width=21)
यह दोनों तालिकाओं पर पूर्ण स्कैन कर रहा है और 17s लेता है।
जब तक मैं इस पार आया, मैं उदारता से पोस्टग्रेसीक्यूएल के साथ विचारों का उपयोग कर रहा हूं (स्वीकार किए गए उत्तर में व्यापक रूप से रखे गए विचारों को समझा है)। यदि मुझे पूर्व-समुच्चय फ़िल्टरिंग की आवश्यकता है, तो मैं विशेष रूप से उन दृश्यों का उपयोग करने से बचूँगा, जिनके लिए मैं सेट-रिटर्न फ़ंक्शन का उपयोग करूँगा।
मुझे यह भी पता है कि PostgreSQL में CTE का कड़ाई से डिजाइन द्वारा अलग-अलग मूल्यांकन किया जाता है, इसलिए मैं उन्हें उसी तरह से उपयोग नहीं करता हूं जैसे मैं SQL सर्वर के साथ करता हूं, उदाहरण के लिए, जहां वे उपश्रेणी के रूप में अनुकूलित होने लगते हैं।
मेरा जवाब, इसलिए, ऐसे उदाहरण हैं, जिसमें दृश्य बिल्कुल वैसा प्रदर्शन नहीं करते हैं, जिस पर वे आधारित हैं, इसलिए सावधानी बरतने की सलाह दी जाती है। मैं PostgreSQL 9.6.6 पर आधारित Amazon Aurora का उपयोग कर रहा हूं।
SELECT * FROM my_view WHERE my_column = 'blablabla';
दूसरा जो आपके डेटा मॉडल को उपयोग करने वाले एप्लिकेशन के लिए पारदर्शी बनाने के लिए विचारों का उपयोग करने के बारे में है। पहले स्रोत आपकोWHERE my_column = 'blablabla'
व्यू डेफिनिशन के अंदर फ़िल्टर को शामिल करने के लिए इंगित करते हैं , जिसके परिणामस्वरूप यह एक बेहतर निष्पादन योजना है।