एक डेटाबेस में बस मार्गों का भंडारण


16

मैंने कुछ शोध किए हैं और पाया है कि मुझे स्टॉप के अनुक्रम के रूप में एक मार्ग संग्रहीत करना चाहिए। कुछ इस तरह:

Start -> Stop A -> Stop B -> Stop C -> End

मैंने तीन तालिकाएँ बनाई हैं:

  • मार्गों
  • बंद हो जाता है
  • RouteStops

... जहां RouteStops एक जंक्शन टेबल है।

मेरे पास कुछ ऐसा है:

मार्गों

+---------+
| routeId |
+---------+
|    1    |
+---------+
|    2    |
+---------+

स्टेशनों

+-----------+------+
| stationId | Name |
+-----------+------+
|     1     |   A  |
+-----------+------+
|     2     |   B  |
+-----------+------+
|     3     |   C  |
+-----------+------+
|     4     |   D  |
+-----------+------+

RouteStations

+-------------+---------------+
| routeId(fk) | stationId(fk) |
+-------------+---------------+
|     1       |       A       |
+-------------+---------------+
|     1       |       C       |
+-------------+---------------+
|     1       |       D       |
+-------------+---------------+
|     2       |       A       |
+-------------+---------------+
|     2       |       D       |
+-------------+---------------+

मार्ग 1 से होकर जाता है

Station A -> Station C -> Station D

मार्ग 2 से होकर जाता है

Station A -> Station D

क्या यह मार्गों को संग्रहीत करने का एक अच्छा तरीका है?

विकिपीडिया के अनुसार :

[...] डेटाबेस सिस्टम पंक्तियों के किसी भी क्रम की गारंटी नहीं देता है जब तक कि कोई ORDER BYखंड निर्दिष्ट नहीं किया जाता है [...]

क्या मैं ऐसे डेटाबेस स्कीमा पर भरोसा कर सकता हूं या शायद यह अलग तरीके से किया जाना चाहिए?

यह वास्तव में मेरी विश्वविद्यालय परियोजना है, इसलिए मैं सोच रहा हूं कि क्या इस तरह के स्कीमा को सही माना जा सकता है। इस मामले में, मैं शायद केवल कई मार्गों (लगभग 3-5) और स्टेशनों (लगभग 10-15) को संग्रहीत करूंगा, प्रत्येक मार्ग में लगभग 5 स्टेशन होंगे। मुझे यह सुनकर भी खुशी होगी कि वास्तविक और बड़ी बस कंपनी के मामले में यह कैसा दिखना चाहिए।


आप सामान्य पारगमन फ़ीड विशिष्टता को देखना चाह सकते हैं ; जबकि GTFS फ़ीड को CSV फ़ाइलों के रूप में बदले जाने के लिए निर्दिष्ट किया जाता है, अनुप्रयोग अक्सर संबंधपरक डेटाबेस में GTFS को संग्रहीत और हेरफेर करते हैं।
कर्ट रश्के

3
आपका प्रश्न 'स्टॉप' और 'स्टेशन' शब्दों के बीच बदल जाता है। आपको संभवतः अपनी डोमेन शब्दावली स्पष्ट करनी चाहिए ( यानी एक नाम चुनें और उसके साथ रहें)।
टेरोसाउरोस

@ monoh_.i के पास भी इसी तरह का प्रश्न है dba.stackexchange.com/questions/19433/…। अगर आपको लगता है कि आप साझा कर सकते हैं
दृष्टि

जवाबों:


19

डेटाबेस आर्किटेक्चर के लिए अग्रणी सभी व्यावसायिक विश्लेषण के लिए, मैं नियम लिखने की सलाह देता हूं:

  • एक मार्ग में 2 या अधिक स्टेशन हैं
  • एक स्टेशन का उपयोग कई मार्गों द्वारा किया जा सकता है
  • एक मार्ग पर स्टेशन एक विशिष्ट क्रम में आते हैं

1 और 2 नियम जैसा कि आपने देखा कि कई लोगों के लिए कई रिश्ते हैं, इसलिए आपने रूटस्टेशंस बनाने के लिए सही तरीके से निष्कर्ष निकाला है।

तीसरा नियम दिलचस्प है। इसका तात्पर्य है कि आवश्यकता को पूरा करने के लिए एक अतिरिक्त स्तंभ की आवश्यकता है। कहाँ जाना चाहिए? हम देख सकते हैं कि यह संपत्ति रूट और स्टेशन पर निर्भर करती है। इसलिए यह मार्गों में स्थित होना चाहिए।

मैं "stationOrder" नामक रूट रूट तालिका में एक कॉलम जोड़ूंगा।

+-------------+---------------+---------------
| routeId(fk) | stationId(fk) | StationOrder |
+-------------+---------------+---------------
|     1       |       1       |       3      |
+-------------+---------------+---------------
|     1       |       3       |       1      |
+-------------+---------------+---------------
|     1       |       4       |       2      |
+-------------+---------------+---------------
|     2       |       1       |       1      |
+-------------+---------------+---------------
|     2       |       4       |       2      |
+-------------+---------------+---------------

फिर क्वेरी करना आसान हो जाता है:

select rs.routeID,s.Name
from routeStations rs
join
Stations s
on rs.stationId=s.StationId
where rs.routeId=1
order by rs.StationOrder;

+-------------+---------------+
| routeId(fk) | stationId(fk) |
+-------------+---------------+
|     1       |       C       |
+-------------+---------------+
|     1       |       D       |
+-------------+---------------+
|     1       |       A       |
+-------------+---------------+

टिप्पणियाँ:

  1. मैंने अपने उदाहरण में रूटस्टेशंस में स्टेशनआईड तय किया। आप स्टेशननाम का उपयोग आईडी के रूप में कर रहे हैं।
  2. यदि आप रूट नाम का उपयोग नहीं करते हैं, तो आपको रूटस्टेड की आवश्यकता नहीं है क्योंकि आप रूटस्ट्रेशन से प्राप्त कर सकते हैं
  3. यहां तक ​​कि अगर आप रूट टेबल से जुड़ेंगे, तो आपका डेटाबेस ऑप्टिमाइज़र यह नोटिस करेगा कि उसे अतिरिक्त लिंक की आवश्यकता नहीं है और बस अतिरिक्त चरणों को हटा दें।

नोट 3 पर विकसित करने के लिए, मैंने उपयोग मामला बनाया है:

यह Oracle 12c Enterprise है।

ध्यान दें कि उस तालिका मार्गों के नीचे निष्पादन योजना बिल्कुल भी उपयोग नहीं की जाती है। कॉस्ट बेस ऑप्टिमाइज़र (CBO) को पता है कि यह रूटस्टेशंस की प्राथमिक कुंजी (स्टेप 5, INDEX RANGE SCAN पर ROUTESTATIONS_PK, Prateate Information 5 - access ("RS"। "ROUTEID" = 1) से सीधे प्राप्त कर सकता है)

--Table ROUTES
create sequence routeId_Seq start with 1 increment by 1 maxvalue 9999999999999 cache 1000;

CREATE TABLE routes
(
  routeId  INTEGER NOT NULL
);


ALTER TABLE routes ADD (
  CONSTRAINT routes_PK
  PRIMARY KEY
  (routeId)
  ENABLE VALIDATE);

insert into routes values (routeId_Seq.nextval);
insert into routes values (routeId_Seq.nextval);
commit;

--TABLE STATIONS  
create sequence stationId_seq start with 1 increment by 1 maxvalue 9999999999999 cache 1000;

create table stations(
   stationID INTEGER NOT NULL,
   name varchar(50) NOT NULL
);

ALTER TABLE stations ADD (
  CONSTRAINT stations_PK
  PRIMARY KEY
  (stationId)
  ENABLE VALIDATE);

insert into stations values (stationId_seq.nextval,'A');
insert into stations values (stationId_seq.nextval,'B');
insert into stations values (stationId_seq.nextval,'C');
insert into stations values (stationId_seq.nextval,'D');
commit;
--

--Table ROUTESTATIONS 
CREATE TABLE routeStations
(
  routeId       INTEGER NOT NULL,
  stationId     INTEGER NOT NULL,
  stationOrder  INTEGER NOT NULL
);


ALTER TABLE routeStations ADD (
  CONSTRAINT routeStations_PK
  PRIMARY KEY
  (routeId, stationId)
  ENABLE VALIDATE);

ALTER TABLE routeStations ADD (
  FOREIGN KEY (routeId) 
  REFERENCES ROUTES (ROUTEID)
  ENABLE VALIDATE,
  FOREIGN KEY (stationId) 
  REFERENCES STATIONS (stationId)
  ENABLE VALIDATE);

insert into routeStations values (1,1,3);
insert into routeStations values (1,3,1);
insert into routeStations values (1,4,2);
insert into routeStations values (2,1,1);
insert into routeStations values (2,4,2);
commit;

explain plan for select rs.routeID,s.Name
from ndefontenay.routeStations rs
join
ndefontenay.routes r
on r.routeId=rs.routeId
join ndefontenay.stations s
on rs.stationId=s.stationId
where rs.routeId=1
order by rs.StationOrder;

set linesize 1000
set pages 500
select * from table (dbms_xplan.display);

PLAN_TABLE_OUTPUT
----------------------------------------------------------------------------------------------------
Plan hash value: 2617709240                                                                                                                                                                                                                                                                                 

---------------------------------------------------------------------------------------------------                                                                                                                                                                                                         
| Id  | Operation                      | Name             | Rows  | Bytes | Cost (%CPU)| Time     |                                                                                                                                                                                                         
---------------------------------------------------------------------------------------------------                                                                                                                                                                                                         
|   0 | SELECT STATEMENT               |                  |     1 |    79 |     1 (100)| 00:00:01 |                                                                                                                                                                                                         
|   1 |  SORT ORDER BY                 |                  |     1 |    79 |     1 (100)| 00:00:01 |                                                                                                                                                                                                         
|   2 |   NESTED LOOPS                 |                  |       |       |            |          |                                                                                                                                                                                                         
|   3 |    NESTED LOOPS                |                  |     1 |    79 |     0   (0)| 00:00:01 |                                                                                                                                                                                                         
|   4 |     TABLE ACCESS BY INDEX ROWID| ROUTESTATIONS    |     1 |    39 |     0   (0)| 00:00:01 |                                                                                                                                                                                                         
|*  5 |      INDEX RANGE SCAN          | ROUTESTATIONS_PK |     1 |       |     0   (0)| 00:00:01 |                                                                                                                                                                                                         
|*  6 |     INDEX UNIQUE SCAN          | STATIONS_PK      |     1 |       |     0   (0)| 00:00:01 |                                                                                                                                                                                                         
|   7 |    TABLE ACCESS BY INDEX ROWID | STATIONS         |     1 |    40 |     0   (0)| 00:00:01 |                                                                                                                                                                                                         
---------------------------------------------------------------------------------------------------                                                                                                                                                                                                         

Predicate Information (identified by operation id):                                                                                                                                                                                                                                                         
---------------------------------------------------                                                                                                                                                                                                                                                         

   5 - access("RS"."ROUTEID"=1)                                                                                                                                                                                                                                                                             
   6 - access("RS"."STATIONID"="S"."STATIONID")

अब मजेदार हिस्सा है, आइए मार्ग तालिका में एक कॉलम नाम जोड़ें। अब वहाँ एक स्तंभ है जो हमें वास्तव में "मार्गों" में चाहिए। सीबीओ मार्ग 1 के लिए पंक्ति को खोजने के लिए सूचकांक का उपयोग करता है, फिर तालिका (सूचकांक पंक्ति द्वारा तालिका पहुंच) तक पहुंचता है और कॉलम "मार्गों.नाम" को पकड़ लेता है।

ALTER TABLE ROUTES
 ADD (name  VARCHAR2(50));

update routes set name='Old Town' where routeId=1;
update routes set name='North County' where routeId=2;
commit;

explain plan for select r.name as routeName,s.Name as stationName
from routeStations rs
join
routes r
on r.routeId=rs.routeId
join stations s
on rs.stationId=s.stationId
where rs.routeId=1
order by rs.StationOrder;

set linesize 500
set pages 500
select * from table (dbms_xplan.display);

PLAN_TABLE_OUTPUT                                                                                                                                                                                                                                                                                           
---------------------------------------------------------------------------------------------------
Plan hash value: 3368128430                                                                                                                                                                                                                                                                                 

----------------------------------------------------------------------------------------------------                                                                                                                                                                                                        
| Id  | Operation                       | Name             | Rows  | Bytes | Cost (%CPU)| Time     |                                                                                                                                                                                                        
----------------------------------------------------------------------------------------------------                                                                                                                                                                                                        
|   0 | SELECT STATEMENT                |                  |     1 |   119 |     1 (100)| 00:00:01 |                                                                                                                                                                                                        
|   1 |  SORT ORDER BY                  |                  |     1 |   119 |     1 (100)| 00:00:01 |                                                                                                                                                                                                        
|   2 |   NESTED LOOPS                  |                  |       |       |            |          |                                                                                                                                                                                                        
|   3 |    NESTED LOOPS                 |                  |     1 |   119 |     0   (0)| 00:00:01 |                                                                                                                                                                                                        
|   4 |     NESTED LOOPS                |                  |     1 |    79 |     0   (0)| 00:00:01 |                                                                                                                                                                                                        
|   5 |      TABLE ACCESS BY INDEX ROWID| ROUTES           |     1 |    40 |     0   (0)| 00:00:01 |                                                                                                                                                                                                        
|*  6 |       INDEX UNIQUE SCAN         | ROUTES_PK        |     1 |       |     0   (0)| 00:00:01 |                                                                                                                                                                                                        
|   7 |      TABLE ACCESS BY INDEX ROWID| ROUTESTATIONS    |     1 |    39 |     0   (0)| 00:00:01 |                                                                                                                                                                                                        
|*  8 |       INDEX RANGE SCAN          | ROUTESTATIONS_PK |     1 |       |     0   (0)| 00:00:01 |                                                                                                                                                                                                        
|*  9 |     INDEX UNIQUE SCAN           | STATIONS_PK      |     1 |       |     0   (0)| 00:00:01 |                                                                                                                                                                                                        
|  10 |    TABLE ACCESS BY INDEX ROWID  | STATIONS         |     1 |    40 |     0   (0)| 00:00:01 |                                                                                                                                                                                                        
----------------------------------------------------------------------------------------------------                                                                                                                                                                                                        

Predicate Information (identified by operation id):                                                                                                                                                                                                                                                         
---------------------------------------------------                                                                                                                                                                                                                                                         

   6 - access("R"."ROUTEID"=1)                                                                                                                                                                                                                                                                              
   8 - access("RS"."ROUTEID"=1)                                                                                                                                                                                                                                                                             
   9 - access("RS"."STATIONID"="S"."STATIONID")      

@ निकोलस। मेरे पास भी इसी तरह का सवाल है, क्या आप मेरी मदद कर सकते हैं dba.stackexchange.com/questions/194223/…
दृष्टि

3

आप सही हैं, एक संबंधपरक तालिका में रिकॉर्ड का कोई अंतर्निहित क्रम नहीं है। इसका मतलब है कि आपको प्रत्येक मार्ग के भीतर स्टेशनों के आदेश देने का कुछ स्पष्ट तरीका प्रदान करना होगा।

इस बात पर निर्भर करता है कि आप अपने डेटा को कैसे एक्सेस कर सकते हैं

  1. sequenceNumberकॉलम जोड़ेंRouteStationsस्टोर लिए , जाहिर है, प्रत्येक मार्ग में प्रत्येक स्टेशन का क्रम।
  2. nextStationIdप्रत्येक रूट के अगले स्टेशन पर "पॉइंटर" स्टोर करने के लिए कॉलम जोड़ें ।

@ mustaccio.i का भी इसी तरह का सवाल है, क्या आप मेरी मदद कर सकते हैं dba.stackexchange.com/questions/194223/…
दृष्टि

0

मैं किसी को भी इस बारे में कुछ नहीं बताता, इसलिए मुझे लगा कि मैं आपके ग्रेड के लिए जोड़ूंगा। मैं भी अपने तीन स्तंभों में रूटस्टेशंस / रूटस्टॉप्स टेबल पर एक गैर-संकुलित अद्वितीय सूचकांक (आपके RDBMS के आधार पर) रखूँगा। इस तरह आप गलतियाँ नहीं कर पाएँगे और बस अगले 2 स्टेशनों तक जाएगी। यह अपडेट के लिए कठिन बना देगा लेकिन मुझे लगता है कि अभी भी एक अच्छे डिजाइन का हिस्सा माना जाना चाहिए।


-1

मैं एक प्रोग्रामर के रूप में बोल रहा हूँ :

डेटाबेस के खिलाफ प्रश्नों के साथ रूटिंग या टाइमटेबलिंग करने के बारे में भी न सोचें (या संग्रहीत संग्रह में) यह कभी भी तेज़ नहीं होगा। ( जब तक यह सिर्फ एक "होमवर्क" समस्या नहीं है। )

यहां तक ​​कि एक एप्लिकेशन के लिए जो डेटाबेस से डेटा लोड करने में मेमोरी को डेटा प्रोसेस करता है, जब तक कि सभी डेटा स्टार्ट-अप पर लोड नहीं होता है, या डेटा को डीमोरलाइज्ड रूप में संग्रहीत नहीं किया जाता है। डेटा के डीमॉनेटाइज़ होने के बाद एक रिलेशनल डेटाबेस का उपयोग करने के लिए बहुत कम बिंदु हैं।

इसलिए मैं डेटाबेस को डेटा की "मास्टर" कॉपी होने के रूप में सोचता हूं और स्वीकार करता हूं कि मुझे इसे एप्लिकेशन मेमोरी में प्री-प्रोसेस्ड या मेम्बेस जैसे कैशिंग सर्वर में स्टोर करना होगा।

ndefontenay का उत्तर एक प्रारंभिक बिंदु के रूप में एक अच्छा टेबल डिज़ाइन देता है, लेकिन आपको यह विचार करना होगा कि मार्गों का दिन के समय के आधार पर अलग-अलग समय होता है और अक्सर समय, सप्ताह के दिन, या यहां तक ​​कि स्कूल की छुट्टियों के आधार पर अलग-अलग स्टॉप होते हैं।


5
कहीं भी वह उल्लेख नहीं करता है कि वह रूटिंग या टाइमटेबल करना चाहता है; वह पूछता है कि एक DB में मार्गों को कैसे स्टोर किया जाए । इसके अलावा, जबकि एक प्रोग्रामर को पदावनत किया जा सकता है, मुझे यकीन है कि उम्मीद है कि डेटा (डी-) होगा कुछ बिंदु पर सामान्यीकृत होगा। :)
AnoE
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.