ज़िप प्रारूप की बाहरी फ़ाइल विशेषता


25

यह थोड़ा विदेशी सवाल है, लेकिन इस बारे में नेट पर ज्यादा जानकारी नहीं है। मैंने अभी ज़िप प्रारूप की बाहरी फ़ाइल विशेषता के बारे में एक प्रश्न का उत्तर जोड़ा है । जैसा कि आप मेरे जवाब से देख सकते हैं, मैं यह निष्कर्ष निकालता हूं कि केवल दूसरी बाइट (4 बाइट्स) वास्तव में यूनिक्स के लिए उपयोग की जाती है। जाहिरा तौर पर इसमें पर्याप्त जानकारी शामिल होती है जब यह हटाने के लिए कि क्या वस्तु एक फाइल या एक निर्देशिका है, और अन्य अनुमति और विशेषता जानकारी के लिए भी जगह है। मेरा सवाल है, यह नक्शा सामान्य यूनिक्स अनुमतियों के लिए कैसा है? क्या सामान्य यूनिक्स अनुमतियाँ (जैसे नीचे) lsबिल्कुल एक बाइट में फिट होती हैं, और यदि हां, तो क्या कोई लेआउट का वर्णन कर सकता है या संदर्भ दे सकता है, कृपया?

$ ls -la
total 36
drwxr-xr-x   3 faheem faheem  4096 Jun 10 01:11 .
drwxrwxrwt 136 root   root   28672 Jun 10 01:07 ..
-rw-r--r--   1 faheem faheem     0 Jun 10 01:07 a
drwxr-xr-x   2 faheem faheem  4096 Jun 10 01:07 b
lrwxrwxrwx   1 faheem faheem     1 Jun 10 01:11 c -> b

एक विशिष्ट प्रश्न पूछकर मुझे और अधिक ठोस बनाने दें। प्रति Trac पैच ऊपर मेरा उत्तर में उद्धृत, आप नीचे दिए गए अजगर के स्निपेट के साथ एक ज़िप फ़ाइल बना सकते हैं।

040755 << 16Lमूल्य अनुमति के साथ एक खाली निर्देशिका के निर्माण से मेल खाती है drwxr-xr-x। (मैंने इसका परीक्षण किया)। मैं पहचानता हूं 0755कि यह rwxr-xr-xपैटर्न से मेल खाता है , लेकिन 04बाइट का पूरा मूल्य क्या है और इसके बारे में क्या है ? मैं यह भी पहचानता हूं << 16Lकि 16 स्थानों की एक बिटवाइज़ लेफ्ट शिफ्ट से मेल खाती है, जिससे यह टॉप बाइट से दूसरे स्थान पर आ जाएगी।

def makezip1():
    import zipfile
    z = zipfile.ZipFile("foo.zip", mode = 'w')
    zfi = zipfile.ZipInfo("foo/empty/")
    zfi.external_attr = 040755 << 16L # permissions drwxr-xr-x
    z.writestr(zfi, "")
    print z.namelist()
    z.close()

संपादित करें: इस पर फिर से विचार करने पर, मुझे लगता है कि मेरा निष्कर्ष यह है कि यूनिक्स की अनुमति केवल एक बाइट के अनुरूप है, गलत हो सकता है, लेकिन मैं वर्तमान के लिए उपरोक्त रुख रखने दूंगा, क्योंकि मुझे यकीन नहीं है कि सही उत्तर क्या है।

EDIT2: मैं वास्तव में केवल 1 बाइट के अनुरूप यूनिक्स मूल्यों के बारे में गलत था। जैसा कि @ Random832 ने समझाया, यह शीर्ष दो बाइट्स के दोनों का उपयोग करता है। @ Random832 के उत्तर के अनुसार, हम 040755नीचे दी गई तालिकाओं से वांछित मूल्य का निर्माण कर सकते हैं। अर्थात्:

__S_IFDIR + S_IRUSR + S_IWUSR + S_IXUSR + S_IRGRP + S_IXGRP + S_IROTH + S_IXOTH
0040000   + 0400    + 0200    + 0100    + 0040    + 0010    + 0004    + 0001
= 40755 

यहां जोड़ 8 बेस में है


मुझे ज़िप अनुमतियों के बारे में कुछ नहीं पता है, लेकिन मुझे पता है कि पारंपरिक यूनिक्स अनुमतियां 12 बिट्स का उपयोग करती हैं, जो एक से अधिक बाइट्स हैं। शायद zip setxid और चिपचिपा के साथ परेशान नहीं करता है, लेकिन यह अभी भी 9 (rwx × ugo) छोड़ देता है।
गिल्स एसओ- बुराई को रोकें '

जवाबों:


30

0040000का पारंपरिक मूल्य है S_IFDIR, एक निर्देशिका का प्रतिनिधित्व करने वाला फ़ाइल प्रकार का ध्वज। प्रकार 16-बिट st_mode मान के शीर्ष 4 बिट्स का उपयोग करता है , 0100000नियमित फ़ाइलों के लिए मान है।

बाहरी फ़ाइल विशेषताओं के उच्च 16 बिट्स का उपयोग OS- विशिष्ट अनुमतियों के लिए किया जाता है। यूनिक्स मूल्य पारंपरिक यूनिक्स कार्यान्वयन पर समान हैं। अन्य OS अन्य मानों का उपयोग करते हैं। अलग OSes की एक किस्म में इस्तेमाल किया स्वरूपों के बारे में जानकारी सूचना ज़िप स्रोत कोड (में पाया जा सकता डाउनलोड या जैसे में डेबियन apt-get source [zip or unzip]) - प्रासंगिक फ़ाइलें हैं zipinfo.cमें unzip, और में प्लेटफ़ॉर्म-विशिष्ट फ़ाइलें zip

ये पारंपरिक रूप से अष्टक (आधार 8) में परिभाषित हैं; यह एक के साथ संख्या उपसर्ग द्वारा सी और अजगर में प्रतिनिधित्व किया है 0

इन मूल्यों को सभी में पाया जा सकता है <sys/stat.h>- 4.4BSD संस्करण के लिए लिंक । ये POSIX मानक में नहीं हैं (जो इसके बजाय परीक्षण मैक्रो को परिभाषित करता है); लेकिन एटी एंड टी यूनिक्स और बीएसडी से उत्पन्न होता है। (GNU libc / Linux में, मानों को स्वयं में __S_IFDIRआदि के रूप में परिभाषित किया गया है bits/stat.h, हालांकि कर्नेल हेडर को पढ़ना आसान हो सकता है - मान सभी जगह बहुत समान हैं।)

#define S_IFIFO  0010000  /* named pipe (fifo) */
#define S_IFCHR  0020000  /* character special */
#define S_IFDIR  0040000  /* directory */
#define S_IFBLK  0060000  /* block special */
#define S_IFREG  0100000  /* regular */
#define S_IFLNK  0120000  /* symbolic link */
#define S_IFSOCK 0140000  /* socket */

और निश्चित रूप से, अन्य 12 बिट्स अनुमतियों के लिए हैं और setuid / setgid / चिपचिपा बिट्स, उसी प्रकार के लिए हैं:

#define S_ISUID 0004000 /* set user id on execution */
#define S_ISGID 0002000 /* set group id on execution */
#define S_ISTXT 0001000 /* sticky bit */
#define S_IRWXU 0000700 /* RWX mask for owner */
#define S_IRUSR 0000400 /* R for owner */
#define S_IWUSR 0000200 /* W for owner */
#define S_IXUSR 0000100 /* X for owner */
#define S_IRWXG 0000070 /* RWX mask for group */
#define S_IRGRP 0000040 /* R for group */
#define S_IWGRP 0000020 /* W for group */
#define S_IXGRP 0000010 /* X for group */
#define S_IRWXO 0000007 /* RWX mask for other */
#define S_IROTH 0000004 /* R for other */
#define S_IWOTH 0000002 /* W for other */
#define S_IXOTH 0000001 /* X for other */
#define S_ISVTX 0001000 /* save swapped text even after use */

एक ऐतिहासिक नोट के रूप में, 01000000 के बजाय नियमित फ़ाइलों का कारण यह है कि यूनिक्स के बहुत शुरुआती संस्करणों में, 0 'छोटी' फ़ाइलों के लिए था (ये फाइल सिस्टम में अप्रत्यक्ष ब्लॉक का उपयोग नहीं करते थे) और मोड फ्लैग का उच्च बिट था 'बड़ी' फ़ाइलों के लिए सेट है जो अप्रत्यक्ष ब्लॉक का उपयोग करेगा। इस बिट का उपयोग करने वाले अन्य दो प्रकार बाद में यूनिक्स-व्युत्पन्न OSes में जुड़ गए थे, जब फाइल सिस्टम बदल गया था।

तो, लपेटने के लिए, यूनिक्स के लिए विस्तारित विशेषता क्षेत्र का समग्र लेआउट है

TTTTsstrwxrwxrwx0000000000ADVSHR
^^^^____________________________ file type as explained above
    ^^^_________________________ setuid, setgid, sticky
       ^^^^^^^^^________________ permissions
                ^^^^^^^^________ This is the "lower-middle byte" your post mentions
                        ^^^^^^^^ DOS attribute bits

@ Random832: वाह, यह प्रभावशाली तरीके से पूरा हुआ है। क्या आप यह भी बता सकते हैं कि मूल्य 040755 << 16Lका निर्माण कैसे किया जाता है? विशेष रूप से, यह किस प्रतिनिधित्व / आधार का उपयोग कर रहा है (मुझे लगता है कि संभवतः ऑक्टल ), और सबसे महत्वपूर्ण बात यह है कि भाषा (इस मामले में पायथन दुभाषिया) को कैसे पता चलता है कि प्रतिनिधित्व क्या है? हम्म, शायद सी कोड में प्रकार घोषित किया गया है। इसके अलावा, आप किस फ़ाइल से "फ़ाइल प्रकार" मान प्राप्त कर रहे हैं? कुछ लिंक / संदर्भ जोड़ना सहायक होगा।
फहीम मीठा

@ Random832: मुझे लगता है कि zipinfo.cमें है डेबियन पर unzip के लिए स्रोत । वैकल्पिक रूप से एक और अधिक सुविधाजनक उपयोग कर सकते हैं apt-get source unzip। आप इसे अपने उत्तर में जोड़ सकते हैं, या एक स्रोत का उपयोग नहीं कर सकते हैं। मैं आमतौर पर डेबियन को उद्धृत करता हूं क्योंकि मुझे विश्वास है कि वे लंबी दौड़ के लिए चारों ओर होंगे। :-)
फहीम मीठा

@ Random832: ठीक है, मुझे लगता है कि मैं देखता हूं कि यह कैसे काम करता है। आप बस अपनी तालिका के अनुसार आधार 8 में निर्धारित चीजों के लिए सभी मूल्यों को जोड़ते हैं, और आपको नंबर मिलता है 040755। यह उन लोगों के लिए उल्लेख करने के लायक होगा जो नहीं जानते हैं या भूल गए हैं। बेशक, यह अभी भी इस सवाल को छोड़ देता है कि यह कैसे जानता है कि यह आधार 8 है, लेकिन शायद प्रकार को आधार के रूप में 8 घोषित किया गया है
फहीम मीठा

यह आधार 8 है क्योंकि यह 0. से शुरू होता है। मैं स्पष्ट करूँगा कि एक संपादन में
यादृच्छिक 832

@ रैंडम: स्पष्टीकरण के लिए धन्यवाद। मुझे अग्रणी 0 सम्मेलन के बारे में पता नहीं था। stat.hलिनक्स पर फ़ाइल (मैं सही फ़ाइल है संभालने हूँ /usr/include/sys/stat.h) फ़ाइल से लिंक के रूप में इस तरह के एक स्पष्ट तरीके से इन स्थिरांक की परिभाषा शामिल नहीं है। क्या वे कहीं और छिपे हैं? मैं देखता हूं कि आपने इस शब्द का इस्तेमाल किया है test macros, लेकिन मुझे यकीन नहीं है कि इसका क्या मतलब है।
फहीम मीठा
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.