आप एक स्क्रिप्ट लिख सकते हैं जो कॉल करता है file
, और उन मामलों की जांच करने के लिए केस-स्टेटमेंट का उपयोग करें, जिनमें आप रुचि रखते हैं।
उदाहरण के लिए
#!/bin/sh
case $(file "$1") in
(*script*|*\ text|*\ text\ *)
echo text
;;
(*)
echo binary
;;
esac
हालांकि निश्चित रूप से कई विशेष मामले हो सकते हैं जो कि रुचि के हों। बस की strings
एक प्रति पर जाँच libmagic
, मैं लगभग 200 मामलों को देखता हूं, जैसे,
Konqueror cookie text
Korn shell script text executable
LaTeX 2e document text
LaTeX document text
Linux Software Map entry text
Linux Software Map entry text (new format)
Linux kernel symbol map text
Lisp/Scheme program text
Lua script text executable
LyX document text
M3U playlist text
M4 macro processor script text
कुछ स्ट्रिंग "टेक्स्ट" का उपयोग एक अलग प्रकार के भाग के रूप में करते हैं, जैसे,
SoftQuad troff Context intermediate
SoftQuad troff Context intermediate for AT&T 495 laser printer
SoftQuad troff Context intermediate for HP LaserJet
इसी तरह script
एक शब्द का हिस्सा हो सकता है, लेकिन मुझे इस मामले में कोई समस्या नहीं है। लेकिन एक स्क्रिप्ट के लिए जाँच करनी चाहिए "text"
एक के रूप में शब्द , न कि एक -स्ट्रिंग ।
अनुस्मारक के रूप में, file
आउटपुट एक सटीक विवरण का उपयोग नहीं करता है जिसमें हमेशा "स्क्रिप्ट" या "पाठ" होगा। विशेष मामलों पर विचार करने के लिए कुछ कर रहे हैं। एक फॉलोअप ने टिप्पणी की कि यह --mime-type
कार्य .svg
फाइलों के लिए नहीं होगा । हालाँकि, एक परीक्षण में मैं इन परिणामों को svg-files के लिए देखता हूँ:
$ ls -l *.svg
-r--r--r-- 1 tom users 6679 Jul 26 2012 pumpkin_48x48.svg
-r--r--r-- 1 tom users 17372 Jul 30 2012 sink_48x48.svg
-r--r--r-- 1 tom users 5929 Jul 25 2012 vile_48x48.svg
-r--r--r-- 1 tom users 3553 Jul 28 2012 vile-mini.svg
$ file *.svg
pumpkin_48x48.svg: SVG Scalable Vector Graphics image
sink_48x48.svg: SVG Scalable Vector Graphics image
vile-mini.svg: SVG Scalable Vector Graphics image
vile_48x48.svg: SVG Scalable Vector Graphics image
$ file --mime-type *.svg
pumpkin_48x48.svg: image/svg+xml
sink_48x48.svg: image/svg+xml
vile-mini.svg: image/svg+xml
vile_48x48.svg: image/svg+xml
जिसे मैंने एक हजार फाइलों को देखने के बाद चुना था, माइम-टाइप आउटपुट में "टेक्स्ट" के साथ केवल 6 दिखाते हैं। तर्क से, "एसवीजी" मिलान की तुलना में, माइम-प्रकार के आउटपुट के अंत में "xml" का मिलान अधिक उपयोगी हो सकता है, कहते हैं, लेकिन एक स्क्रिप्ट का उपयोग करना जो आपको यहां दिए गए सुझाव पर वापस ले जाता है।
आउटपुट file
को किसी भी परिदृश्य में कुछ ट्यूनिंग की आवश्यकता होती है, और यह 100% विश्वसनीय नहीं है (यह मेरे कई पर्ल स्क्रिप्ट्स द्वारा भ्रमित है, उन्हें "डेटा" कहते हैं)।
के एक से अधिक कार्यान्वयन है file
। सबसे अधिक इस्तेमाल किया जाने वाला अपना काम करता हैlibmagic
, जिसका उपयोग विभिन्न कार्यक्रमों (शायद सीधे नहीं zsh
, हालांकि python
कर सकते हैं) से किया जा सकता है।
इसके अनुसार शेल, पर्ल, रूबी और पायथन के फाइल टेस्ट तुलना तालिका के , पर्ल के पास एक -T
विकल्प है जिसका उपयोग वह अपनी जानकारी प्रदान करने के लिए कर सकता है। लेकिन इसके लिए कोई तुलनीय सुविधा नहीं है zsh
।
आगे की पढाई:
file
एक मानक उपयोगिता है और फ़ाइल मैजिक को अपनी क्षमताओं के अनुसार फ़ाइल प्रकारों के निर्धारण के लिए चला सकते हैं। यह अधिकांश पाठ प्रारूपों को बता सकता है और द्विआधारी प्रारूपों पर बहुत अच्छा काम करता है। यदि आप सब करने की कोशिश कर रहे हैं, तो यह पता करें कि क्या कोई फाइल टेक्स्ट है या नहीं, यह वह कमांड है जिसमें आप रुचि रखते हैं।