क्या समान फ़ाइलों को खोजने का कोई तरीका है (डुप्लिकेट नहीं)?


12

मेरा अंतिम लक्ष्य मेरे सहकर्मियों द्वारा लिखे गए कोड को फिर से भरना है। तो, क्या कोई ऐसा उपकरण है जो केवल कुछ शब्दों में फाइलों को अलग कर सकता है?

(संपादित करें: यह एक मैक के लिए है, लेकिन अन्य गैर-मैक उत्तर भी पसंद कर सकते हैं।)


@ गृहण, संशोधन इतिहास को देखते हुए , मुझे लगता है कि आपने एक विंडोज उत्तर पोस्ट किया था, जिसे डाउनवोट किया गया था क्योंकि तब केवल मैक की आवश्यकता उभरती थी? मैं बल्कि मैक आवश्यकता को गिरा दिया है और अपना जवाब (यदि यह एक अच्छा गैर मैक जवाब था) के रूप में अच्छी तरह से देखना होगा!
अर्जन

@ अर्जन: हो गया।

एक मैक के लिए, मुझे आश्चर्य है कि क्या स्पॉटलाइट का उपयोग किया जा सकता है। मुझे इसमें संदेह है, लेकिन यदि आप स्पॉटलाइट में चीजों को करने का एक तरीका जानते हैं, तो mdfindकमांड चीजों को स्वचालित करने के लिए कुछ स्क्रिप्ट लिखने में मदद कर सकती है। हालांकि, मुझे लगता है कि यह हमेशा केवल मेटा डेटा का उपयोग करेगा। इसलिए समान फ़ाइलों को खोजने से फ़ाइल प्रकार पर सीमा हो सकती है, लेकिन फ़ाइल सामग्री पर नहीं। कोई सिगार नहीं।
अर्जन

जवाबों:


5

सिमीयन कुछ भाषाओं के स्रोत कोड के लिए ऐसा करता है। यह ब्लोटेंट कॉपी-एन-पेस्ट कोडिंग खोजने में सबसे अच्छा है। इसके घटनाक्रम रुक गए हैं, लेकिन यह काफी अच्छा काम करता है।


बहुत समान partials यह केवल कहा की एक बहुत कुछ के साथ रेल अनुप्रयोग में, मैं development.log में इसी तरह की लाइनों है कि - बहुत ज्यादा मदद नहीं की
टीआईजी

क्या आपने इसे विश्लेषण करने के लिए सही फाइलें दीं? आप शायद अपने स्रोतों की परवाह करते हैं, नहीं development.log। रेल के लिए Flay पर एक नजर है rubyforge.org/frs/...
बेंजामिन Bannier

हाँ, मैंने इसे सभी फाइलों को रेल ऐप डीआईआर
टाइग

2

(विंडोज के लिए)

एंटी-ट्विन (निजी उपयोग के लिए मुफ्त) उत्पाद ऐसा करने में सक्षम होने का दावा करता है:

यदि आप एंटी-ट्विन चाहते हैं कि न केवल पूर्ण डुप्लिकेट की खोज करें, बल्कि इसी तरह की फाइलों के लिए भी, आप वांछित न्यूनतम मैच को 100% के डिफ़ॉल्ट मान से घटाकर 60% तक कर सकते हैं। यह फ़ंक्शन विशेष रूप से लगभग समान फ़ाइलों की खोज के लिए डिज़ाइन किया गया है जहां केवल एक छोटे से विवरण को बदल दिया गया था। एंटी-ट्विन 100% से नीचे मूल्य दर्ज करते ही समानता खोज का उपयोग करता है। समानता की तुलना 100% पूर्ण डुप्लिकेट खोज की तुलना में अधिक समय लेती है!

दुर्भाग्य से, बाइट-बाय-बाइट तुलना के हिस्से के रूप में समानता खोज केवल कुछ फ़ाइल प्रकारों के लिए समझ में आता है, क्योंकि एक समानता का केवल तभी पता लगाया जा सकता है जब फाइलें असंपीड़ित और अनएन्क्रिप्टेड होती हैं। असम्पीडित फाइलें उदाहरण के लिए बिना लिखे हुए पाठ (.TXT) और HTML हैं।


मैं मैक पर हूं और शराब, समानताएं या कुछ के माध्यम से कुछ चल रहा हूं, जो कि रिफैक्टिंग को आसान नहीं बनाएगा, केवल कठिन :)
tig

@tig: आपको इसे अपनी पोस्ट में निर्दिष्ट करना चाहिए। मैंने मैक टैग जोड़ा है।
harrymc

@ अर्जन: मैंने आपके अनुरोध के अनुसार इस उत्तर को हटा दिया।
१३’१०

ठीक ही तो है! [mac]टैग को फिर से हटा दिया । [osx]वैसे भी ;-)
अर्जन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.