एक C प्रीप्रोसेसर बनाएँ


18

लक्ष्य सी भाषा के लिए एक प्रीप्रोसेसर बनाना है , बाइट्स में स्रोत कोड आकार के संदर्भ में जितना संभव हो उतना छोटा , अपनी पसंदीदा भाषा में। इसका इनपुट C स्रोत फ़ाइल होगा, और इसका आउटपुट पूर्व-संसाधित स्रोत कोड होगा।

जिन वस्तुओं को संसाधित करने की आवश्यकता होगी वे इस प्रकार होंगे: टिप्पणी हटाना (लाइन / ब्लॉक), # निर्देश ( संबंधित रास्तों पर फाइलें खोलकर और आवश्यक बिंदु पर पाठ को प्रतिस्थापित करके), #define, #undef, #if #elif, #else, #endif, #ifdef, #ifndef, and define ()। अन्य सी प्रीप्रोसेसर निर्देशों जैसे #pragmas या #errors को अनदेखा किया जा सकता है।

#If निर्देशों में अंकगणितीय अभिव्यक्तियों या तुलना संचालकों की गणना करने की कोई आवश्यकता नहीं है, हम मानते हैं कि अभिव्यक्ति का मूल्यांकन सही होगा जब तक कि इसमें शून्य के अलावा एक पूर्णांक होता है (इसका मुख्य उपयोग परिभाषित () निर्देश के लिए होगा)। संभावित इनपुट और आउटपुट फ़ॉलो के उदाहरण (आउटपुट फ़ाइलों में संभावित अतिरिक्त व्हाट्सएप को बेहतर उपस्थिति के लिए ट्रिम किया गया था, ऐसा करने के लिए आपके कोड की कोई आवश्यकता नहीं है)। निम्नलिखित उदाहरणों को ठीक से संसाधित करने में सक्षम कार्यक्रम को पर्याप्त माना जाएगा।

----Input file: foo.c (main file being preprocessed)

#include "bar.h" // Line may or may not exist

#ifdef NEEDS_BAZZER
#include "baz.h"
#endif // NEEDS_BAZZER

#ifdef _BAZ_H_

int main(int argc, char ** argv)
{
    /*  Main function.
        In case that bar.h defined NEEDS_BAZ as true,
        we call baz.h's macro BAZZER with the length of the
        program's argument list. */
    return BAZZER(argc);
}

#elif defined(_BAR_H_)

// In case that bar.h was included but didn't define NEEDS_BAZ.
#undef _BAR_H_
#define NEEDS_BARRER
#include "bar.h"

int main(int argc, char ** argv)
{
    return BARRER(argc);
}

#else

// In case that bar.h wasn't included at all.
int main()
{return 0;}

#endif // _BAZ_H_

----Input file bar.h (Included header)

#ifndef _BAR_H_
#define _BAR_H_

#ifdef NEEDS_BARRER

int bar(int * i)
{
    *i += 4 + *i;
    return *i;
}

#define BARRER(i) (bar(&i), i*=2, bar(&i))

#else
#define NEEDS_BAZZER // Line may or may not exist
#endif // NEEDS_BARRER

#endif // _BAR_H_

----Input file baz.h (Included header)

#ifndef _BAZ_H_
#define _BAZ_H_

int baz(int * i)
{
    *i = 4 * (*i + 2);
    return *i;
}

#define BAZZER(i) (baz(&i), i+=2, baz(&i))

#endif // _BAZ_H_

----Output file foopp.c (no edits)

int baz(int * i)
{
    *i = 4 * (*i + 2);
    return *i;
}

int main(int argc, char ** argv)
{
    return (baz(&argc), argc+=2, baz(&argc));
}

----Output file foopp2.c (with foo.c's first line removed)

int main()
{return 0;}

----Output file foopp3.c (with bar.h's line "#define NEEDS_BAZZER" removed)

int bar(int * i)
{
    *i += 4 + *i;
    return *i;
}

int main(int argc, char ** argv)
{
    return (bar(&argc), argc*=2, bar(&argc));
}

क्या आप इनपुट / आउटपुट नमूने प्रदान कर सकते हैं?
फ़्लोरेंट

हमें एक परीक्षण कोड प्रदान करें। उदाहरणों के बिना यह लगभग असंभव है।
इस्माइल मिगुएल

उह यकीन है, मैं करूँगा बस थोड़ा सा धैर्य रखें क्योंकि मैं समय और काम के बोझ के कारण बहुत तेज नहीं हो सकता।
थानिसिस पापुटीसाकिस

1
समर्थन की कितनी #ifजरूरत है? यानी प्रीप्रोसेसर को अंकगणित, बिटवाइज़ ऑपरेशंस आदि के साथ भावों का समर्थन करने की आवश्यकता है?
हस्त्कुर्कन

ठीक है, उदाहरण इनपुट / आउटपुट और आगे स्पष्टीकरण
थानिसिस पापाउटसिडाकिस

जवाबों:


8

फ्लेक्स, 1170 + 4 = 1174

फ्लेक्स कोड में 1170 वर्ण + संकलन ध्वज के लिए 4 वर्ण। एक निष्पादन योग्य उत्पादन करने के लिए, भागो flex pre.l ; gcc lex.yy.c -lflप्रविष्टि एक छलनी की तरह स्मृति को लीक करती है और इसमें शामिल फाइलें बंद नहीं होती हैं। लेकिन अन्यथा, यह कल्पना के अनुसार पूरी तरह से कार्यात्मक होना चाहिए।

%{
#define M malloc
#define X yytext
#define A a=X
#define B(x) BEGIN x;
#define Y YY_CURRENT_BUFFER
*a,*b,**v,**V,**t,**T,i,s=1,o;
g(){t=M(++s);T=M(s);for(i=1;i<s-1;i++)t[i]=v[i],T[i]=V[i];free(v);free(V);v=t;V=T;}
f(){for(i=1;i<s;i++)if(!strcmp(v[i],a))return i;return 0;}
d(y){X[yyleng-y]=0;}
%}
%x D F I
N .*\n
%%
"//".*
"/*"([^\*]|\*[^\/])*"*/"
\"(\\.|[^\\"])*\" ECHO;
^"#include "\"[^\"]*\" d(1),yypush_buffer_state(yy_create_buffer(fopen(X+10,"r"),YY_BUF_SIZE));
^"#define "[^ ]* {B(D)strcpy(a=M(yyleng),X+8);}
<D>" "?{N} {b=M(yyleng);d(1);f(strcpy(b,X+(X[0]==32)))?free(V[i]),V[i]=b:g(),v[s-1]=a,V[s-1]=b;B(0)}
^"#undef "{N} d(1),v[f(A+7)][0]=0;
^"#if defined(".*")\n" h(2,12);
^"#ifdef "{N} h(1,7);
^"#if "{N} {d(1);if(!atoi(X+4))B(F)}
^"#ifndef "{N} {d(1);if(f(A+8))B(F)}
<F>^"#if"{N} o++;
<F>^"#endif"{N} if(!o--)B(++o)
<F>^"#else"{N} if(!o)B(0)
<F>^"#elif defined(".*")\n" if(!o){d(2);if(f(A+14))B(0)}
<F>^"#elif "{N} if(!o){d(1);if(atoi(X+6))B(0)}
<F>{N}
^"#endif"{N}
^"#el"("se"|"if"){N} B(I)
<I>^"#endif"{N} B(0)
<I>{N}
[a-zA-Z_][a-zA-Z_0-9]* printf(f(A)?V[i]:a);
<<EOF>> {a=Y;yypop_buffer_state();if(!Y)exit(0);fclose(a);}
%%
h(x,y){d(x);if(!f(A+y))B(F)}

कुछ स्पष्टीकरण:

  • aऔर bइनपुट से तार पकड़ने के लिए टेम्प्स हैं। aकार्य करने के लिए पैरामीटर के रूप में भी उपयोग किया जाता है f
  • vमैक्रोज़ के नाम Vरखता है और मैक्रोज़ का 'V'alues' रखता है
  • tऔर Tकर रहे हैं 'जब हम बड़े होते हैं के लिए t'emporary धारकों vऔरV
  • i छोरों के लिए एक 'i'ncrementer है
  • s मैक्रो सरणी का 's'ize है
  • oifएक गलत स्थिति के अंदर 'o'pen s की गिनती है
  • g() मैक्रो सरणियों को 'g'rows करता है
  • f()'में एक ही मूल्य के साथ एक मैक्रो f'inds vके रूप मेंa
  • d(y)' yवर्तमान इनपुट से अंतिम वर्णों को डीऑप्र करता है
  • राज्य Dएक 'डी'फाइन के अंदर है
  • राज्य Fएक 'F'alse सशर्त की अनदेखी करने के लिए है
  • राज्य I'I'gnoring के लिए है else/ elifके बाद एक सच्चे सशर्त मिला था।

EDIT1: कई मेमोरी लीक को साफ किया और फाइल क्लोजिंग को लागू किया

EDIT2: नेस्टेड मैक्रोज़ को अधिक सही ढंग से संभालने के लिए संशोधित कोड

EDIT3: गोल्फ की पागल राशि

EDIT4: अधिक गोल्फिंग

EDIT5: अधिक गोल्फ; मैंने यह भी देखा है कि मेरे कॉल को फेकलॉज () कुछ कंप्यूटरों पर समस्या का कारण बनता है ... इस पर गौर करना।


यह ज्यादातर मामलों पर अब तक बहुत अच्छी तरह से काम करता है ... किसी कारण से जब मैं #includeसामान करता हूं तो यह एक विभाजन दोष देता है, लेकिन मुझे लगता है कि यह संपादन # 5 में बग से संबंधित है। इसके अलावा, यह मैक्रो को स्थानापन्न नहीं करता है, भले ही यह सफलतापूर्वक #if ब्लॉकों को संसाधित करता है - जब तक कि मैं कुछ गलत नहीं कर रहा हूं ... लेकिन सामान्य तौर पर यह बहुत अच्छा लगता है, और यह एक मोटा विचार देता है कि एक लेक्सर क्या कर सकता है, क्योंकि मैं इसे इसके गोल्फ के रूप में भी समझ सकता हूं। यह देखने की कोशिश करें कि क्या बग्स को ठीक किया जा सकता है, अगर यह ठीक नहीं है, जैसा कि कोड खुद को अच्छी तरह से समझाता है, शायद इसे चुना जाएगा जवाब क्योंकि कोई अन्य प्रविष्टियां नहीं हैं।
थानैसिस पापुटीसाकिस 10
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.