मशीन कोड में केवल प्रिंट करने योग्य दृश्यमान ASCII वर्णों का उपयोग करके x86 / x86-64 में अलग से शाखा


14

कार्य सरल है: एक प्रोग्राम लिखें जो x86 (32-बिट) और x86-64 (64-बिट) में अलग-अलग शाखाओं का उपयोग करता है, केवल प्रिंट करने योग्य दृश्यमान ASCII वर्ण 0x21 ... 0x7e (स्पेस और डेल की अनुमति नहीं है) मशीन कोड में। ।

  • सशर्त विधानसभा की अनुमति नहीं है।
  • अनुमति नहीं में एपीआई कॉल का उपयोग करना।
  • कर्नेल-मोड (रिंग 0) कोड का उपयोग करने की अनुमति नहीं है।
  • कोड को IA-32 और x86-64 दोनों लिनक्स में या किसी अन्य संरक्षित मोड OS में अपवाद के बिना चलाना चाहिए।
  • कार्यप्रणाली को कमांड लाइन मापदंडों पर निर्भर नहीं होना चाहिए।
  • सभी निर्देश 0x21 ... 0x7e (33 ... 126 दशमलव) में केवल ASCII वर्णों का उपयोग करके मशीन कोड में एन्कोड किया जाना चाहिए। इसलिए उदा। जब तक आप स्व-संशोधित कोड का उपयोग नहीं करते, cpuidयह सीमा से बाहर है (यह 0f a2) है।
  • समान बाइनरी कोड x86 और x86-64 में चलना चाहिए, लेकिन फ़ाइल हेडर (ELF / ELF64 / etc) के रूप में अलग हो सकता है, आपको इसे फिर से इकट्ठा करने और लिंक करने की आवश्यकता हो सकती है। हालाँकि, बाइनरी कोड को बदलना नहीं चाहिए।
  • समाधान i386 के बीच सभी प्रोसेसर पर काम करना चाहिए ... कोर i7, लेकिन मुझे अधिक सीमित समाधानों में भी दिलचस्पी है।
  • कोड को 32-बिट x86 में शाखा करना चाहिए, लेकिन x86-64 में नहीं, या इसके विपरीत, लेकिन सशर्त छलांग का उपयोग करना एक आवश्यकता नहीं है (अप्रत्यक्ष कूद या कॉल भी स्वीकार किया जाता है)। शाखा लक्ष्य पता ऐसा होना चाहिए जिसमें कुछ कोड के लिए स्थान हो, कम से कम 2 बाइट्स स्पेस जिसमें एक छोटी छलांग ( jmp rel8) फिट बैठता है।

जीतने वाला उत्तर वह है जो मशीन कोड में कम से कम बाइट्स का उपयोग करता है। फ़ाइल हेडर (उदाहरण के लिए ELF / ELF64) में बाइट्स की गणना नहीं की जाती है, और शाखा के बाद कोड के किसी भी बाइट्स (परीक्षण उद्देश्यों के लिए) को न तो गिना जाता है।

कृपया अपना उत्तर ASCII, हेक्साडेसिमल बाइट्स के रूप में और टिप्पणी कोड के रूप में प्रस्तुत करें।

मेरा समाधान, 39 बाइट्स:

ASCII: fhotfhatfhitfhutfhotfhatfhitfhut_H3<$t!

हेक्साडेसिमल: 66 68 6F 74 66 68 61 74 66 68 69 74 66 68 75 74 66 68 6F 74 66 68 61 74 66 68 69 74 66 68 75 74 5F 48 33 3C 24 74 21

कोड:

; can be compiled eg. with yasm.
; yasm & ld:
; yasm -f elf64 -m amd64 -g dwarf2 x86_x86_64_branch.asm -o x86_x86_64_branch.o; ld x86_x86_64_branch.o -o x86_x86_64_branch
; yasm & gcc:
; yasm -f elf64 -m amd64 -g dwarf2 x86_x86_64_branch.asm -o x86_x86_64_branch.o; gcc -o x86_x86_64_branch x86_x86_64_branch.o

section .text
global main
extern printf

main:
    push    word 0x746f     ; 66 68 6f 74 (x86, x86-64)
    push    word 0x7461     ; 66 68 61 74 (x86, x86-64)
    push    word 0x7469     ; 66 68 69 74 (x86, x86-64)
    push    word 0x7475     ; 66 68 75 74 (x86, x86-64)

    push    word 0x746f     ; 66 68 6f 74 (x86, x86-64)
    push    word 0x7461     ; 66 68 61 74 (x86, x86-64)
    push    word 0x7469     ; 66 68 69 74 (x86, x86-64)
    push    word 0x7475     ; 66 68 75 74 (x86, x86-64)

    db      0x5f            ; x86:    pop edi
                            ; x86-64: pop rdi

    db      0x48, 0x33, 0x3c, 0x24
                            ; x86:
                            ; 48          dec eax
                            ; 33 3c 24    xor edi,[esp]

                            ; x86-64:
                            ; 48 33 3c 24 xor rdi,[rsp]

    jz      @bits_64        ; 0x74 0x21
                            ; branch only if running in 64-bit mode.

; the code golf part ends here, 39 bytes so far.

; the rest is for testing only, and does not affect the answer.

    nop
    nop
    nop
    nop
    nop
    nop
    nop
    nop
    nop
    nop
    nop
    nop
    nop
    nop
    nop
    nop
    nop
    nop
    nop
    nop
    nop
    nop
    nop
    nop
    nop
    nop
    nop
    nop
    nop
    nop
    nop

    jmp     @bits_32

@bits_64:
    db      0x55                    ; push rbp

    db      0x48, 0x89, 0xe5        ; mov rbp,rsp
    db      0x48, 0x8d, 0x3c, 0x25  ; lea rdi,
    dd      printf_msg              ; [printf_msg]
    xor     eax,eax
    mov     esi,64

    call    printf
    db      0x5d                    ; pop rbp

    NR_exit equ 60

    xor     edi,edi
    mov     eax,NR_exit     ; number of syscall (60)
    syscall

@bits_32:
    lea     edi,[printf_msg]
    mov     esi,32
    call    printf

    mov     eax,NR_exit
    int     0x80

section .data

printf_msg: db "running in %d-bit system", 0x0a, 0

1
आप वास्तव में झोंपड़ी में गर्म टोपी
मारते हैं

अच्छा लगा। अजीब, लेकिन अच्छा। चूंकि आप जीतने की स्थिति को "सबसे कम" के रूप में सेट कर रहे हैं, इसलिए मैं टैग को [कोड-गोल्फ] में बदलने जा रहा हूं और कुछ नए वर्णनात्मक टैग जोड़ूंगा। यदि आप उन्हें पसंद नहीं करते हैं, तो मुझे बताएं।
dmckee --- पूर्व-मध्यस्थ ने बिल्ली

जवाबों:


16

7 बाइट्स

0000000: 6641 2521 2173 21                        fA%!!s!

32 बिट के रूप में

00000000  6641              inc cx
00000002  2521217321        and eax,0x21732121

64 बिट के रूप में

00000000  6641252121        and ax,0x2121
00000005  7321              jnc 0x28

andकैरी फ़्लैग को साफ़ करता है ताकि 64 बिट संस्करण हमेशा कूदता रहे। 64-बिट के 6641लिए ऑपरेंड साइज ओवरराइड है जिसके बाद rex.bऑपरेंड साइज and16 बिट के रूप में सामने आता है। 32-बिट पर 6641एक पूर्ण निर्देश है, इसलिए andइसमें कोई उपसर्ग नहीं है और इसमें 32-बिट ऑपरेंड आकार है। यह andदो बाइट्स द्वारा दिए गए तत्काल बाइट्स की संख्या में परिवर्तन करता है जो केवल 64-बिट मोड में निष्पादित होते हैं।


1
1k तक पहुंचने पर बधाई।
डेविड मार्क

यह व्यवहार CPU विशिष्ट है। कुछ 64-बिट सिस्टम 64-बिट मोड में 66 उपसर्ग को अनदेखा करेंगे।
पीटर फेर्री

@peterferrie क्या आपके पास इसके लिए एक संदर्भ है? मेरा पढ़ना यह है कि REX.W सेट होने पर एक 66h उपसर्ग को नजरअंदाज कर दिया जाता है लेकिन इसमें केवल REX.B होता है
Geoff Reedy

माफ करना, मैं गलत हूं। यह केवल ट्रांसफर-इन-कंट्रोल है जो उस तरह से प्रभावित होता है (जैसे 66 ई 8 इंटेल पर 16-बिट आईपी पर स्विच नहीं करता है)।
पीटर फेर्री

7

11 बाइट्स

ascii: j6Xj3AX,3t!
hex: 6a 36 58 6a 33 41 58 2c 33 74 21

इस तथ्य का उपयोग करता है कि 32-बिट में, 0x41 बस है inc %ecx, जबकि 64-बिट में यह raxउपसर्ग है जो निम्न popनिर्देश के लक्ष्य रजिस्टर को संशोधित करता है ।

        .globl _check64
_check64:
        .byte   0x6a, 0x36      # push $0x36
        .byte   0x58            # pop %rax
        .byte   0x6a, 0x33      # push $0x33

        # this is either "inc %ecx; pop %eax" in 32-bit, or "pop %r8" in 64-bit.
        # so in 32-bit it sets eax to 0x33, in 64-bit it leaves rax unchanged at 0x36.
        .byte   0x41            # 32: "inc %ecx", 64: "rax prefix"
        .byte   0x58            # 32: "pop %eax", 64: "pop %r8"

        .byte   0x2c, 0x33      # sub $0x33,%al
        .byte   0x74, 0x21      # je (branches if 32 bit)

        mov     $1,%eax
        ret

        nop
        nop
        nop
        nop
        nop
        nop
        nop
        nop
        nop
        nop
        nop
        nop
        nop
        nop
        nop
        nop
        nop
        nop
        nop
        nop
        nop
        nop
        nop
        nop
        nop
        nop
        nop
        mov     $0,%eax
        ret

OSX पर लिखा, आपका कोडांतरक अलग हो सकता है।

इसे इसके साथ कॉल करें:

#include <stdio.h>
extern int check64(void);
int main(int argc, char *argv[]) {
  if (check64()) {
    printf("64-bit\n");
  } else {
    printf("32-bit\n");
  }
  return 0;
}

2

7 बाइट्स

66 उपसर्ग पर निर्भर नहीं।

$$@$Au!

32-बिट:

00000000 24 24 and al,24h
00000002 40    inc eax
00000003 24 41 and al,41h
00000005 75 21 jne 00000028h

INC के बाद AL का बिट 0 सेट होगा, दूसरा और इसे संरक्षित करेगा, शाखा ली जाएगी।

64-बिट:

00000000 24 24    and al,24h
00000002 40 24 41 and al,41h
00000005 75 21    jne 00000028h

AL में पहले के बाद बिट 0 स्पष्ट होगा, शाखा नहीं ली जाएगी।


0

यदि केवल C9h प्रिंट करने योग्य थे ...

32-बिट:

00000000 33 C9 xor  ecx, ecx
00000002 63 C9 arpl ecx, ecx
00000004 74 21 je   00000027h

ARPL Z ध्वज को साफ़ करेगा, जिससे शाखा को लिया जाएगा।

64-बिट:

00000000 33 C9 xor    ecx, ecx
00000002 63 C9 movsxd ecx, ecx
00000004 74 21 je     00000027h

XOR Z ध्वज सेट करेगा, MOVSXD इसे नहीं बदलेगा, शाखा नहीं ली जाएगी।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.