텍스트와 바이너리(2진수)를 양방향으로 변환합니다. UTF-8과 ASCII 인코딩, 비트 그룹화 및 구분자를 자유롭게 선택할 수 있으며 한글과 이모지를 지원합니다.
문자 수: 5
UTF-8 바이트: 15
출력 길이: 134
| 문자 | 10진수 | 바이너리 (8비트) |
|---|---|---|
| A | 65 | 01000001 |
| Z | 90 | 01011010 |
| a | 97 | 01100001 |
| z | 122 | 01111010 |
| 0 | 48 | 00110000 |
| 9 | 57 | 00111001 |
| (공백) | 32 | 00100000 |
| ! | 33 | 00100001 |
| ? | 63 | 00111111 |
| (줄 바꿈) | 10 | 00001010 |
자주 묻는 질문
텍스트에서 바이너리로 변환은 어떻게 작동하나요?
텍스트의 각 문자에는 숫자 코드(코드 포인트)가 있습니다. ASCII 문자는 7비트에 들어가며 앞에 0을 붙여 8비트로 패딩됩니다. 예를 들어
A는 코드 65이고 바이너리로는 01000001입니다. 변환기는 각 문자를 읽고 코드를 조회한 뒤 바이트 단위로 바이너리 표현을 출력합니다. 한국어 같은 비-ASCII 문자는 UTF-8에서 여러 바이트로 인코딩됩니다.ASCII와 UTF-8의 차이는 무엇인가요?
ASCII는 영문자, 숫자, 기호 등 128개 문자를 다루며 문자당 7비트(보통 8비트로 패딩)를 사용합니다. UTF-8은 가변 길이 인코딩으로 한글, 중국어, 아랍어, 이모지 등 전 세계 모든 문자를 1~4바이트로 표현합니다. ASCII 문자는 UTF-8에서도 동일한 1바이트입니다. 한글은 ASCII에 포함되지 않으므로 UTF-8을 반드시 사용해야 합니다. 특별히 ASCII 호환성이 필요한 경우가 아니라면 UTF-8을 권장합니다.
바이너리 디코딩이 실패하는 이유는 무엇인가요?
주요 원인: (1) 비트 그룹이 8비트(또는 7비트) 길이가 아님 — 불필요한 공백을 확인하세요. (2) 0과 1 이외의 문자가 포함됨. (3) 불완전한 UTF-8 시퀀스. 디코더는 첫 번째 오류 위치를 알려주므로 쉽게 수정할 수 있습니다. 입력에 구분자가 없다면 "비트 그룹화"를 8로, "구분자"를 "없음"으로 설정하세요. 한글이 깨져 보인다면 EUC-KR로 인코딩된 데이터일 가능성이 있는데, 이 변환기는 UTF-8 전용입니다.
문자당 몇 비트를 사용해야 하나요?
표준 관행은 바이트당 8비트입니다. 순수 ASCII는 7비트로도 충분하지만, 저장 데이터와 네트워크 프로토콜은 항상 8비트로 패딩합니다. 7비트 모드는 옛 텔레타이프 프로토콜이나 정보처리기사 시험 같은 학습 목적에서만 사용하세요. 한글, 한자, 이모지 같은 비-ASCII 문자는 UTF-8 멀티바이트가 필요하므로 7비트 그룹화가 적용되지 않습니다.
한국어나 이모지를 변환할 수 있나요?
네 — 인코딩을 UTF-8로 두면 됩니다. 한글 한 글자는 UTF-8에서 3바이트를 차지합니다. 예:
한 = 11101101 10010101 10011100 (3바이트). 안녕은 6바이트입니다. 이모지는 보통 4바이트(예: 😀 = 4바이트)이며, 이모지 + 변형 선택자 조합은 더 길어질 수 있습니다. ASCII 모드는 0~127 범위를 벗어나는 문자를 모두 거부하므로 한글에는 사용할 수 없습니다.바이너리는 기계어와 같나요?
아닙니다. 바이너리는 단순히 0과 1 두 개의 숫자를 사용하는 2진법(base 2)일 뿐입니다. 기계어(machine code)는 특정 CPU 명령을 바이너리로 표현한 것으로, 프로세서별로 인코딩이 다릅니다. 이 변환기에서 보는 바이너리는 텍스트를 바이트로 인코딩한 것이지 실행 가능한 명령이 아닙니다. 둘 다 0과 1을 사용하기 때문에 일상에서 "바이너리"라는 단어가 "컴퓨터가 다루는 형식"이라는 의미로 쓰이곤 합니다.
바이너리를 텍스트로 어떻게 되돌리나요?
"바이너리 → 텍스트" 탭으로 전환하고 바이너리를 붙여넣으세요. 디코더는 입력을 구분자(기본값: 공백)로 나눠 바이트 단위로 분할하고, 각 그룹을 2진수에서 10진수 코드 포인트로 변환한 뒤 결과를 조립합니다. UTF-8의 경우 멀티바이트 시퀀스를 정확히 이어 붙여 한글이나 이모지 같은 문자를 복원합니다.
모든 변환은 브라우저 안에서 이루어집니다. 외부로 전송되지 않습니다.
텍스트의 각 문자는 고유한 숫자 코드(코드 포인트)를 가지며, 이를 0과 1로 표현한 것이 바이너리입니다. ASCII 문자(영문자·숫자·기호)는 7비트로 표현되어 보통 앞에 0을 붙여 8비트 1바이트로 저장됩니다. 예를 들어 ‘A’는 65, 바이너리로는 01000001입니다. 한글은 ASCII에 포함되지 않으므로 UTF-8 인코딩이 필수이며, 한 글자당 3바이트를 차지합니다. 예: ‘한’ = 11101101 10010101 10011100. 이모지는 보통 4바이트입니다. 본 변환기는 양방향 동작을 지원합니다. ‘텍스트 → 바이너리’ 모드에서는 입력한 문자열을 코드 포인트로 변환한 뒤 2진수 시퀀스로 출력하고, ‘바이너리 → 텍스트’ 모드에서는 바이너리 입력을 바이트 단위로 분할해 원래 문자로 복원합니다. 비트 그룹화(8/7/없음)와 구분자(공백·하이픈·파이프·없음)를 옵션에서 선택할 수 있어 학교 과제, 정보처리기사 시험, 코딩 부트캠프, 디버깅 등 다양한 용도에 맞춥니다. EUC-KR로 인코딩된 데이터는 호환되지 않으니 UTF-8을 사용하세요. 모든 처리는 브라우저 안에서 이루어지며 입력은 외부로 전송되지 않습니다.