입력
입력 인코딩/포맷
출력 결과
출력 인코딩/포맷
🔧 깨진 한글(모지바케) 복원 도우미
잘못된 인코딩으로 깨진 텍스트를 복원해 보세요. 여러 인코딩 시나리오를 자동으로 시도합니다.
📖 인코딩 변환 & 깨진 글자 가이드
💡 문자 인코딩이란?
문자 인코딩은 문자를 숫자(바이트)로 매핑하는 규칙입니다. 컴퓨터는 모든 데이터를 숫자로 저장하므로, 문자를 표현하기 위해서는 "어떤 숫자가 어떤 문자를 나타내는지" 정의한 규칙이 필요합니다.
문제는 같은 바이트 데이터를 다른 인코딩으로 해석하면 전혀 다른 글자가 나온다는 점입니다. 이것이 바로 "깨진 글자(모지바케)" 현상의 원인입니다.
🌍 UTF-8 인코딩
UTF-8은 전 세계 대부분의 언어를 지원하는 유니코드 인코딩 방식입니다. 현재 웹 표준이며, 가장 널리 사용되는 인코딩입니다.
특징:
- 영문/숫자: 1바이트
- 한글: 3바이트
- 이모지: 4바이트
- 전 세계 모든 문자 표현 가능
🇰🇷 EUC-KR / CP949 인코딩
EUC-KR과 CP949는 과거 윈도우와 국내 환경에서 많이 사용되던 한국어 인코딩입니다.
특징:
- 한글 표현에 최적화 (2바이트)
- 구형 시스템과의 호환성
- 현재는 UTF-8로 전환 추세
- 일부 특수 문자 표현 제한
※ 이 도구는 Encoding.js 라이브러리를 사용하여 EUC-JP/Shift-JIS를 통해 유사한 동작을 구현합니다.
🔐 Base64 인코딩
Base64는 이진 데이터를 64가지 안전한 문자로 표현하는 인코딩 방식입니다.
사용 예시:
- 이메일 첨부파일 전송
- 웹에서 이미지 임베딩 (Data URL)
- JSON에 바이너리 데이터 포함
- API 토큰/키 인코딩
예시: "Hello" → "SGVsbG8="
🔗 URL 인코딩
URL 인코딩(Percent-encoding)은 URL에 안전하게 문자를 포함하기 위해 특수문자를 %HH 형태로 변환하는 방식입니다.
사용 이유:
- URL에 사용할 수 없는 문자 처리
- 공백, 한글 등 특수문자 안전하게 전송
- 쿼리 파라미터에 데이터 포함
예시: "안녕" → "%EC%95%88%EB%85%95"
😵 깨진 한글(모지바케) 복원
모지바케(文字化け)는 일본어로 "문자가 깨졌다"는 뜻으로, 잘못된 인코딩으로 글자가 깨져 보이는 현상을 말합니다.
주요 패턴:
- "촴븰" → UTF-8을 잘못 해석
- "¾ÈÇÁ" → EUC-KR을 잘못 해석
- "ìì¸" → UTF-8을 ISO-8859-1로 해석
- "ç´±åê±°" → 중첩 인코딩 오류
복원 팁: 원래 저장된 인코딩과 잘못 해석된 인코딩을 추정해서 반대로 변환해 보세요. "모지바케 복원 도우미"를 사용하면 여러 시나리오를 자동으로 시도할 수 있습니다.
⚠️ 주의사항
완전 자동 감지의 한계: 텍스트만으로 원래 인코딩을 100% 정확히 감지하는 것은 불가능합니다. 이 도구는 보조 도구로 사용하세요.
데이터 손실 가능성: 일부 문자는 특정 인코딩에서 지원하지 않아 변환 시 손실될 수 있습니다.
중요 데이터 처리: 중요한 시스템 데이터는 전문 라이브러리와 백엔드 환경에서 충분한 검증 후 작업하시기 바랍니다.
브라우저 제한: 이 도구는 브라우저에서만 동작하며, 일부 인코딩은 JavaScript 라이브러리의 제약으로 완벽하게 구현되지 않을 수 있습니다.
🚀 활용 예시
- 웹 개발: API 응답의 Base64 데이터 디코딩
- 데이터 마이그레이션: 구형 시스템(EUC-KR)에서 신형(UTF-8)로 전환
- 문제 해결: 이메일이나 메시지에서 깨진 한글 복원
- URL 처리: 한글이 포함된 URL 인코딩/디코딩
- 파일 변환: 텍스트 파일의 인코딩 변환
- 로그 분석: 다양한 인코딩의 로그 파일 읽기