Charset Converter 문자 인코딩 일괄 변환·통일 도구

이 도구에 대하여

여러 텍스트 파일을 한꺼번에 문자 인코딩(character encoding)을 변환하고 ZIP으로 다운로드할 수 있는 도구다. 입력 파일은 동시에 여러 개를 지정할 수 있으며, 문자 인코딩이나 줄바꿈 코드가 섞여 있어도 자동으로 판별해 통일된 형식으로 변환한다. 출력 문자 인코딩·줄바꿈 코드·BOM(Byte Order Mark, UTF 계열만)을 선택할 수 있다.
모든 처리는 브라우저 내부에서 수행되며 데이터는 전송되지 않는다.

입력 파일

드래그 앤드 드롭
.txt .csv .tsv .md .html .css .js 등의 텍스트를 여기에 놓는다
드래그 앤 드롭 외에도 ‘파일 선택’ 버튼이나 Enter 키를 사용할 수 있습니다.

변환 설정

  • BOM은 UTF-8 / UTF-16LE / UTF-16BE에만 부여할 수 있다.
  • Shift_JIS / EUC-JP / ISO-2022-JP / ISO-8859-1에는 BOM을 붙일 수 없다.

실행

진행 상황 / 로그

사용 방법과 주의 사항

  1. 상단 영역에 텍스트 파일을 여러 개 드래그 앤드 드롭한다.
  2. "변환할 문자 인코딩", "줄바꿈 코드", "BOM 추가(필요한 경우)"를 설정한다.
  3. "변환 및 ZIP 다운로드"를 누르면 일괄 변환된 ZIP을 내려받는다.

보충 설명

  • 입력 파일은 자동으로 문자 인코딩을 판별한다(BOM 우선 + 휴리스틱).
  • 각 파일의 줄바꿈 코드도 자동으로 감지해 선택한 코드로 정규화한다.
  • 바이너리 파일은 제외한다(오판을 줄이는 휴리스틱을 구현).
  • 대용량 파일은 브라우저 환경에 따라 처리 시간이 길어질 수 있다.
  • 모든 처리는 브라우저 내부에서 끝나며, 서버나 외부로 전송하지 않는다.