(공감과 댓글 하나는 글쓴이에게 큰 힘이 됩니다.)
문자 인코딩(Character Encoding)이란 문자나 기호들의 집합을 컴퓨터에 저장하거나 사용할 목적으로 부호화하는 방법을 말한다. 자바(Java)는 유니코드(Unicode)에 기반하여 문자를 표현한다.
■ 아스키(ASCII)
- bit(비트) 문자 인코딩으로 0(0x00) ~ 127(0x7F)까지 총 128개의 부호가 사용
- 영문 키보드로 입력할 수 있는 모든 기호들이 할당되어 있는 부호 체계
- 한글과 같은 2바이트 이상의 코드를 표현 불가능
■ ANSI
- 영어 이외의 문자를 표현하기 위해 사용
- 2바이트 문자와 1바이트 ASCII 문자를 혼용하는 가변길이 인코딩
- 한글은 표현되지만 더 많은 문자들을 인코딩하지는 못함
■ Unicode
- 전 세계의 모든 문자를 일관되게 표현할 수 있도록 설계된 산업 표준
- 모든 글자를 2바이트로 표현
- 자바(Java)에서 사용하는 방식
■ UTF-8
- 유니코드 인코딩 중에 하나로 문자열을 8Bit 기반으로 저장
- ANSI 문자는 그대로, 아시아 문자는 3바이트로 가변 표기
■ UTF-16
- 문자열을 16Bit 기반으로 저장
- 한글을 2바이트로 저장할 수 있어서 영어와 한글을 함께 처리할 경우 편리
- ANSI와 호환이 안된다는 단점
'Java' 카테고리의 다른 글
자바(JAVA) 자료형 변환 (0) | 2020.06.18 |
---|---|
자바(Java) 상수 (0) | 2020.06.18 |
자바(Java) 변수 (0) | 2020.06.17 |
자바(Java) 정수, 실수의 표현방식 (0) | 2020.06.17 |
2진수(Binary), 8진수(Octal), 16진수(Hex) (0) | 2020.06.16 |