(공감과 댓글 하나는 글쓴이에게 큰 힘이 됩니다.)

 

문자 인코딩(Character Encoding)이란 문자나 기호들의 집합을 컴퓨터에 저장하거나 사용할 목적으로 부호화하는 방법을 말한다. 자바(Java)는 유니코드(Unicode)에 기반하여 문자를 표현한다.

 

■ 아스키(ASCII)

- bit(비트) 문자 인코딩으로 0(0x00) ~ 127(0x7F)까지 총 128개의 부호가 사용

- 영문 키보드로 입력할 수 있는 모든 기호들이 할당되어 있는 부호 체계

- 한글과 같은 2바이트 이상의 코드를 표현 불가능

■ ANSI

- 영어 이외의 문자를 표현하기 위해 사용

- 2바이트 문자와 1바이트 ASCII 문자를 혼용하는 가변길이 인코딩

- 한글은 표현되지만 더 많은 문자들을 인코딩하지는 못함

 

■ Unicode

- 전 세계의 모든 문자를 일관되게 표현할 수 있도록 설계된 산업 표준

- 모든 글자를 2바이트로 표현

- 자바(Java)에서 사용하는 방식

 

■ UTF-8

- 유니코드 인코딩 중에 하나로 문자열을 8Bit 기반으로 저장

- ANSI 문자는 그대로, 아시아 문자는 3바이트로 가변 표기

 

■ UTF-16

- 문자열을 16Bit 기반으로 저장

- 한글을 2바이트로 저장할 수 있어서 영어와 한글을 함께 처리할 경우 편리

- ANSI와 호환이 안된다는 단점

'Java' 카테고리의 다른 글

자바(JAVA) 자료형 변환  (0) 2020.06.18
자바(Java) 상수  (0) 2020.06.18
자바(Java) 변수  (0) 2020.06.17
자바(Java) 정수, 실수의 표현방식  (0) 2020.06.17
2진수(Binary), 8진수(Octal), 16진수(Hex)  (0) 2020.06.16

+ Recent posts