티스토리 뷰

컴퓨터

ASCII 와 ANSI encoding

hehpollon 2016. 11. 9. 16:02

 - ASCII

ASCII란  미국정보교환표준부호(American Standard Code for Information Interchange) 의 줄임말입니다. 총 7비트를 사용하며 000(0x00) 부터 127(0x7F)까지 총 128개의 부호가 사용됩니다. 매우 단순하고 간단하게 구성되어 있기 때문에 어떠한 시스템에서도 쉽게 적용 가능합니다. 하지만 다른 언어는 표기 할 수 없고 오직 영문자만 표기 가능하다는 한계가 있습니다. 

총 8비트(1바이트) 중에서 7비트만 사용하는 이유는 나머지 1비트를 통신 오류 검출에 사용하기 위해서 제외하였기 때문입니다. 하지만 이제 더 이상 쓰이지 않고 ANSI encoding 으로 확장되었습니다.

 - ANSI encoding

ANSI encoding 이란 American National Standards Institude 에서 정한 인코딩(표준은 아닙니다.)으로 기존 ASCII가 다양한 언어를 표현하지 못했던 한계를 극복하기 위해 ASCII의 여분의 1비트를 사용하여 다양한 언어 표현이 가능합니다. ASCII와 다르게 ANSI encoding은 한개의 코드 페이지를 가지고 있는 것이 아니라 언어별로 다른 코드 페이지를 가지고 있습니다. 예를 들어 한국어는 여분의 128개의 공간에 한글 할당되어 있고(949), 일본어는 이 공간에 일본어가 할당(932)이 되어있습니다. 따라서 인코딩/디코딩을 하기 위해서는 ANSI 949 인지 932 인지 혹은 다른 언어인지를 판단해야 합니다. 미리 인코딩을 알아야 하므로 불편하고, 같은 인코딩을 사용하는 컴퓨터 끼리는 언어가 올바로 표시 되겠지만 다른 인코딩을 사용하면 언어가 깨져서 보이는 한계가 있습니다.



댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
글 보관함