컴퓨터는 정보를 표현하고 저장하기 위해서 0과 1을 나타낼 수 있는 기본 단위인 bit를 사용한다. bit를 사용하면 0과 1의 두 가지 수만 나타낼 수 있기 때문에 더 큰 수를 나타내기 위해서는 여러 bit의 모음을 사용해야 한다. 8개의 bit를 모은 단위를 byte라고 하며, 0~255 총 256개의 수를 나타낼 수 있다.
컴퓨터에서 우리가 다루는 정보에는 숫자만 있는 것이 아니다. 글자, 사진, 영상, 소리 등 다양한 정보가 있는데 bit로 그런 정보를 나타내기 위해서는 통일된 약속이 필요하다.
1. ASCII code
ASCII code는 영어 알파벳 인코딩을 위해 만들어진 7bit 부호 체계이다. 총 128개의 문자를 표현할 수 있고, 그 안에는 영어 알파벳 대소문자(52개), 특수문자(32개), 공백문자(1개)가 포함된다. A를 나타내기 위해서는 65(2진법으로 1000001), B는 66(2진법 1000010)을 저장해야 한다. a는 97, b는 98과 대응된다.
2. Unicode
ASCII 코드를 사용하여 영어 알파벳은 모두 나타낼 수 있었지만, 영어가 아닌 다른 언어의 문자, 수학이나 과학 기호, 이모티콘 등 ASCII 코드 만으로 표현할 수 있는 문자는 수없이 많이 있다. 따라서 전 세계 언어의 문자들을 모두 표현하기 위해서 새로운 표준은 만들게 되었고 그 표준이 Unicode이다.
Unicode 표준은 17개의 판(plane)으로 이루어져있고, 각각의 판은 65,536개(216개)의 문자를 나타낼 수 있다. Unicode를 통해 전세계 언어의 문자는 물론, 수학 및 음악 기호, 이모티콘 등 모든 문자들을 표현할 수 있다. ASCII 코드와 호환성을 위해서 Unicode의 첫 128개 문자는 ASCII코드와 동일하다.
'개발' 카테고리의 다른 글
[CS50] - C (0) | 2022.04.08 |
---|---|
DOM이란 (0) | 2022.03.01 |
[JS] 데이터 타입(Data type) - 복사, 불변성과 가변성 (0) | 2022.01.12 |
[JS] 메모리와 데이터 (0) | 2022.01.10 |
[JS] Event Delegation(이벤트 위임) (0) | 2022.01.06 |
댓글