- 문자 집합 (Character set): 컴퓨터가 이해할 수 있는 문자의 모음
- 인코딩 (Encoding)
- 코드화하는 과정
- 문자를 0과 1로 이루어진 문자 코드로 변환하는 과정
- 디코딩 (Decoding)
- 코드를 해석하는 과정
- 0과 1로 표현된 문자 코드로 문자를 변환하는 과정
대표적인 문자 집합에는 아스키 코드가 있다.
- 아스키 코드
- 초창기 문자 집합 중 하나
- 알파벳, 아라비아 숫자, 일부 특수 문자 및 제어 문자(Enter, Backspace)
- 7비트로 하나의 문자 표현, 표현할 수 있는 문자의 총 개수는 2^7개
- 8비트 중 1비트는 오류 검출을 위해 사용되는 패리티 비트
- A는 65로 인코딩, a는 97로 인코딩

문자로 표현하기 때문에 인코딩이 간단한 장점이 있다. 하지만 7비트로, 128개보다 많은 문자를 표현할 수 없다는 단점이 따른다.
각국의 언어별로 인코딩 방식이 다른 문제가 있다. 이를 통일해 표현하기 위애 유니코드 문자 집합과 utf-8이 생겨났다.
- 유니코드
- 통일된 문자 집합
- 한글, 영어, 화살표와 같은 특수 문자, 이모티콘도 포함
- 유니코드를 인코딩하는 방식: utf-8, utf-16, utf-32 등
'컴퓨터 공학 기초 > 컴퓨터 구조' 카테고리의 다른 글
C언어의 컴파일 (0) | 2025.03.15 |
---|---|
명령어의 구조와 주소 지정 방식 (0) | 2025.03.15 |
소스코드와 명령어 (0) | 2025.03.15 |
0과 1로 숫자를 표현하는 방법 (0) | 2025.03.15 |
컴퓨터 구조 (1) | 2025.03.15 |