Chapter.02 - 데이터
단위
- 비트
- 0과 1을 나타내는 단위
1byte = 8bit
1kb = 1,000byte
1mb = 1,000kb
1gb = 1,000mb
1tb = 1,000gb
워드(word) : cpu가 한번에 처리할 수 있는 데이터 크기
32bit cpu의 1word = 32bit
64bit cpu의 1word = 64bit
이진수
2의 보수
= 2진수로 음수를 표현한 값 = 컴퓨터가 인식하는 음수의 값- 모든 0 과 1을 반전시키고 거기에 1을 더해서 구한다.
- \(2^n\) 에 해당하는 수 (2, 4, 8, 16, …) 는 2진수로 음수를 표현할 수 없다.
문자표현
문자집합
: 컴퓨터가 인식하고 표현할 수 있는 문자의 모음- 아스키(ASCII)는 문자집합
- 아스키 코드는 아스키 문자집합의 각 문자에 대응되는 수 (2진수 or 16진수)
인코딩
: 문자를 0과 1로 변환하는 과정디코딩
: 0과 1을 문자로 변환하는 과정한글 인코딩
한글 인코딩에는 완성형, 조합형 이 존재한다.
완성형 인코딩은 글자 하나당 고유한 수를 부여해서 인코딩하는 방식이고, 조합형 인코딩은 초성, 중성, 종성의 수를 조합하여 하나의 글자를 인코딩하는 방식이다.
EUC-KR 은 완성형 인코딩이며 한글 글자 하나당 2byte 로 표현된다.
현재 가장 많이 사용되는 문자집합은 유니코드 이며 인코딩 방식은 UTF-8 이다. (한글 글자 하나당 3byte)
This post is licensed under CC BY 4.0 by the author.