프로그래밍을 할때 주로 사용하는 유니코드에 대해 간단히 알아보겠습니다. 먼저 유니코드(Unicode)란 세계 모든 나라의 언어를 통일된 방법으로 표현할 수 있게 제안된 국제적인 코드 규약 입니다.
유럽 문자권에서는 30자 안팎의 알파벳과 몇 가지 특수 글자를 표현하기에는 한 바이트로 충분하였기 때문에 모든 정보가 한 바이트의 낱말로 표현할수 있지만 한글, 한자, 일본어 등과 같은 글자는 그 구조가 영어와 달라서 하나의 바이트는 표현이 불가능하기 때문에 일반적으로 두 바이트를 조합하여 하나의 글자를 표현하고 있습니다. 이러한 문제점을 해결하고 세계 각국의 글자에 대응할 수 있도록 유니코드가 만들었고 1비트가 아닌 16비트를 사용하여 하나의 글자로 표현하고 있습니다.
아래 표는 한글 유니코드를 표로 정리한 내용입니다. Ctrl + F 를 이용해 원하는 단어를 빠르게 검색하실수 있습니다.
U+AC00 to U+AD00 0 1 2 3 4 5 6 7 8 9 A B C D E F UTF8: 2...