한자

한자키 누를때 뜨는 보라색 한자에 대한 고찰.

K66Google 2021. 1. 17. 15:50

컴퓨터를 써 본 사람들이라면 '한자 키'를 모를 수가 없을거다. 한국 한자음을 입력하고 한자키를 누르면 입력한 음과 일치하는 한자들을 보여주고, 선택한 한자로 변환해준다. 반대로 한자를 입력한 뒤 블록 지정한 상태로 한자키를 누르면 해당 한자의 한국 한자음으로 변환할 수도 있다. 한국어 IME에서 지원하는 아주아주 편리한 기능이다.

그런데 한자키를 눌렀을때 한자 색깔이 검은색이 아니라 파란색 또는 보라색으로 나오는 한자들이 있다. 이들의 정체는 무엇인지 고찰해 보고자 한다.


참고로 윈도우10에서 파란색 · 보라색 한자를 보기 위해서는 '확장 한자' 옵션이 켜져있어야 한다.

알림 영역의 '한' 클릭 - 언어 기본 설정 - 기본 설정 언어 - 한국어 - 옵션 - 키보드 - Microsoft 입력기 - 옵션 으로 들어가면 위의 스크린샷처럼 나오는데 '확장 한자' 를 '' 으로 설정하면 파란색 · 보라색 한자들이 변환 리스트에 보이게 된다.

참고로 보라색 한자는 오피스까지 설치해야 보인다. 오피스를 설치하지 않았다면 파란색 한자까지만 리스트에서 보인다.



 

보라색 한자를 분석하기 전에, 먼저 검은색 · 파란색 한자부터 짚고 넘어가도록 하겠다.

검은색 한자는 EUC-KR(KS X 1001)의 한자 영역이다. 총 4888자다. (출처 : 문자 집합 위키)

첫 한자는 (절 가)이며, 헥스 코드는 CAA1이다.

마지막 한자는 (물을 힐)이며, 헥스 코드는 FDFE다.



 

파란색 한자KS X 1002의 한자 영역이다. 총 2856자다. (출처 : 문자 집합 위키)

첫 한자는 (거짓 가)이며, 헥스 코드는 5721이다.

마지막 한자는 (약을 힐)이며, 헥스 코드는 7544이다.

참고로 KS X 1002의 한자 중에서 𧳯자는 부수가 '갖은돼지 시'에서 '돼지 시'로 바뀐 (돼지 저) 자로 등록되었다. 이로 인해 두 한자는 검색 시에 별개의 글자로 취급받고 있다.



이제 마지막으로 보라색 한자다. 보라색 한자의 정체는... 바로 유니코드 한중일 통합 한자 구역이다. (출처)

한중일 통합 한자 구역에는 검은색 · 파란색 한자도 포함되어 있는데, 거기에 포함된 한자들은 제외하고 분석해보았다.

해당 구역 중에, 보라색 한자에 처음으로 속하는 한자는 (공교할 교)이며, 유니코드 번호는 U+4E02이다.

마지막으로 속하는 한자는 (조화될 해)이며, 유니코드 번호는 U+9FA4이다.


의 다음 글자 (부를 유)는 이미 파란색 한자 영역에 속해있으며, 그 다음에 있는 (병음 cháng, 한국 한자음 ''으로 추정) 부터 (병음 dān, 한국 한자음 ''으로 추정) 까지는 IME에 등록되지 않아서 입력이 불가능하다. 그러나 시스템 기본 폰트(맑은 고딕)에서 지원하고 있어서 모양이 어떻게 생겼는지는 확인할 수 있다.


의 다음 글자 ('그리스도'의 준말 한자) 부터는 기본 폰트에서 지원되지 않아 글자가 깨져서 나온다.  

부터 ('예루살렘'의 준말 한자) 까지는 중국에서 슬라브어 표기를 위해 만들어진 한자로, 대부분 종교와 관련이 있다. (출처) 마찬가지로 IME를 통한 입력은 불가능하다.


그 다음 한자인 ('부싯돌 수'의 이체자로 추정. 출처) 부터 구역의 마지막 한자인 (병음 확인 불가. 한국 한자음은 형성자로 봤을때 ''로 추정) 까지도 역시 IME를 통해서 입력할 수 없다.


이렇게 입력할 수 없는 한자가 생긴 이유는, 해당 한자들이 유니코드 4.1 (2005년 3월) 이후에 추가되었기 때문이다.



 

 

또한, 보라색 한자 영역은 유니코드 한중일 통합 한자 확장A 구역도 지원하고 있다. (출처)

확장A 구역 한자는 100% 보라색 한자에 속해있고, 사실상 모든 한자(6582자)가 IME 입력을 지원하고 있다.

해당 구역 중에, 보라색 한자에 처음으로 속하는 한자는 (언덕 구)이며, 유니코드 번호는 U+3400이다.

마지막으로 속하는 한자는 (피리 지)이며, 유니코드 번호는 U+4DB5이다.


유니코드 13.0 이후에 새로 들어온 10개의 한자들은 IME 입력을 지원하지 않는다.

통합 한자 확장B 구역 이후의 한자들도 IME 입력을 지원하지 않는다.



* 한중일 호환용 한자 (출처)

한중일 호환용 한자 중 (U+F900)부터 (U+FA2D)까지는 IME를 통한 한국 한자음 변환이 지원되며, (U+FA2E) 이후로는 변환이 지원되지 않는다. 지원되는 글자만 세어보면 총 302자다.

(정할 정), (학 학) 등 일부 한자는 자형(字形)만 약간 다른 동일한 한자가 보라색 한자 영역 안에 들어가있다.



* 한국어 IME로 입력할 수 있는 한자 개수 추정

검은색 한자(EUC-KR) - 4888자.

파란색 한자(KS X 1002) - 2856자.

보라색 한자(유니코드 한중일 통합 한자 구역) - 13426자. (※ 검은색·파란색 영역에 포함된 한자는 제외하고 계산)

보라색 한자(유니코드 한중일 통합 한자 확장A 구역) - 6582자.


호환용 한자 구역을 제외하면, IME를 통해서 총 27752자의 한자를 입력할 수 있는 것으로 추정된다.



이번 고찰을 통해 한자키를 눌렀을때 뜨는 한자의 색깔에 대해 궁금증이 좀 풀린 것 같다...

그럼 이만.