|
개요
유니코드 한자 검색시스템은 역사자료 전산화 과정에서 작성된 한자 정보를 제공하는 사이트입니다. 2000년 무렵부터 본격화된 역사자료 전산화 과정에서, 초기에는 유니코드 3.0을 표준으로 DB 구축이 진행되었으나 2015년 현재에는 대부분의 디지털 역사 자료가 유니코드 3.1을 표준으로 제작되고 있습니다. 유니코드 3.1 영역 이외의 한자는 신출한자라고 이름하여 별도의 임시코드를 부여하고 해당 자형의 이미지를 제작하여 제공하고 있습니다. 신출한자의 검증 및 제작은 역사분야의 공공기관들이 협력하여 진행하고 있으며 역사분야 종합정보센터인 국사편찬위원회에서는 관련 한자 정보를 누구나 활용할 수 있도록 유니코드 한자 검색 시스템을 통해 제공하고 있습니다. 신출한자의 정리와 관련하여 서로 협력하고 있는 대표적인 기관은, 국사편찬위원회를 비롯하여 한국고전번역원, 한국국학진흥원, 한국학중앙연구원, 동북아역사재단, 서울대학교 규장각한국학연구원 등입니다.
유니코드 한자 검색시스템에서는 유니코드 3.1에 포함된 한중일 통합한자, 한중일 통합한자 A, 한중일 통합한자 B, 신출한자, 신출부호, 고한자를 제공하고 있습니다. 신출부호는 유니코드 표준에 포함되어 있지 않은 부호들이며 고한자는 예전에 현재와는 다른 자형으로 표기된 한자로 특별히 관련 자형을 유지할 필요가 있어서 별도 코드로 표현된 한자입니다.
신출한자는 매년 역사 자료 전산화 과정에서 추가로 출현하고 있으며 매년 검증을 거친 신출한자는 매년 유니코드 한자 검색시스템에 추가되고 있습니다. 2015년 11월 현재 제공되고 있는 한자의 영역과 숫자는 아래 표와 같습니다.
공지
유니코드 한자 검색시스템에서 제공하고 있는 자형, 자의, 자음 등은 역사 자료 전산화 과정에서 부수적으로 얻은 정보를 참고 자료로 제공되고 있는 것입니다. 사전으로서의 정확성, 엄밀성을 필요로 하는 이용자께서는 관련 사전을 활용하시기 바랍니다. 유니코드 한자 검색시스템에서는 학술적으로 엄밀한 정보를 보증하지 않습니다.
|
자료구성 |
구분 |
영역 이름 |
코드 범위 |
문자 수 |
비고 |
표준 |
BMP
영역 |
한중일 통합한자
(CJK Unified Ideographs) |
0x4E00 ~ 0x9FA5 |
20,902자 |
UNICODE 2.0 |
한중일 통합한자 확장 A
(CJK Unified Ideographs
Extension A) |
0x3400~0x4DB5 |
6,582자 |
UNICODE 3.0 |
Extension B 영역 |
한중일 통합한자 확장 B
(CJK Unified Ideographs
Extension B) |
0x20000 ~ 0x2A6D6 |
42,711자 |
UNICODE 3.1 |
비표준 |
신출한자(新出漢字) |
KC00001 ~ KC04787 |
4,787자 |
2004년 통합정리 |
KC04788 ~ KC05980 |
1,193자 |
2005년 통합정리 |
KC05981 ~ KC06968 |
988자 |
2006년 통합정리 |
KC06969 ~ KC07191 |
223자 |
2007년 통합정리 |
KC07192 ~ KC07355 |
164자 |
2008년 통합정리 |
신출부호(新出符號) |
KS00001 ~ KS00097 |
97자 |
2004년 통합정리 |
KS00099 ~ KS00256 |
159자 |
2005년 통합정리 |
KS00257 ~ KS00297 |
41자 |
2006년 통합정리 |
KS00258 ~ KS00299 |
2자 |
2007년 통합정리 |
KS00300 |
1자 |
2008년 통합정리 |
고한자(古漢字) |
OH00001 ~ OH00114 |
114자 |
2005년 통합정리 |
OH00115 ~ OH00159 |
45자 |
2006년 통합정리 |
OH00160 ~ OH00166 |
7자 |
2007년 통합정리 |
OH00167 ~ OH00170 |
4자 |
2009년 통합정리 |
OH00171 ~ OH00190 |
20자 |
2010년 통합정리 |
|
|
|
| |