고려대학교(총장 김동원)는 컴퓨터학과 정연돈 교수 연구팀이 인공지능을 활용해 판결문 속 개인정보를 신속하고 정확하게 비식별화하는 기술을 개발했다고 15일 밝혔다.
헌법 제109조에 따라 재판 심리와 판결은 공개가 원칙이며 이는 사법 투명성 확보와 국민 신뢰 유지를 위한 조치다. 다만 이름·주민등록번호·주소 등 개인정보는 보호된 상태로 공개돼야 한다.
기존의 수작업 방식은 개인정보를 가리는 데 문서 한 건당 약 2주가 소요돼 전체 판결문 중 5.97%만이 비식별화돼 공개됐으며, 기존 자동화 시스템도 정확도가 약 8% 수준에 그쳤다.
연구팀은 대규모 벤치마크 데이터셋 ‘K-LegalDeID’과 인공지능 모델 ‘KLUEBERT-CRF’를 개발해 이를 개선했다. 약 100만건 규모 학습 데이터를 구축하고 인공지능이 이를 학습해 비식별화하는 방식이다.
연구팀은 “벤치마크 데이터셋을 통해 한국 리걸 테크(Legal Tech) 분야의 데이터 부족 문제를 해결했다”며 “판결문 비식별화 업무를 자동화해 판결문 공개 확대와 사법 투명성 강화에 기여할 것”이라고 말했다.
<문화경제 한시영 기자>