두나무, AI 연구·서비스 고도화 ‘투트랙’ 성과

COLING·SIGIR 논문 채택부터 업비트·증권플러스 AI 적용까지 경쟁력 강화

박소현 기자 2025.12.18 13:29:50

사진=두나무

 

디지털자산 거래소 업비트를 운영하는 두나무(대표 오경석)가 2025년 한 해 동안 인공지능(AI) 연구 성과와 서비스 고도화를 동시에 추진하며 기술 경쟁력을 한층 끌어올렸다.

 

두나무 머신러닝(ML)팀은 지난 1월 아랍에미리트 아부다비에서 열린 국제전산언어학술대회 ‘콜링 2025(COLING 2025)’ 메인 콘퍼런스에서 텍스트-SQL 변환 관련 연구 논문을 발표했다. COLING은 자연어 처리(NLP)와 전산언어학 분야에서 세계적으로 권위 있는 학회로, 엄격한 심사 기준으로 잘 알려져 있다.

 

발표 논문 ‘MCS-SQL: 텍스트-SQL 변환에서 다중 프롬프트와 다지선다를 활용하는 방법(MCS-SQL: Leveraging Multiple Prompts and Multiple-Choice Selection For Text-to-SQL Generation)’은 대규모 언어 모델(LLM) 기반 텍스트-SQL 변환 과정에서 발생하는 응답 비일관성 문제를 개선하는 접근법을 제시했다. 

 

다중 프롬프트를 활용해 여러 SQL 후보를 생성한 뒤 최적의 결과를 선택하는 방식으로 정확도와 효율성을 동시에 높였으며, 해당 모델은 텍스트-SQL 벤치마크인 BIRD-SQL 글로벌 리더보드 1위를 기록한 바 있다.

 

두나무 ML팀은 이어 지난 7월 이탈리아 파도바에서 열린 정보검색 분야 최고 권위 학회 ‘SIGIR 2025(The 48th International ACM SIGIR Conference on Research and Development in Information Retrieval)’에서도 연구 성과를 발표했다. SIGIR는 올해 제출 논문 가운데 약 27%만 채택될 정도로 경쟁이 치열한 학회다.

 

SIGIR에서 공개한 논문 ‘LLM 기반 사용자 시뮬레이터: 실제 사용자 상호작용 없이 뉴스 추천 모델을 학습하기 위한 방법론(LLM as User Simulator: Towards Training News Recommender without Real User Interactions)’은 실제 이용자 데이터 없이 LLM을 활용해 가상의 사용자를 생성하고 추천 모델을 학습하는 방식을 제안했다. 

 

두나무 ML팀이 개발한 ‘LAUS(LLM As User Simulator)’ 프레임워크는 대규모 데이터 수집 부담과 개인정보 보호 이슈를 동시에 완화한 것이 특징으로, 실험 결과 제로샷(zero-shot) 방식 대비 우수한 성능과 응답 지연 시간 단축 효과를 보였다.

 

연구 성과는 실제 서비스 고도화로도 이어졌다. 업비트 개발자센터는 전면 개편을 통해 AI 기반 ‘업비트 어시스턴트’를 도입했다. 해당 기능은 개발자센터 문서를 학습해 API 예시 제공, 문서 요약, 가이드 탐색 등을 지원하며 개발 편의성을 높였다. 

 

지피티(GPT), 클로드(Claude) 등 주요 AI 도구에서 최신 업비트 API 문서를 활용할 수 있도록 llms.txt 포맷을 제공하고, 과거 시세 데이터를 다운로드할 수 있는 ‘Upbit Historical Market Data’ 서비스도 추가했다.

 

두나무의 투자정보 플랫폼 증권플러스 역시 AI 기능을 강화했다. 새롭게 개설된 ‘뉴스룸’ 탭은 자체 머신러닝 알고리즘을 활용해 뉴스의 중요도와 시장 영향력을 분석하고, 투자 판단에 필요한 정보를 우선 배치한다. 

 

‘속보’ 섹션은 핵심 내용을 3줄 요약으로 제공하고, ‘주요 뉴스’ 섹션에서는 하루 동안 시장에 가장 큰 영향을 미친 ‘24시간 핵심 뉴스 TOP5’를 선별해 제공한다. 각 뉴스에는 연관 종목과 시세 변동률도 함께 표시된다.

 

이동준 두나무 ML팀장은 “올해 축적한 AI 연구 성과와 서비스 적용 경험을 바탕으로 내년에도 기술 경쟁력을 지속적으로 강화해 사용자에게 더욱 신뢰할 수 있는 서비스를 제공하겠다”고 말했다.

 

<문화경제 박소현 기자>

맨 위로