340억 매개변수 기반 A.X 3.1, 수학·코드 성능 대폭 강화…연구·상업용 모두 허용
SKT, A.X 3.1·4.0 모델 4종 오픈소스 공개…KMMLU서 88% 수준 성능 입증
[사례뉴스=김주연 인턴기자] SK텔레콤이 독자 개발한 대화형 인공지능(AI) 모델 ‘A.X(에이닷엑스) 3.1’을 24일 오픈소스 커뮤니티 허깅페이스에 공개했다고 밝혔다.
340억 개의 매개변수를 기반으로 하는 A.X 3.1은 SK텔레콤이 모델 구축부터 데이터 학습까지 전 과정을 직접 수행한 ‘프롬 스크래치’ 방식으로 개발된 모델이다. 기존 A.X 3.0이 한국어 대화 성능에 중점을 뒀다면, A.X 3.1은 코드와 수학 처리 능력을 대폭 개선해 추론 모델로의 확장 가능성을 높인 것이 특징이다.
이번 공개를 통해 SK텔레콤은 프롬 스크래치 방식의 A.X 3.1 모델 2종과, 대규모 학습 기반의 A.X 4.0 모델 2종 등 총 4개의 모델을 오픈소스로 제공한다. 해당 모델들은 학술 연구는 물론 상업적 목적에도 자유롭게 활용할 수 있다.
성능 측면에서 A.X 3.1은 A.X 4.0 대비 절반 이하 수준의 매개변수를 갖고 있지만, 한국어 서비스에 적용할 경우 약 90% 수준의 성능을 발휘한다. 대표적인 한국어 능력 평가 지표인 KMMLU에서 A.X 3.1은 69.20점을 기록하며 A.X 4.0 대비 약 88%의 성능을 입증했다.
SK텔레콤은 과학기술정보통신부가 주관하는 ‘독자 AI 파운데이션 모델 사업’에도 참여 중이다. 이 사업에는 크래프톤, 포티투닷, 리벨리온, 라이너, 셀렉트스타 등 다양한 기업과 함께 서울대, KAIST 등 주요 연구기관이 컨소시엄으로 참여하고 있다.
SK텔레콤은 2018년부터 한국어 특화 AI 기술을 연구해왔으며, 2019년 국내 최초 한국어 딥러닝 언어모델 ‘KoBERT’를 개발한 이후 KoGPT2, KoBART를 거쳐 A.X 시리즈까지 기술을 꾸준히 고도화해왔다.
김태윤 SK텔레콤 파운데이션 모델 담당은 “각 분야 선도기업들과의 컨소시엄 구성을 통해 소버린 AI 분야에서 새로운 성과를 만들어갈 것”이라고 밝혔다.
