솔트웨어 고유 기술로 자체 개발한 LLM(Large Language Model)인 ‘Sapie(Sapie-gemma2-9B-IT)’가 미국의 Weights & Biases사에서 운영하는 한국어 평가 리더보드인 ‘호랑이 리더보드’에서 오픈소스 모델 분야 1위를 기록했다.
지난 16일 기준 호랑이 리더보드에서 솔트웨어 Sapie보다 높은 스코어를 달성한 모델은 OpenAI의 ChatGPT-4, Anthropic의 Claude 3 Opus 두 개 모델뿐이다. 이들 두 모델이 Sapie의 가중치 수(9 billion) 대비 수백 배에 달하는 초거대 언어모델임을 감안할 때 이번 리더보드 1위는 솔트웨어의 기술력이 상당한 것으로 평가될 것으로 보인다.
특히 효율적으로 최적화한 컴퓨팅 리소스를 사용해 이러한 성과를 거뒀다는 것은 솔트웨어가 모델 튜닝과 데이터 처리 등 LLM 개발에 관한 높은 기술력을 보유하고 있음을 알 수 있다.
솔트웨어는 자체적으로 한글 학습 데이터 셋을 개발해 학습시킴으로써 모델 성능의 극대화를 도모했다. 이로 인해 제한된 컴퓨팅 환경에서도 높은 성능을 달성함으로써 고객의 인프라 환경에 구애받지 않고 서비스를 가능하게 해준다.
이번 리더보드 1위 달성으로 업무별로 특화된 고성능의 Private LLM을 구축할 수 있음을 증명한 솔트웨어는 점차 시장이 활성화되고 있는 Private LLM 시장을 적극 공략할 계획이다.
이정근 솔트웨어 대표이사는 “보안 등의 문제로 클라우드 인프라 사용이 불가능한 기업도 Private LLM을 활용해 높은 품질의 AI 서비스를 제공하겠다”며 “고객이 원하는 다운스트림 태스크에 맞춤형으로 모델을 튜닝해 챗봇 서비스뿐만 아니라 생성형 AI 기반 추천 서비스 등 다양한 서비스로 사업 분야를 확대해 나갈 예정”이라고 밝혔다. 또한 “솔트웨어의 모델 튜닝 기술력을 십분 활용해 멀티모달 모델의 기능을 확장하고, 이를 통해 구현 가능한 서비스의 범위를 넓혀 나감으로써 차별화된 경쟁력을 강화하겠다”고 설명했다.
이번에 솔트웨어가 1위를 기록한 ‘호랑이 리더보드’는 오픈소스 모델과 초거대 언어 모델 모두를 대상으로 모델의 한국어 능력을 평가하는 플랫폼으로, Weights & Biases에서 지난 4월에 론칭했으며 업계에서 높은 신뢰성을 갖고 있다. 또한 LLM 기술의 발전을 위한 건강한 생태계를 조성하는 데 기여하고 실제 사용자들이 모델의 성능을 명확히 이해해 적합한 모델을 선택하는 데 도움을 주고 있다.