정석근 CTO "벤치마크만으로 AI 성능 평가엔 한계"과기정통부 AI 평가 기준 확대·다양화 필요성 강조에이닷 유료화는 신중 기조···활용 사례 먼저 찾아야

정석근 SK텔레콤 최고기술책임자(CTO)이자 인공지능(AI) 사내독립기업(CIC)장이 지난 3일(현지시간) 스페인 바르셀로나에서 열린 모바일 월드 콩그레스 2026(MWC26) 기자간담회에서 이같이 말했다. 벤치마크 위주의 AI 모델 평가에서 벗어나 산업 현장 등 실전에서 성능을 낼 수 있는 모델 개발이 중요하다는 의미로 해석된다.
정 CTO는 네이버 클로바 CIC 대표 출신으로 SKT 합류 후 AI 관련 기술 개발과 글로벌 투자, 핵심 인프라 구축 등을 이끌었다. 특히 SKT 컨소시엄을 이뤄 참여하고 있는 정부의 독자 AI 파운데이션 모델 개발 프로젝트를 이끌어온 인물이기도 하다. 지난해 말 1차 평가 때 초거대 AI 모델 'A.X K1(에이닷엑스 케이원)'을 직접 공개하며 주목받았다. 'A.X K1'은 5190억개의 파라미터(매개변수)를 갖춘 국내 최대 규모 AI 모델이다.
앞서 지난 1월 발표된 정부의 독자 AI 파운데이션 모델 프로젝트의 1차 평가에서 LG AI연구원의 엑사원은 벤치마크 평가 위주의 종합 점수에서 1위를 차지했다. 다만 구체적인 점수와 순위가 공개되지는 않았다.
정 CTO는 2차 평가에서는 AI 모델의 평가 관점이 좀 더 다양해져야 한다고 설명했다. 그는 "거대언어모델(LLM) 성능을 평가하는 기준은 다양하다"면서 "현재는 벤치마크 스코어로 평가를 하고 있는데, 대입 입시에 정시와 수시가 있듯 AI의 지능을 평가할 때 하나의 기준만 가지고 보는 것은 적절하지 않다"고 말했다. 이어 "쉬운 문제와 족보만 달달 외워서 그 시험을 잘 보는 게 과연 우리가 지향하는 목표인지 의문"이라고 덧붙였다.
그러면서 "SK텔레콤은 실제로 산업 현장에서 잘 쓸 수 있는 모델을 만드는 것에 집중하려고 한다"며 "정부에서도 그런 점을 반영한 기준을 2단계 평가부터 고려했으면 좋겠다"고 했다.
챗GPT, 제미나이 등 글로벌 빅테크의 AI 모델과의 경쟁 속에서 현실적인 성능 전략을 세워야 한다고도 언급했다. 정 CTO는 "제미나이, 챗GPT, 클로드 같은 모델의 100% 수준을 만들려면 상당히 어려운 싸움이지만 95% 정도를 따라가자는 것은 가능한 얘기"라며 "특히 제조 현장에서는 그 정도(95% 수준의 성능)로도 풀 수 있는 문제들은 많다"고 말했다.
SKT의 AI 서비스 '에이닷'의 유료화 여부를 놓고는 신중한 태도를 보였다. 정 CTO는 "에이닷을 어떻게 해야 고객들이 기쁘게 돈을 내면서 쓸 수 있을지 사용 사례(유스 케이스)를 먼저 찾는 것이 핵심"이라며 "유료화 레벨의 성능을 낼 수 있을지를 두고 고민하고 있다"고 설명했다.
관련기사
뉴스웨이 유선희 기자
point@newsway.co.kr
저작권자 © 온라인 경제미디어 뉴스웨이 · 무단 전재 및 재배포 금지




댓글