산업
사진 속 상황 추론부터 표·그래프 분석, 수학 도형 문제 풀이도 가능
기술 블로그 통해 하이퍼클로바X 기반 음성 멀티모달 기술도 선보여
[마이데일리 = 박성규 기자] 네이버 클로바X가 서비스 업데이트를 통해 시각 정보 처리 능력을 새롭게 추가한다고 22일 밝혔다.
클로바X의 이미지 이해 기능 업데이트로, 사용자들은 클로바X 대화창에 업로드한 이미지에서 추출된 정보와 입력한 질의를 바탕으로 AI와 대화할 수 있다. 클로바X는 사진 속 현상을 묘사하거나 상황을 추론하는 등 다양한 지시를 수행할 수 있다.
특히 네이버의 우수한 AI 기반 문서 처리 및 문자 인식 기술 노하우와, 다양한 분야 지식을 갖춘 거대 언어 모델(LLM)인 하이퍼클로바X가 결합해 더 정확하고 신뢰성 있는 서비스를 제공할 수 있다.
또한 네이버는 20일, ‘클로바’ 공식 사이트의 기술 블로그를 통해 하이퍼클로바X 기반 음성 AI 기술을 공개했다.
기존의 음성 인식, 음성 합성 기술보다 한층 발전한 모델로, LLM의 특징인 뛰어난 문맥 이해 및 지시문 해석 능력을 활용해 언어 구조 및 발음 정확도 개선은 물론 감정 표현까지 더한 자연스러운 대화가 가능하다.
AI 음성 기록 ‘클로바노트’, AI 안부전화 ‘클로바 케어콜’, AI 음성 합성 ‘클로바더빙’ 등 다양한 음성 AI 서비스로 기술 경쟁력을 증명한 바 있는 네이버는 음성 멀티모달 LLM 기술로 더 편리한 서비스를 제공한다는 계획이다.
성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 “하이퍼클로바X의 발전된 능력은 대화형 AI 에이전트 클로바X를 비롯한 여러 네이버 서비스에 도입해 새로운 사용자 가치를 창출하고 기업용 AI 솔루션으로도 제공하여 하이퍼클로바X 생태계를 더욱 확장해나갈 것”이라고 말했다.
박성규 기자 psk@mydaily.co.kr
- ⓒ마이데일리(www.mydaily.co.kr).
무단전재&재배포 금지 -
댓글
[ 300자 이내 / 현재: 0자 ]
현재 총 0개의 댓글이 있습니다.