카카오브레인, 제시어 바탕 고화질 이미지 제작 인공지능 '칼로' 발표

칼로를 통해 제작한 이미지(출처=깃헙)

카카오브레인이 이용자가 입력한 문자를 바탕으로 고화질 이미지를 빠르게 제작하는 AI '칼로(Karlo)' 1.0을 오픈소스로 공개했습니다. 칼로는 카카오브레인이 지난해 12월 초거대 인공지능 모델을 바탕으로 한 'minDALL-E'를 비롯한 'RQ-Transformer'등 이미지 생성 AI모델을 발전시켜 만들어낸 인공지능 이미지 제작툴입니다.

칼로는 1억 2천만장에 달하는 텍스트-이미지 데이터셋을 학습, 이해한 문맥을 바탕으로 다양한 화풍과 스타일을 표현해 새로운 이미지를 생성할 수 있습니다. 기존에 존재하는 비슷한 이미지를 합성해 재구성하는 것이 아니라, 마치 '상상하듯' 제시어를 이해하고 이미지를 생성해냅니다. 이 점에서 미드저니(Midjourney)가 떠오르기도 합니다.

칼로는 교육과 디자인, 설계 등 다양한 분야에서 영감을 주거나 보조적인 도구의 역할을 할 수 있을 것으로 보입니다. 카카오브레인은 1.0 버전 공개에 이어 내년 초 개선된 품질과 기능이 추가된 칼로 후속 버전을 지속적으로 오픈API 형태로 공개해 사용자 접근성을 높인다는 계획입니다.

또한 지속적으로 텍스트-이미지 데이터셋 추가 학습, 불필요한 부분을 자연스럽게 제거하거나 편집할 수 있는 '인페인팅(inpainting)' 기술과 기존 이미지를 통해 주변 사물, 빛, 그림자 등을 확장할 수 있는 '아웃페인팅(outpainting)'기술 등 다양한 기능을 추가해 칼로의 고도화를 꾀한다는 계획입니다.

카카오브레인 김일두 대표는 “이번에 공개한 칼로 모델로 AI 아티스트의 무궁무진한 가능성을 다방면에 활용할 수 있을 것”이라며 “앞으로도 카카오브레인은 세계적 수준의 AI 모델들을 오픈소스로 공개하며 AI 생태계 발전 가속화에 힘을 보탤 것”이라고 말했습니다.

무엇보다 미드저니나 노벨AI를 비롯한 해외 인공지능 도구에 대한 관심이 높은 가운데, 채색 보조 등 제한적인 기능이 아닌 이미지 생성 도구로써 칼로가 가질 가능성을 기대하게 됩니다. 한편, 현재 공개된 칼로 1.0은 깃허브를 통해 다운 받아 확인해볼 수 있습니다.

연관 기사
추천 기사
인기 기사