본문 바로가기
Private Story/Talk

그림 그려주는 인공지능 프로그램 - Dall E 리뷰

by 늘상의 하루 2022. 8. 3.

마지막 글부터 꽤 바쁜 시간을 보냈습니다.

-일 사이에 일 사이에 일이 끼어들 줄이야...-

 

여하튼 예전에 신청해두고 잊고 있었던 달리 프로그램의 베타 테스터 초대가 메일로 도착했습니다. 피곤했던 일상에 활력이 돌면서 한시간 가량 이것저것 만들며 웃었던 즐거운 경험이었습니다.

 

달리(Dall E)는 미국에 있는 인공지능 연구소 OpenAI사에서 만들어진 이미지를 생성하는 AI의 이름입니다.

 

유명 화가 살바도르 달리의 이름을 따온 것처럼 이 친구는 입력된 단어와 문장의 조합을 통해 무려 새로운 이미지를 만들어줍니다.

 

키워드만 잘 입력한다면 실사 이미지도 가능하고 유화, 만화, 추상화까지 모두 가능합니다.

 

실사 이미지의 경우에는 진짜 사진을 찍은 것 같은 퀄리티를 보여주지만 아직은 개발 중인 버전이기 때문에 몸이 찌그러지거나 다리가 하나 더 달린 이상한 모습이 나오기도 합니다.

 

반면 키워드의 조합이 적절하다면 꽤 환상적인 이미지가 만들어지기도 합니다.

 

대표적으로 우주에서 말을 타는 우주비행사와 같은 이미지가 있습니다. 퀄리티 높고 몽환적인 이미지가 만들어졌는데 이러한 모습을 보면 인간과 인공지능의 사고 차이를 간접적으로 느낄 수 있습니다.

 

우리가 상식이라고 생각하는 현실에서 조금은 어긋난 상상의 영역을 인공지능은 명령에 따라 가감 없이 그려내고 있습니다. 때때로 너무나 평범한 이미지가 나와 실망할 때도 있지만 놀랄 정도로 창의적인 이미지가 나오기도 합니다.

 

달리를 써보며 느낀 점은 기대 이상으로 잘 동작했고 단어를 있는 그대로 받아들인다는 경우가 많다는 점이었습니다.

 

별생각 없이 조합한 단어 속에서 창의적인 그림이 나오고, 창의적인 그림을 기대하며 작성한 문장 속에서 평범한 이미지가 나왔습니다.

 

조금 더 키워드 조합에 익숙해지면 좋겠지만 아쉽게도 횟수 제한이 있어 더는 참여할 수 없었습니다.

 

아래는 제가 키워드로 조합한 이미지들입니다.


단순한 접근법으로 달 위에서 걷는 오리를 생각하고 moon walk duck을 입력했습니다.

 

그런데 마이클 잭슨의 문워크를 하는 오리가 나와 아차 싶었던 이미지입니다.

 

인공지능임을 감안하여 문장을 해체해서 단어와 단어의 조합으로 이미지를 그리는 것을 생각했는데, 하나의 문장으로 명령을 받아들이는 점이 신기했습니다.

 

조합을 바꿔가며 테스트했지만 제가 가진 기회 속에서 달 위에서 걷는 오리는 만들 수 없었습니다.

 

다음에는 아폴로 11 우주비행사 오리를 입력해 봐야겠습니다.

이번에는 조금 까다롭게 시바견이 바나나를 타고 우주에서 초광속으로 여행하는 이미지를 요구했습니다.

 

생각보다 귀엽고 개성 있는 이미지가 나와서 제가 테스트한 것들 중 가장 만족스러운 이미지 중 하나가 되었습니다.

 

의외였던 점은 별도의 명령이 없었는데 아래 이미지와는 달리 카툰 느낌의 작업물이 도출됐다는 사실입니다.

 

다음으로는 무대 위에서 노래를 부르는 수달을 요구했습니다.

 

시바견 케이스처럼 평면적인 카툰 느낌의 이미지가 나올까 싶었는데 수달이 실사로 진짜 노래를 부르는 것처럼 나와 재미있었습니다.

 

번외로 입에서 무지개가 나오는 오리너구리를 요구했는데 사진이 좀 끔찍하게 나왔기 때문에 이건 패스하도록 하겠습니다...

 

선정성 폭력성의 문장 검열은 들어갔지만 문장의 조합이 만드는 예측밖의 끔찍한 결과물은 딱히 필터가 없는 것 같았습니다.


https://openai.com/dall-e-2/

 

DALL·E 2

DALL·E 2 is a new AI system that can create realistic images and art from a description in natural language.

openai.com

대략 한 달 정도의 시간이 지나고 답장이 오지만 OpenAI 사이트에서 누구나 달리 체험을 신청할 수 있습니다.

 

당장 작업자가 원하는 이미지에 근접한 레퍼런스를 문장의 조합으로 뚝딱 만들어 낼 수 있다는 점에서 달리의 가능성은 기대 이상으로 무궁무진합니다.

 

하지만 그렇기 때문에 제약도 많이 걸려 있습니다.

 

사람들의 심리를 꿰뚫었는지 폭력적이거나 선정적인 이미지는 만들 수 없으며 꽤나 까다롭게 문장을 검열합니다. 작업자의 입장에서는 불편한 요소였지만 그들의 검열이 이해는 됩니다.

 

차후 검열이 없는 버전으로 프로그램이 공개되면 꽤나 좋고 나쁜 방향으로 많은 작업이 이루어질 것 같아 지켜봐야 할 것 같습니다.

 

다른 사람들은 멋지구리하게 뽑던데 저는 이상하게 썼네요