본문 바로가기
메모/AI

무료 그림 AI 비교; DALL·E vs Stable Diffusion

by 네줄로 2023. 2. 21.
반응형

스테이블 디퓨전

 

 

DALL-E로 블로그 썸네일 만들기; 저작권 걱정없는 무료 이미지

썸네일이 고민 티스토리에 글을 올리기 시작한 지는 얼마 안 됐지만, 티스토리로 넘어오기 전 네이버에 올렸던 기간까지 하면 어느새 반년이 넘어간다. 그동안 거의 1일 1 포스팅을 했으니, 200개

thinknezhulo.tistory.com

 

지난 글에서, DALL-E에 대해 다뤘었다.

 

이번에는 또 다른 무료 그림 AI, 스테이블 디퓨전에 대해 알아볼 차례.

 

먼저, 스테이블 디퓨전에 대해서 간단하게 소개하자면

 

Stability AI라는 곳에서 만들었는데, 소스코드를 그냥 무료로 공개해 버렸다.

 

So cool~

덕분에 그 코드를 기반으로 많은 사람들이 여러 가지 방법으로 사용할 수 있게 만들었는데,

 

내가 사용해 본 것은 두 가지, Web UI와 데모 버전이다.

 

하나씩 살펴보자.


Web UI

 

먼저 Web UI 버전이다.

 

쉽게 설명하자면, 공개된 코드를 구글 가상컴퓨터에서 돌리는 방식.

 

실행하려면 몇 가지 절차가 있는데, 쉽다면 쉽지만 복잡하다면 또 복잡하다.

 

자세한 실행 방법을 정리하기에는 지면이 부족하여 생략!

 

DALL-E와 비교하는 식으로 후기를 정리해 보겠다.

 

먼저 장점부터.

 

1. 세부적인 옵션 조정이 가능하다.

 

2. 실존인물 그림도 가능.

 

3. 완전 무료로 얼마든지 쓸 수 있다.

 

4. Text to Img 외에도 Img to Img, variation, edit 등 다양한 기능 제공.

 

5. 브랜드 로고와 같이 구체적인 형상도 비교적 정확히 그려낸다.

 

6. 한 번에 최대 8장까지 이미지를 만들 수 있다.

 

반면 단점은,

 

1. 앞서 말한 대로 몇 가지 실행 절차가 필요한데, 굉장히 귀찮음.

 

2. 그동안 생성한 그림 히스토리가 남지 않는다.

 

3. DALL-E는 찰떡같이 원하는 걸 그려줬는데, 얘는 뭔가 좀...

완성도가 떨어지는 건 아닌데, 뭐랄까 내 마음을 잘 몰라주는 느낌?

 

4. DALL-E에 비하면 이미지 생성에 시간이 좀 더 걸린다.

잘 쓰시는 분들은 장점에서 언급한 세부적인 세팅과

 

Img to Img, variation, edit 등 다양한 기능들을 잘 활용해서

 

정말 엄청난 퀄리티의 그림들을 뽑아내기도 한다.

 

하지만 나는 그냥 블로그 썸네일 만드는 게 주 용도라

 

그렇게 까지 높은 퀄리티가 필요하지 않았고,

 

단점에서 언급한 귀찮음이 더 크게 느껴져서

 

지금은 Web UI 버전은 잘 사용하지 않는다.

 

높은 퀄리티의 이미지를 얻고 싶다면 강추!

 

하지만 귀찮은 게 싫다면 비추!


온라인 데모 버전

 

 

Stable Diffusion 2-1 - a Hugging Face Space by stabilityai

 

huggingface.co

 

다음은 온라인 데모버전이다.

 

다른 절차 없이 그냥 저 사이트에 들어가면 바로 쓸 수 있다.

 

최신 버전인 2.1 버전을 기반으로 하며 데모라고 해서 성능이 떨어지는 것은 전혀 없다. 

 

다만, Web UI 버전에서는 세팅을 건드리면

 

한 번에 이미지를 최대 8장까지 만들 수 있는데,

 

데모버전에서는 시간은 비슷하게 걸리면서

 

최대 4장까지밖에 안된다는 것이 조금 아쉽다.

 

데모버전도 장점부터 정리해 보자.

 

1. 아무런 절차 없이 편하게 쓸 수 있다.

 

2. 성능은 Web UI 버전이랑 똑같다. 실존인물 그림 가능.

 

3. 역시 완전 무료.

 

4. 브랜드 로고와 같이 구체적인 형상도 가능.

 

단점은,

 

1. 옵션 조정 거의 없음.

 

2. 역시 그림 히스토리가 남지 않는다.

 

3. Web UI랑 똑같이 내 마음을 잘 몰라주는 느낌.

 

4. 이미지 생성에 시간이 꽤 걸린다.

 

5. Img to Img, variation 등의 기능이 전혀 없다.

위에서 말한 대로, 나는 귀찮은 게 싫어서 데모 버전을 주로 쓴다.

 

참고로 세팅은 Guidance scale만 조정 가능한데,

 

뭔지 모르겠다면 그냥 내버려두면 된다.


DALL-E vs Stable Diffusion

 

그래서 결론을 내자면, 나는 둘 다 쓰긴 쓰는데

 

Stable Diffusion(데모)로 먼저 이미지를 만들어 보고,

 

결과물이 맘에 들지 않으면 그때 DALL-E를 같이 돌려본다.

 

DALL-E는 크레딧을 다 소모하면 계정을 돌려가며 써야 되는데,

 

나는 그것조차 귀찮아서 스테이블 디퓨전부터 돌려보는 것이다.

 

그러니 각자 상황에 맞게 쓰고 싶은 것을 쓰면 된다.

 

Stable diffusion prompt book
Stable diffusion prompt book

 

그리고 DALL-E와 마찬가지로 사용 가이드가 있으니 참고하면 좋다.

 

이번 편 썸네일은, 오랜만에 사용 가이드를 참고해서 성심 성의껏 만들어본 사진이다.

 

그럼 이만~

 

A cinematic film still of Emma Watson as Hermione in Harry Potter and the Sorcerer's Stone, portrait, 40mm lens, shallow depth of field, close up, studio lighting
A cinematic film still of Emma Watson as Hermione in Harry Potter and the Sorcerer's Stone, portrait, 40mm lens, shallow depth of field, close up, studio lighting

반응형

댓글