스테이블 디퓨전 - 제로베이스 설치의 흥망성쇠

국내 자료들을 보니, 기본적으로 秋叶 전문가의 원클릭 배포 패키지를 추천하는 것 같아. Python 기반 오픈소스 프로젝트라서 복잡하지 않을 테니, 일단 처음부터 시작해 보려고 해.

AI 생성 이미지 만들려고 그래픽 카드까지 바꿨는데, INLINE_CODE_0__入门版本；服役七年的__INLINE_CODE_1 영광스럽게 종료되네요

핵심 암호화가 계속 활성화되지 않습니다

미처리

기사 구조를 재구성하여 pytorch, 버전 호환성, 버전을 확인하는 방법을 먼저 소개합니다 로컬에서 어떻게 처음부터 가상 환경을 만들고 PyTorch를 배포할 수 있나요? 3. 번역 작업, Stable Diffusion 설치부터 시작 https://stable-diffusion-art.com/install-windows/ 자료 정리

단계

중국어로 검색해도 관련 단계별 설치 튜토리얼을 찾기 어려울 수 있습니다. __INLINE_CODE_0__BOLD_3gitBOLD_4python 후, 저장소를 다운로드하고 스크립트를 더블 클릭하면 됩니다.

https://github.com/AUTOMATIC1111/stable-diffusion-webui

자세한 사용법 및 Q&A는 issues，https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki에서 확인하세요

저도 왜인지 모르겠지만 이 창고가 뭐하는 곳인지 설명해 주는 사람이 없네요. 사실 이름만 봐도 알 수 있습니다. 인터페이스 콘솔이고, 우리를 더 편리하게 사용할 수 있도록 해 줍니다. 실제로 설치할 때, 그는 공식 저장소 내용을 다운로드하여 실제 INLINE_CODE_0 코드를 가져옵니다.

저장소와 함께 설치 시작 스크립트도 만들었습니다. 현재 폴더에 __INLINE_CODE_0__虚拟环境。如果有的话默认使用当前路径的的__INLINE_CODE_1__이 있는지 자동으로 인식합니다.

순수 백지 사용자라면, https://stable-diffusion-art.com/install-windows/을 확인해 보세요

pytorch

https://pytorch.org/get-started/locally/

여기서 제가 오늘 말씀드리고 싶은 건, 우선 그들의 단계대로 스크립트를 바로 실행하지 마세요. Python은 requirement 파일로 의존성 라이브러리를 설치하는데, 이건 별거 아니에요. 핵심은 그래픽 카드 드라이버 버전이 PyTorch와 호환되는지 확인하는 겁니다. 이 부분에 대한 정보도 많은 자료가 있으니 인터넷에서 찾아보시면 됩니다.

참조: https://blog.csdn.net/weixin_40660408/article/details/129896700

가상 환경을 하나 만들고, 빈 가상 환경에서 바로 공식 웹사이트 스크립트를 실행하여 pytorch를 설치하면 됩니다

python -c "import torch; print(torch.version.cuda)"

python -c "import torch; print(torch.__version__, torch.cuda.is_available())"

위에 두 스크립트는 설치해야 할 CUDA 버전을 확인하고, 설치 성공 여부를 확인할 수 있습니다

여기 화려한 조작은 권장하지 않습니다. 공식 페이지의 로직을 그대로 복사해서 설치하면 되고, pip으로 설치하면 실패하거나 CUDA가 활성화되지 않을 가능성이 높습니다.

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

중요: 폴더 경로에 불필요한 내용이 있으면 pytorch 사용이 어려워질 수 있습니다

중간에 여러 번 설치하고, 공식 설치 파일을 다운로드하여 수동으로 설치하는 방법도 시도했습니다. 2.0 버전으로 업그레이드하려고 했는데, 공식 문서에는 2.0 버전이 속도가 빠르다고 되어 있습니다. 하지만 이전에는 많이 사용하지 않았고, Python 버전과 이것이 영향을 미치는지도 모르겠습니다. 중간에 공식 매뉴얼을 살펴보니 3.8 버전을 사용하는 것이 좋다고 합니다. 이로 인해 약간의 충돌이 발생했는데, 기존에 원클릭 설치 패키지를 사용했더니 그 안에 3.10 버전이 포함되어 있었습니다. 결국 처음부터 다시 시작하여 새 폴더를 만들고 가상 환경을 생성하고 torch가 성공적으로 설치되었는지 확인했습니다.

그런 다음 이 설치된 가상 환경을 웹 UI 폴더 안으로 이동하세요. 그러면 스크립트 설치 시 다른 의존성 문제는 크게 줄어들 겁니다.

이동 후에는 다음을 실행하세요: python -m pip install –upgrade –force-reinstall pip로 pip를 수정합니다

꽤 엉뚱해 보일 수도 있지만, 이 부분은 한참을 고생했어요. 제 torch를 제대로 인식하지 못해서요. 모든 간섭 요소를 배제하기 위해 먼저 이걸 설치한 다음에 다른 의존성 라이브러리를 설치하려고 했어요.

Xformers

권장 설정입니다. 이미지 생성 속도를 높이고 기존 사용량을 줄여줍니다. 부작용은 生成的图像相对不是那么稳定 입니다.

stable-diffusion-webui:Xformers

huggingface optimization

Optimization Ratio	Time taken	Torch active/reserved	Sys VRAM
100.00%	2m 57.03s	7440/10058 MiB	12288/12288 MiB (100.0%)
51.02%	1m 29.21s	4547/7164 MiB	9298/12288 MiB (75.67%)

((masterpiece)),((best quality)),((high detial)),((realistic,))
Industrial age city, deep canyons in the middle,chinese architectural streets,bazaars, Bridges, (rainy days:1.2), (steampunk:0.8), chinese architecture
Negative prompt: nsfw,((cowboy)),(((pubic))), ((((pubic_hair))))sketch, duplicate, ugly, huge eyes, text, logo, monochrome, worst face, (bad and mutated hands:1.3), (worst quality:2.0), (low quality:2.0), (blurry:2.0), horror, geometry, bad_prompt, (bad hands), (missing fingers), multiple limbs, bad anatomy, (interlocked fingers:1.2), Ugly Fingers, (extra digit and hands and fingers and legs and arms:1.4), crown braid, ((2girl)), (deformed fingers:1.2), (long fingers:1.2),succubus wings,horn,succubus horn,succubus hairstyle, (bad-artist-anime), bad-artist, bad hand, borrowed character, text focus, watermark, sample watermark, character watermark, lofter username, photo date watermark, movie poster, magazine cover, journal, cover, cover page, doujin cover, album cover, manga cover, brand name imitation, EasyNegative,Tights, silk stockings,shorts
Steps: 35, Sampler: DPM adaptive, CFG scale: 5.5, Seed: 2223996555, Size: 1088x1088, Model hash: 543bcbc212, Model: base_Anything-V3.0-pruned, Clip skip: 2, ENSD: 31337

사후기

원래 추천하는 원클릭 배포 패키지가 아니라서요. 그 패키지 안에는 작성자가 개인적으로 설정한 부분이 있어서, 공식 버전과 완전히 동일하지 않거든요. 초보자라면 왜 그런 설정을 해야 하는지 모를 수 있으니, 일단은 공식 버전을 사용하는 게 좋습니다. 사용 시간이 늘어날수록 공식 매뉴얼을 살펴보면 어떤 파라미터를 조정해야 할지 알게 될 거예요.

그래픽카드 선택

데이터 화폐 채굴 이후, 그래픽카드 가격이 상대적으로 많이 내렸고, 일반적인 초보 유저라면 INLINE_CODE_0__BOLD_43060tiBOLD_5__INLINE_CODE_2__版本的3060，毕竟能生成更大分辨率的图，为什么需要更大的分辨率，因为你可以在生成的时候，把分辨率调大，这样生成的图像就会更加清晰，更加细腻。如果你是想要生成一些小图，那么__INLINE_CODE_3 VRAM도 충분합니다

아직 한 가지 더 있는데, 高清放大 옵션은 디테일을 구체화하여 화면의 디테일을 더욱 풍부하게 만들지만, 더 많은 비디오 메모리가 필요합니다

다음은 NVIDIA GeForce GTX 970, GeForce RTX 3060 Ti, GeForce RTX 3060, GeForce RTX 3080 및 GeForce RTX 3080 Ti의 단정밀도(FP32), 반정밀도(FP16) 및 배정밀도(FP64) 부동소수점 연산 능력 사양 요약표입니다

그래픽 카드 모델	출시 연도	단정밀도 부동소수점 연산 능력 (TFLOPS)	반정밀도 부동소수점 연산 능력 (TFLOPS)	배정밀도 부동소수점 연산 능력 (TFLOPS)
GeForce GTX 970	2014	3.49	87.2	0.109
GeForce RTX 3060 Ti	2020	16.2	32.4	0.51
GeForce RTX 3060	2021	12.7	25.4	0.39
GeForce RTX 3080	2020	29.8	58.9	0.93
GeForce RTX 3080 Ti	2021	34.8	68.7	1.36

링크된 내용입니다

업데이트

반년 정도의 공백을 두고, 설치 단계 정리나 기초 개념 설명도 하고 싶었지만, 결국 일반인들은 AI 그림을 그리는 것이 고수들이 제공한 이미지 파라미터를 기반으로 조정하거나, 기존 이미지를 바탕으로 형식화된 재렌더링에 불과하다는 것을 알게 되었다

중간에 AI로 미니 프로그램 UI 소재를 그리는 프로젝트가 있었는데, 반쯤 포기하고 직접 공식 미니 프로그램에서 리소스를 가져오는 게 더 나은 것 같아