RX 7700 XT GPU를 가지고 windows에서 stable diffusion을 동작시키기 위한 시행 착오에 대해서 정리해보았습니다.
누군가는 동일한 시행 착오를 격지 않길 바라는 마음에 정리를 해보았습니다.
따라하지 마시고 끝까지 다읽어 보시는걸 추천 드립니다.
NVIDIA의 막강한 무기가 CUDA인걸 모르는지 시간이 많이 지났음에도 AMD의 개발 환경은 여전히 쉽지 않았습니다.
요즘 딥러닝하면 pytorch를 많이 사용합니다. 그래서 pytorch site에서 설치하는 방법을 살펴 보았습니다.
여기에서부터 고행은 시작되었습니다.
Linux 에서는 설치가 가능했기 때문에 WSL을 이용해서 설치를 시도하였습니다.
**WSL(Windows Subsystem for Linux)**은 Windows에서 직접 Linux 환경을 실행할 수 있도록 하는 기능입니다.
즉, 가상 머신(VM) 없이 Windows에서 Linux 명령어, 도구, 애플리케이션을 사용할 수 있도록 지원하는 Microsoft의 서브시스템입니다.
아래를 참고해서 6.1.3 버전을 설치하였습니다.
https://www.reddit.com/r/ROCm/comments/1ep4cru/rocm_613_complete_install_instructions_from_wsl/
문제는 여전히 CUDA를 인식하지 못하는 이슈가 있었습니다.
다시 아래 AMD의 WSL 가이드를 이용하여 ROCm 6.2.3 버전 설치를 시도 하였습니다.
https://rocm.docs.amd.com/projects/radeon/en/latest/docs/install/wsl/install-radeon.html
여전히 unsupported GPU라고 뜹니다.
여기저기 찾아보니 내장 그래픽 카드를 off 하라고 해서 BIOS에서 Off 설정을 해보았지만 여전히 동일하였습니다.
여기에서 자세한 설명은 안하였지만 wsl 내에서 docker 이미지를 이용해서도 설치해보았습니다. 여전히 인식하지 못하였습니다.
중요한 문서가 있는데... 지원되는 그래픽 카드가 정해져 있다는 것입니다.
https://rocm.docs.amd.com/projects/radeon/en/latest/docs/compatibility/wsl/wsl_compatibility.html
이쯤와서는 거의 다 포기하였습니다.
stable diffusion 은 directml(윈도우의 DirectX12 API) 이란것을 이용해서 동작시키는 방법이 있었습니다. 또 다른 방법은 ZLUDA를 이용하는 방법인데 AMD GPU를 이용해서 CUDA 흉내를 내는 방식입니다.
그래서 아래 코드를 참고해서 git 을 받고
https://github.com/lshqqytiger/stable-diffusion-webui-amdgpu
아래와 같이 실행하였습니다. 물론 그전에 python 3.10.6 버전을 꼭 설치해야합니다.
webui-user.bat --use-zluda
Most of AMDGPUs are compatible.
Start WebUI with --use-zluda
.
정리해 보면 아래와 같습니다.
- Install Python 3.10.6 (Newer version of Python does not support torch), checking "Add Python to PATH".
- Install git.
- Download the stable-diffusion-webui-amdgpu repository, for example by running
git clone https://github.com/lshqqytiger/stable-diffusion-webui-amdgpu.git
. - Run
webui-user.bat
from Windows Explorer as normal, non-administrator, user.
4번 실행시 webui-user.bat --use-zluda 라고 실행 시키면 됩니다.
동작하다가 numpy 관련 오류가 발생하는데 아래 가이드 보고 pip install numpy==1.23.5 로 새로 설치하였습니다.
https://myview7144.tistory.com/96
최초 동작시 NVIDIA 사용할때보다 굉장히 느립니다.
동작은 되는데 이미지 크기를 키우면 굉장히 느려집니다.