Búsqueda de sitios web

Cómo ejecutar Stable Diffusion en su PC para generar imágenes de IA


Resumen: para ejecutar Stable Diffusion localmente en su PC, descargue Stable Diffusion de GitHub y los puntos de control más recientes de HuggingFace.co e instálelos. Luego ejecute Stable Diffusion en un entorno especial de python usando Miniconda.

El arte de la inteligencia artificial (IA) está actualmente de moda, pero la mayoría de los generadores de imágenes de IA se ejecutan en la nube. Stable Diffusion es diferente: puede ejecutarlo en su propia PC y generar tantas imágenes como desee. Así es como puede instalar y usar Stable Diffusion en Windows.

¿Qué es la difusión estable?

Stable Diffusion es un modelo de aprendizaje automático de código abierto que puede generar imágenes a partir de texto, modificar imágenes basadas en texto o completar detalles en imágenes de baja resolución o con pocos detalles. Ha sido entrenado en miles de millones de imágenes y puede producir resultados comparables a los que obtendría con DALL-E 2 y MidJourney. Está desarrollado por Stability AI y se lanzó públicamente por primera vez el 22 de agosto de 2022.

Stable Diffusion no tiene una interfaz de usuario ordenada (todavía) como algunos generadores de imágenes de IA, pero tiene una licencia extremadamente permisiva y, lo mejor de todo, es completamente gratuito para usar en su propia PC (o Mac).

No se deje intimidar por el hecho de que Stable Diffusion actualmente se ejecuta en una interfaz de línea de comandos (CLI). Ponerlo en marcha es bastante sencillo. Si puede hacer doble clic en un ejecutable y escribir en un cuadro, puede ejecutarlo en unos minutos.

¿Qué necesita para ejecutar Stable Diffusion en su PC?

Stable Diffusion no se ejecutará en su teléfono ni en la mayoría de las computadoras portátiles, pero se ejecutará en la PC de juegos promedio en 2022. Estos son los requisitos:

  • Una GPU con al menos 6 gigabytes (GB) de VRAM
    • Esto incluye la mayoría de las GPU NVIDIA modernas

    • Stable Diffusion también se puede ejecutar en Linux y macOS

    Si no tiene el hardware, considere usar un generador de imágenes de IA basado en la web. Incluso puede ejecutar una demostración de Stable Diffusion en la web.

    Cómo instalar y ejecutar Stable Diffusion en Windows

    Hay dos piezas de software que necesita: Git y Miniconda3.

    Instalando Git

    Git es una herramienta que permite a los desarrolladores administrar diferentes versiones del software que están desarrollando. Pueden mantener múltiples versiones del software en el que están trabajando en un repositorio central simultáneamente y permitir que otros desarrolladores contribuyan al proyecto.

    Si no es un desarrollador, Git proporciona una forma conveniente de acceder y descargar estos proyectos, y así es como lo usaremos en este caso. Descargue el instalador de Windows x64 desde el sitio web de Git, luego ejecútelo para instalar Git.

    Hay varias opciones que se le pedirá que seleccione mientras se ejecuta el instalador; déjelas en su configuración predeterminada. Una página de opciones, Ajuste de su entorno PATH, es particularmente importante. Debe establecerse en Git desde la línea de comandos y también desde software de terceros.

    Instalando Miniconda3

    Stable Diffusion se basa en algunas bibliotecas de Python diferentes. Si no sabe mucho sobre Python, no se preocupe demasiado por esto; basta con decir que las bibliotecas son solo paquetes de software que su computadora puede usar para realizar funciones específicas, como transformar una imagen o hacer operaciones matemáticas complejas.

    Miniconda3 es básicamente una herramienta de conveniencia. Le permite descargar, instalar y administrar todas las bibliotecas necesarias para que Stable Diffusion funcione sin mucha intervención manual. También será cómo usamos Stable Diffusion.

    Dirígete a la página de descarga de Miniconda3 y haz clic en Miniconda3 Windows de 64 bits para obtener el instalador más reciente.

    Haga doble clic en el ejecutable una vez que se haya descargado para iniciar la instalación. La instalación de Miniconda3 implica menos clics en las páginas que Git, pero debe tener cuidado con esta opción:

    Asegúrese de seleccionar Todos los usuarios antes de hacer clic en Siguiente y finalizar la instalación.

    Se le pedirá que reinicie su computadora después de instalar Git y Miniconda3. No consideramos que sea necesario, pero no te dolerá si lo haces.

    Descargue el repositorio Stable Diffusion GitHub y el punto de control más reciente

    Ahora que hemos instalado el software de requisito previo, estamos listos para descargar e instalar Stable Diffusion.

    Descargue primero el último punto de control: la versión 1.4 tiene casi 5 GB, por lo que puede llevar un tiempo. Debe crear una cuenta para descargar el punto de control, pero solo requieren un nombre y una dirección de correo electrónico. Todo lo demás es opcional.

    Haga clic en sd-v1-4.ckpt para iniciar la descarga.

    Luego debe descargar Stable Diffusion de GitHub. Haga clic en el botón verde Código, luego haga clic en Descargar ZIP. Alternativamente, puede usar este enlace de descarga directa.

    Ahora debemos preparar algunas carpetas donde descomprimiremos todos los archivos de Stable Diffusion. Haga clic en el botón Inicio y escriba miniconda3 en la barra de búsqueda del menú Inicio, luego haga clic en Abrir o presione Entrar.

    Vamos a crear una carpeta llamada difusión estable usando la línea de comando. Copie y pegue el bloque de código a continuación en la ventana Miniconda3, luego presione Enter.

    cd C:/
    mkdir stable-diffusion
    cd stable-diffusion

    Si todo salió bien, verás algo como esto:

    Mantenga abierta la ventana Miniconda3, la necesitaremos nuevamente en un minuto.

    Abra el archivo ZIP, stable-diffusion-main.zip, que descargó de GitHub en su programa de archivo de archivos favorito. Alternativamente, Windows también puede abrir archivos ZIP por sí mismo si no tiene uno. Mantenga el archivo ZIP abierto en una ventana, luego abra otra ventana del Explorador de archivos y navegue hasta la carpeta C:\stable-diffusion que acabamos de crear.

    Arrastre y suelte la carpeta en el archivo ZIP, stable-diffusion-main, en la carpeta stable-diffusion.

    Regrese a Miniconda3, luego copie y pegue los siguientes comandos en la ventana:

    cd C:\stable-diffusion\stable-diffusion-main
    conda env create -f environment.yaml
    conda activate ldm
    mkdir models\ldm\stable-diffusion-v1

    No interrumpas este proceso. Algunos de los archivos tienen más de un gigabyte, por lo que podría tardar un poco en descargarse. Si interrumpe el proceso accidentalmente, deberá eliminar la carpeta del entorno y ejecutar conda env create -f environment.yaml nuevamente. Si eso sucede, vaya a C:\Users\(Your User Account)\.conda\envs y elimine la carpeta ldm, luego ejecute el comando anterior.

    Las líneas que ejecutamos crearon un nuevo entorno llamado ldm, descargaron e instalaron todas las bibliotecas de Python necesarias para que Stable Diffusion funcione, activaron el entorno ldm y luego cambiaron el directorio a una nueva carpeta. Estamos en el último paso de la instalación. Vaya a C:\stable-diffusion\stable-diffusion-main\models\ldm\stable-diffusion-v1 en el Explorador de archivos, luego copie y pegue el archivo de punto de control (sd-v1-4.ckpt) en la carpeta.

    Espere a que el archivo termine de transferirse, haga clic derecho en sd-v1-4.ckpt y luego haga clic en Cambiar nombre. Escriba model.ckpt en el cuadro resaltado, luego presione Enter para cambiar el nombre del archivo.

    Y eso es todo, hemos terminado. Estamos listos para usar Stable Diffusion ahora.

    Cómo usar la difusión estable

    El entorno ldm que creamos es esencial y debe activarlo cada vez que desee utilizar Stable Diffusion. Ingrese conda activar ldm en la ventana Miniconda3 y presione Enter. El (ldm) en el lado izquierdo indica que el entorno ldm está activo.

    Luego, debemos cambiar el directorio (por lo tanto, el comando cd) a C:\stable-diffusion\stable-diffusion-main antes de que podamos generar cualquier imagen. Pegue cd C:\stable-diffusion\stable-diffusion-main en la línea de comando.

    Cómo hacer una imagen con difusión estable

    Vamos a llamar a un script, txt2img.py, que nos permite convertir indicaciones de texto en imágenes de 512 × 512. Aquí hay un ejemplo. Prueba esto para asegurarte de que todo funciona correctamente:

    python scripts/txt2img.py --prompt "a close-up portrait of a cat by pablo picasso, vivid, abstract art, colorful, vibrant" --plms --n_iter 5 --n_samples 1

    Su consola le dará un indicador de progreso a medida que produce las imágenes.

    Ese comando producirá cinco imágenes cat, todas ubicadas en C:\stable-diffusion\stable-diffusion-main\outputs\txt2img-samples\samples.

    No es perfecto, pero se parece claramente al estilo de Pablo Picasso, tal como lo especificamos en el aviso. Tus imágenes deben verse similares pero no necesariamente idénticas.

    Cada vez que desee cambiar la imagen que se genera, solo necesita cambiar el texto contenido en las comillas dobles que siguen a --prompt.

    python scripts/txt2img.py --prompt "YOUR, DESCRIPTIONS, GO, HERE" --plms --n_iter 5 --n_samples 1

    Digamos que queríamos generar una tuza de aspecto realista en un bosque mágico con un sombrero de mago. Podríamos probar el comando:

    python scripts/txt2img.py --prompt "a photograph of a gopher wearing a wizard hat in a forest, vivid, photorealistic, magical, fantasy, 8K UHD, photography" --plms --n_iter 5 --n_samples 1

    Realmente es así de fácil: simplemente describe lo que quieres de la forma más específica posible. Si desea algo fotorrealista, asegúrese de incluir términos relacionados con una imagen realista. Si quieres algo inspirado en el estilo de un artista específico, especifica el artista.

    Stable Diffusion no se limita a retratos y animales, también puede producir paisajes sorprendentes.

    ¿Qué significan los argumentos en el comando?

    Stable Diffusion tiene una enorme cantidad de configuraciones y argumentos que puede proporcionar para personalizar sus resultados. Los pocos incluidos aquí son básicamente necesarios para garantizar que Stable Diffusion se ejecute en una computadora de juegos promedio.

    • –plms: especifica cómo se muestrearán las imágenes. Hay un artículo al respecto, si quieres comprobar las matemáticas.
    • –n_iter: especifica el número de iteraciones que desea generar para cada solicitud. 5 es un número decente para ver qué tipo de resultados está obteniendo.
    • –n_samples: especifica el número de muestras que se generarán. El valor predeterminado es 3, pero la mayoría de las computadoras no tienen suficiente VRAM para admitir eso. Quédese con 1 a menos que tenga una razón específica para cambiarlo.

    Por supuesto, Stable Diffusion tiene un montón de argumentos diferentes que puedes implementar para modificar tus resultados. Ejecute python scripts/txt2img.py --help para obtener una lista exhaustiva de argumentos que puede usar.

    Hay un montón de pruebas y errores involucrados para obtener excelentes resultados, pero eso es al menos la mitad de la diversión. Asegúrese de escribir o guardar argumentos y descripciones que devuelvan los resultados que le gustan. Si no quiere hacer todo el experimento usted mismo, hay comunidades en crecimiento en Reddit (y en otros lugares) dedicadas a intercambiar imágenes y las indicaciones que las generaron.