Búsqueda de sitios web

Cómo escribir un mensaje de difusión estable impresionante


Stable Diffusion, un popular generador de arte de IA, requiere indicaciones de texto para crear una imagen. A veces hace un trabajo increíble y genera exactamente lo que quieres con un aviso vago. Otras veces, obtiene resultados subóptimos. Aquí hay algunos consejos y trucos para obtener resultados ideales.

Cómo escribir un indicador de difusión estable

Si ha pasado algún tiempo con los generadores de imágenes de IA, como Stable Diffusion, DALL-E o MidJourney, habrá notado que un aviso bien redactado es crítico. Un aviso bien redactado es la diferencia entre convertir tu idea en una gran imagen y obtener una monstruosidad de un valle inquietante con demasiados dedos mirándote fijamente.

La gente ha estado tratando de descubrir las mejores formas de obtener resultados ideales desde que se lanzó Stable Diffusion en agosto de 2022, y serán herrería rápida o ingeniería rápida en los años venideros. Eso es especialmente probable ya que los puntos de control que informan cómo Stable Diffusion genera imágenes recibirán actualizaciones periódicas. El aviso ideal va a ser un objetivo en movimiento en el futuro previsible.

Sé tan específico como puedas

Stable Diffusion tiende a prosperar con indicaciones específicas, especialmente cuando se compara con algo como MidJourney. Tienes que decirle exactamente lo que quieres. Aquí hay un ejemplo usando los animales favoritos de Internet: Gatos lindos.

Muy bien, son bastante lindos, excepto tal vez por el pobre tipo en el medio superior que parece haber pasado demasiado tiempo mirando al abismo. Pero, ¿y si quisieras gatos grises, no una mezcla de gatos? Bueno, tienes que especificar eso. Utilice Lindos gatos grises como mensaje en su lugar.

Ahora Stable Diffusion devuelve todos los gatos grises. Puede seguir agregando descripciones de lo que desea, incluido el uso de accesorios para los gatos en las imágenes.

Esto se aplica a cualquier cosa que desee que produzca Stable Diffusion, incluidos los paisajes. Sea descriptivo, y mientras prueba diferentes combinaciones de palabras clave, tome nota mental de cómo cambia la imagen. Algunas palabras y frases tienden a sesgar más fuertemente una imagen que otras palabras, por lo que es posible que deba ajustar su solicitud en consecuencia.

Nombre estilos o medios de arte específicos

La necesidad de especificidad no termina cuando describe completamente el contenido de la imagen que desea. También puede (y debe) especificar el estilo que desea. Nos quedaremos con nuestro mensaje Lindo gato gris para esto. Digamos que queremos algunos lindos gatos grises, pero también queremos que se vean como si fueran una pintura acrílica. Lo primero que debe intentar es agregar pintura acrílica como la siguiente palabra clave en su aviso, de modo que diga: Lindo gato gris, pintura acrílica.

Por lo general, es mejor comenzar con la menor cantidad de palabras clave para acercarse a lo que desea y luego agregar más para centrarse en la estética que está buscando.

La difusión estable reconoce docenas de estilos diferentes, desde dibujos a lápiz hasta modelos de arcilla y renderizado 3D de Unreal Engine.

Esas indicaciones de ejemplo son extremadamente simples, pero puede usar docenas de palabras clave para ajustar sus resultados. Si desea modelos extraños de pollos de arcilla de colores psicodélicos en un Walmart, debe especificar todos esos términos.

Nombre artistas específicos para guiar la difusión estable

Stable Diffusion es capaz de hacer más que emular estilos o medios específicos; incluso puede imitar a artistas específicos si quieres hacer eso. Este ejemplo lo usó Pablo Picasso.

Definitivamente deberías intentar lanzar por (Nombre del artista) en tus avisos si aún no lo has hecho. Tiende a producir resultados dramáticos. No tengas miedo de combinar artistas que normalmente tampoco irían juntos. A menudo, Stable Diffusion combinará sus respectivos estilos de formas emocionantes e impredecibles.

Pondera tus palabras clave

Por supuesto, el simple hecho de introducir palabras clave en su aviso solo lo llevará hasta cierto punto. ¿Qué sucede si obtiene todas las cosas correctas en su solicitud, pero no están proporcionadas adecuadamente?

Stable Diffusion admite la ponderación de palabras clave rápidas. En otras palabras, puede decirle que realmente necesita prestar atención a una palabra clave específica (o palabras clave) y prestar menos atención a otras. Es útil si está obteniendo resultados que son un poco lo que está buscando, pero no del todo.

En la versión de línea de comandos de Stable Diffusion, solo agrega dos puntos completos seguidos de un número decimal a la palabra que desea enfatizar. Los números decimales son porcentajes, por lo que deben sumar 1.

Volviendo a nuestro indicador Lindo gato gris, imaginemos que estaba produciendo gatos lindos correctamente, pero no muchas de las imágenes de salida mostraban gatos grises. Podría modificar el indicador para que diga: lindo, gato gris: 0.7 en su lugar, y prestaría más atención al gato gris, luego aplicaría automáticamente la diferencia a lindo. También puede asignar pesos a cada palabra en el indicador manualmente si desea un control más preciso, como Lindo: 0.10, Gato gris: 0.60, Representación de Unreal Engine: 0.30, por ejemplo.

La mayoría de las GUI disponibles para Stable Diffusion manejan la ponderación sin necesidad de ingresar porcentajes explícitos. Por lo general, puede agregar paréntesis alrededor de un término en su solicitud para enfatizarlo y corchetes para disminuir la importancia de un término. Entonces, el anterior lindo gato gris podría verse como [lindo], ((gato gris)).

Encuentra inspiración en otros lugares

Stable Diffusion y otros generadores de arte de IA han experimentado un pico de popularidad explosivo. Puedes encontrar este tipo de arte de IA por todas partes. Eso significa que ahora hay al menos unos pocos millones de imágenes generadas por usuarios flotando en Internet, y la mayoría de las veces, las personas incluyen el aviso que usaron para obtener sus resultados.

Aquí hay algunos recursos para ayudarlo a despertar su inspiración si no está seguro de lo que está buscando crear:

  • Lexica: un repositorio de imágenes generadas con Stable Diffusion y el aviso correspondiente. Se puede buscar por palabra clave.
  • Estudios de estilo de artista de Stable Diffusion : una lista no exhaustiva de artistas que Stable Diffusion podría reconocer, así como descripciones generales de su estilo artístico. Existe un sistema de clasificación para describir qué tan bien responde Stable Diffusion al nombre del artista como parte de un aviso.
  • Estudios de modificadores de difusión estable: una lista de modificadores que se pueden usar con Difusión estable, al igual que la página del artista.
  • La lista de modificadores de AI Art: una galería de fotos que muestra algunos de los modificadores más fuertes que puede usar en sus mensajes y lo que hacen. Están ordenados por tipo de modificador.
  • Los 500 mejores artistas representados en Stable Diffusion: sabemos exactamente qué imágenes se incluyeron en el conjunto de entrenamiento de Stable Diffusion, por lo que es posible saber qué artistas contribuyeron más al entrenamiento de la IA. En términos generales, cuanto más representado esté un artista en los datos de entrenamiento, mejor responderá Stable Diffusion a su nombre como palabra clave.
  • El subreddit Stable Diffusion: el subreddit Stable Diffusion tiene un flujo constante de nuevas indicaciones y descubrimientos divertidos. Si está buscando inspiración o conocimiento, no puede equivocarse.

Modificar otras configuraciones importantes

Un buen indicador es la parte más difícil de usar Stable Diffusion, pero hay algunas otras configuraciones que cambiarán drásticamente los resultados.

  • CFG: determina la fuerza con la que Stable Diffusion sigue su indicación. Los números más altos dan como resultado una mayor adherencia al mensaje, mientras que los números más bajos le dan a la IA más libertad. Intenta ajustar esto primero.
  • Método de muestreo: cómo se refina la imagen desde el ruido hasta formas reconocibles. Pruebe algunos de estos. Euler_a, k_LMS y PLMS parecen ser opciones populares.
  • Pasos de muestreo: la cantidad de veces que se muestrea una imagen antes de obtener un resultado final. A veces obtienes buenos resultados en 30 pasos, a veces necesitas ir a 50 u 80. Por lo general, no obtienes mejores resultados por encima de los 150 pasos. Comience con menos pasos y suba.

Algunas de nuestras sugerencias estilizadas favoritas

Estas son algunas de nuestras indicaciones favoritas, ya que tienden a funcionar de manera confiable. Simplemente ingrese un tema de su elección más algunos modificadores. Todas las demás configuraciones de difusión estable se mantuvieron igual que las indicaciones anteriores.

(sujeto), 35 mm, nítido

Elija un tema, y este indicador le devolverá de manera confiable resultados fotorrealistas de personas, animales y paisajes.

(Sujeto), representación 3d de baja poli, colores pastel vibrantes, cambio de inclinación, grano de película

Ingrese un tema y lo obtendrá en la estética Art of Rally.

(Asunto), (Descripción ambiental), cinematográfico, dramático, composición, cielo soleado, brutalista, hiperrealista, escala épica, sentido del asombro, hipermaximalista, nivel de detalles insano, artstation HQ

Simplemente ingrese un tema y una descripción ambiental, y este aviso le brinda excelentes imágenes de arte conceptual de la ciudad con un efecto ambiental de su elección. Aquí hay un ejemplo que usa la ciudad de Nueva York como tema y una tormenta de polvo como descripción ambiental:

Kermit cualquier cosa

Stable Diffusion produce excelentes resultados con Kermit. Pruébelo en cualquier lugar.

¿Por qué es así como Stable Diffusion interpreta Kermit en Mordor, y quién es el Kermit malvado rojo que está detrás de nuestro héroe incondicional? Ni idea.

Recuerde, no tenga miedo de eliminar lo que cree que podría ser un término clave de su mensaje. Ciertas palabras, como hermoso, influirán en gran medida en el aspecto de una imagen, incluso si no tiene un significado preciso. A medida que pase más tiempo con Stable Diffusion, desarrollará una idea de cómo responde a ciertas palabras, y rápidamente descubrirá que escribir un buen mensaje es un arte en sí mismo.