female-portrait-director: convierte los prompts de retrato en un Skill reutilizable
"El README de GitHub de female-portrait-director confirma el propósito del proyecto, la versión V1.4.1, el autor, la licencia MIT, los 14 estilos, los comandos de instalación, el formato de salida y los límites de seguridad."
"El SKILL.md del proyecto confirma el orden de la carga bajo demanda, el enrutamiento por registro, las reglas de bloqueo de parámetros, el prompt fusionado en cinco párrafos y los bloques de código separados listos para copiar."
"El parameter_schema.md del proyecto confirma los 22 campos de parámetros, sus valores por defecto y los 5 modos de salida."
"La documentación de OpenAI Codex sobre Agent Skills confirma los campos obligatorios del SKILL.md, la divulgación progresiva (alrededor del 2 % del contexto u 8.000 caracteres), la invocación explícita/implícita y la distribución."
Cualquiera que ajuste imágenes de retrato ha pasado por el mismo ritual: la última vez lograste armar a duras penas un prompt que funcionaba, y esta vez lo reescribes desde cero para una escena nueva. Cambias al café y añades indicaciones de luz; cambias al estilo gufeng y cambias las palabras de vestuario; mezclas por accidente las palabras clave de «pureza» y «retro de Hong Kong», y el rostro empieza a contaminarse entre estilos. Peor son las partes incontrolables: escribiste 9:16 y obtienes un cuadrado, solo querías un retrato de moda y el modelo añade su propio filtro.
female-portrait-director ataca justo este problema de «los prompts no son reutilizables». Es un Skill open source para dirigir prompts de retrato con IA: le das unos pocos parámetros estructurados, bloquea la dirección que fijas de forma explícita, carga una sola ruta de estilo bajo demanda, expande los parámetros en un prompt coherente que parece fotografiado y añade restricciones negativas. Su valor no es otro conjunto más de prompts universales. Es que convierte un prompt, de texto de un solo uso que reescribes cada vez, en una interfaz reutilizable, mantenible y con límites. Lo que de verdad vale la pena desmenuzar son los cuatro pilares de ingeniería que tiene detrás, que además son las partes que cualquier prompt puede adoptar.
Primero, en qué se diferencia de un prompt escrito a mano
El problema de un prompt de retrato largo escrito a mano no es que esté mal escrito. Es que es de un solo uso. Cambia la escena y editas la mitad de las palabras a mano; cambia el estilo y tienes que recordar qué palabras clave no pueden coexistir; vuelve a él dos semanas después y ni tú sabes por qué lo escribiste así.
Pon los tres enfoques uno al lado del otro y la diferencia salta a la vista:
| Dimensión | Prompt a mano | Plantilla de prompt | Skill de prompt |
|---|---|---|---|
| Reutilización | Baja, reescribir cada vez | Media, copiar y ajustar | Alta, basta con rellenar campos |
| Consistencia | Depende del pulso | Depende de cuánto cuides los ajustes | Garantizada por las reglas |
| Mantenibilidad | Difícil, disperso por todas partes | Regular, las plantillas caducan | Buena, se edita en un solo sitio |
| Aislamiento de estilos | Se mezcla con facilidad | A criterio propio | Carga una sola ruta bajo demanda |
| Límites de seguridad | Recordados cada vez | En un comentario | Fijados de forma rígida en las reglas |
| Coste de aprendizaje | Bajo | Bajo | Medio, primero montas la estructura |
Las plantillas ya son un gran salto frente a los prompts en bruto, y sobre eso existe una biblioteca de 12 patrones de diseño de prompts reutilizables. Pero el techo de una plantilla es «copiar y ajustar»; no puede imponer el aislamiento de estilos ni atrapa los límites de seguridad. Un Skill va un paso más allá: pliega la entrada en campos, asienta las reglas en archivos y deja que la IA funcione según esas reglas.
female-portrait-director en 30 segundos
El proyecto lo desarrolla Li Yue, con licencia MIT, y a junio de 2026 la versión es V1.4.1. Se distribuye como Codex Skill y sigue el estándar general de los agent skills (un SKILL.md con un name y una description). Una vez instalado, escribe $female-portrait-director en el chat para invocarlo.
Puedes resumir su funcionamiento con un flujo mínimo: rellenas unos pocos campos a partir de una plantilla y devuelve cuatro secciones estructuradas.
Entrada (plantilla mínima):
Estilo: retrato lifestyle limpio
Escena: sitio junto a la ventana en una cafetería
Vestuario: cárdigan de punto blanco + capa interior clara
Ambiente: limpio y suave
Formato: 9:16
Salida (cuatro secciones):
1. Parámetros bloqueados: reproduce tu entrada campo por campo
2. Análisis por módulo: cómo se tratan rostro / silueta / vestuario / escena / cámara / luz / filtro
3. Prompt final: un solo bloque listo para copiar
4. Restricciones negativas: qué evitar
Fíjate en que no hay una lista resumida en la salida. Expande los pocos campos que diste en una escena concreta, y esa es la diferencia fundamental con una plantilla. Como dice el proyecto: los ejemplos muestran cómo se ve lo «terminado», no son plantillas fijas, y cada ejecución debería volver a elegir el evento, la acción y los detalles del entorno.
Instalación y primera invocación
Instalación en una línea con npx
Lo más rápido es instalarlo de forma global en los skills de Codex con npx:
npx skills@latest add liyue-aigc/female-portrait-director -g -a codex -y
Para actualizar más adelante:
npx skills@latest update female-portrait-director -g -y
git clone manual
También puedes clonarlo en la carpeta skills de Codex. Windows PowerShell:
git clone https://github.com/liyue-aigc/female-portrait-director.git "$env:USERPROFILE\.codex\skills\female-portrait-director"
macOS o Linux:
git clone https://github.com/liyue-aigc/female-portrait-director.git "${CODEX_HOME:-$HOME/.codex}/skills/female-portrait-director"
Tras instalarlo, reinicia Codex o abre una conversación nueva y escribe $female-portrait-director para activarlo. Vale la pena conocer un mecanismo: Codex usa divulgación progresiva. Por defecto solo mete en el contexto el name, la description y la ruta de cada skill, con la lista inicial limitada a alrededor del 2 % de la ventana de contexto, u 8.000 caracteres cuando la ventana es desconocida; solo lee el SKILL.md completo cuando decide usar un skill. Eso significa que puedes instalar un montón de skills sin saturar el contexto de forma permanente, algo clave para entender el diseño que sigue. Consulta el README del repositorio para la versión y los comandos exactos.
Pilar uno: bloqueo de parámetros, para que lo que dices no se reescriba
La forma más común en que un prompt de retrato se rompe es que el modelo cambie en silencio lo que pediste de forma explícita. Escribiste 9:16 y obtuviste un cuadrado; solo querías un retrato de moda y añadió un filtro por su cuenta.
La primera capa del diseño de female-portrait-director es el bloqueo de parámetros. Define 22 campos de parámetros, desde estilo, escena, vestuario y paleta hasta cámara, luz, formato y uso de plataforma, cada uno con un valor por defecto. La regla es firme: bloquear los campos que el usuario fijó de forma explícita, rellenar solo los que faltan y nunca reemplazar la dirección. Como explica la FAQ del proyecto, lo que se bloquea es la dirección que elegiste, no el detalle a nivel de píxel, así que no limita la creatividad; el sistema sigue añadiendo el momento natural, la cadena de acciones y la mirada.
Un control duro como el formato recibe una salvaguarda extra. El proyecto exige poner el formato y el tamaño en píxeles en la primera frase del prompt final, con tu valor exacto. La razón es el viejo problema de arriba: en medio o al final, el modelo tiende a ignorarlo; en la primera frase, como restricción dura, el formato de salida se mantiene estable.
Llevada a tu caso, esta capa equivale a definir un esquema de entrada con valores por defecto para tu prompt. Decide qué campos debe poseer el usuario y cuáles pueden recurrir de forma automática a los valores por defecto, y solo entonces el prompt se vuelve reutilizable.
Pilar dos: enrutamiento bajo demanda, cargar un estilo a la vez
Admite 14 estilos, desde lifestyle limpio, moda urbana y fotos de modelo de e-commerce hasta gufeng fantasy, retro de Hong Kong y nuevo estilo chino. Una pregunta natural: ¿por qué no meter los 14 en un prompt gigante y dejar que el modelo elija?
Porque meterlos juntos provoca contaminación. Con las palabras clave gufeng y las de retro de Hong Kong presentes a la vez, el modelo mezcla con facilidad rasgos de ambos en un solo rostro. El enfoque del proyecto es usar un registro de estilos ligero (style-registry) como único punto de entrada de enrutamiento, donde cada solicitud solo hace coincidir y lee un archivo de ruta de estilo, y los otros 13 nunca entran en el contexto. La FAQ lo dice sin rodeos: la carga bajo demanda reduce las reglas irrelevantes en el contexto, recorta la contaminación de estilos y la salida estereotipada, y mejora la eficiencia de procesamiento.
Esta idea es el mismo principio de ingeniería que la divulgación progresiva de Codex mencionada antes, solo que en otro nivel. Codex carga a nivel de framework solo la description de un skill y lee el texto completo al coincidir; female-portrait-director lo hace de nuevo dentro del skill, mira primero el registro y lee solo esa única ruta de estilo al coincidir. Ambos responden a la misma pregunta: el contexto es un recurso escaso, así que no lo viertas todo de golpe.
La conclusión también es clara: cuando tu prompt tiene que cubrir muchos estilos, escenas o tipos de tarea, no apiles un prompt monstruoso; usa una estructura de «registro más carga bajo demanda» para que cada invocación cargue solo la parte relevante.
Pilar tres: expansión dirigida modular, convertir parámetros en escena
Si la salida estándar solo reordena los campos que rellenaste, no se diferencia de una plantilla. female-portrait-director insiste en que la salida estándar no debe ser un resumen, porque un resumen no basta para controlar la generación de forma estable.
Descompone la escena en 7 módulos visuales: rostro, silueta, vestuario, escena, cámara y pose, luz y filtro. El prompt final de la salida detallada estándar debe tener exactamente cinco párrafos, que cubren en orden la persona y su temperamento; el corte temporal y la acción; la silueta y el vestuario; la escena y la cámara; la luz y el filtro. La expansión dirigida consiste en usar un corte temporal más un pequeño evento, una cadena de acciones, un punto de mirada y dos o tres detalles de entorno escogidos para fundir esos campos en un momento coherente, en lugar de apilar los campos en una lista.
Aquí la diferencia en términos concretos. Un resumen escribe «cárdigan blanco, cafetería, luz suave». Una dirección escribe un instante captado: un sitio junto a la ventana, acaba de dejar su taza, la mirada en la calle de fuera, la luz de la tarde entrando por la izquierda. Lo segundo controla la generación de forma estable; lo primero solo apuesta.
Esta capa nos recuerda que reutilizable no es plantilla para rellenar. La estructura sirve a la estabilidad, pero tienes que dejar espacio para la expansión y el razonamiento, o cada imagen reutilizada sale igual.
Pilar cuatro: límites de seguridad y formato de salida, más reutilizable significa más controlado
Convertir un conjunto de prompts de retrato en un Skill que cualquiera puede invocar amplifica el riesgo de cumplimiento, así que los límites deben escribirse en las reglas en lugar de recordarse cada vez.
Los límites de seguridad de female-portrait-director son explícitos: por defecto genera mujeres ficticias claramente adultas; la conservación de identidad solo se permite con tus propias imágenes de referencia o de adultos autorizados; sexualizar a menores, la desnudez explícita, las imágenes no consentidas y la suplantación de identidad están prohibidos. Incluso para estilos centrados en las curvas, exige evitar las partes íntimas expuestas y los encuadres de edad ambigua. Son las restricciones de uso responsable del proyecto; en la generación real debes además respetar las reglas de tu plataforma y la ley local.
El formato de salida también es una forma de control. Exige que el prompt final y las restricciones negativas estén cada uno en un bloque de código separado etiquetado como text, con los títulos fuera del bloque para copiar con facilidad y sin que el análisis se cuele en el contenido listo para copiar. El detalle parece menor, pero importa para la reutilización: quien invoca obtiene siempre la misma estructura predecible.
Hazlo tú: 5 pasos para plegar tu prompt en un Skill
Este enfoque no se limita a los retratos. Cualquier prompt que reescribas una y otra vez se puede plegar en un Skill con los cinco pasos siguientes.
- Extraer un esquema de parámetros. Lista como campos lo que cambias cada vez y da a cada campo un valor por defecto. Decide cuáles debe fijar el usuario y cuáles pueden recurrir a los valores por defecto.
- Construir un registro con carga bajo demanda. Si hay muchos estilos o tipos de tarea, construye una tabla de entrada ligera y carga solo el archivo de regla coincidente cada vez, en lugar de apilarlas todas juntas.
- Escribir reglas de expansión dirigida. Especifica cómo expandir los campos en un resultado coherente, no volver a listarlos.
- Fijar límites de seguridad y un contrato de salida. Fija de forma rígida las prohibiciones y la estructura de salida para que cada invocación devuelva un formato predecible.
- Empaquetarlo como SKILL.md. Escribe un
namey unadescriptionclaros, con la description detallando el escenario de activación y los límites para que el agente pueda hacer coincidir de forma implícita.
Un esqueleto mínimo de SKILL.md
Cambia el contenido por tu dominio; esto es un ejemplo escrito a mano, no el original del proyecto:
---
name: my-prompt-skill
description: Se activa cuando el usuario necesita un prompt de tipo X; toma unos pocos campos y devuelve un resultado estructurado con restricciones negativas.
---
# Flujo
1. Leer los campos, bloquear los que el usuario fijó de forma explícita, rellenar los que faltan con valores por defecto.
2. Elegir una ruta de estilo/tarea coincidente del registro y cargar solo esa.
3. Expandir en un resultado coherente según las reglas de expansión dirigida, sin listar campos.
4. Producir el resultado final y las restricciones negativas en bloques de código separados.
Algunas trampas comunes al construirlo, con sus correcciones:
| Síntoma | Causa | Corrección |
|---|---|---|
| Los campos fijados por el usuario cambian | Sin bloqueo de parámetros | Reproducir de forma explícita el resultado bloqueado, poner los controles duros en la primera frase |
| Contaminación de estilos | Muchas reglas en el contexto de golpe | Enrutar mediante un registro, cargar una a la vez |
| La salida se vuelve una lista de campos | Faltan reglas de expansión dirigida | Exigir expansión a una escena o resultado coherente |
| Instalado pero no se activa | La description es demasiado vaga | Poner el escenario de activación y las palabras clave en la description |
A quién le conviene y a quién no
No toda necesidad merece convertirse en un Skill. Una valoración rápida:
| Tu situación | Recomendación |
|---|---|
| Sacas a menudo retratos similares y quieres reutilización estable | Instalar el Skill ya hecho |
| Tienes tus propios prompts de dominio que reescribes sin parar | Construir uno propio siguiendo este enfoque |
| Solo necesitas una o dos imágenes por ahora | Sin Skill, a mano es más rápido |
| Hay personas reales o imágenes de referencia | Confirma primero la autorización y el cumplimiento, luego piensa en automatizar |
Lo que de verdad vale la pena tomar de female-portrait-director no son sus 14 estilos, sino cómo trata un prompt como un objeto de ingeniería: la entrada tiene un esquema, las reglas se cargan bajo demanda, la expansión tiene un método y los límites viven en archivos. Para entender el mecanismo de los Skills en sí, empieza por la función Skill de Claude Code; para otra manera de plegar instrucciones recurrentes en un archivo de configuración reutilizable, mira la guía para escribir un CLAUDE.md.
Conclusión
female-portrait-director hizo con los prompts de retrato algo que la mayoría no hace: los convirtió, de texto que reescribes cada vez, en una interfaz con un esquema de entrada, enrutamiento bajo demanda, expansión dirigida y límites claros. No tienes que usar sus funciones de retrato, pero sus cuatro pilares de ingeniería se trasladan directamente a cualquier prompt que no dejes de ajustar. El siguiente paso es simple: elige un prompt que reescribas dos o tres veces por semana, pliégalo en un SKILL.md con esos 5 pasos y ejecútalo dos veces para ver si es más estable que a mano.
Convierte tu prompt en un Skill reutilizable
Siguiendo el diseño de female-portrait-director, convierte en un Skill un prompt que reescribes una y otra vez.
⏱️ Estimated time: 1 day
- 1
Step1: Extraer un esquema de parámetros
Lista como campos lo que cambias cada vez, da a cada campo un valor por defecto y decide qué campos debe fijar el usuario y cuáles pueden recurrir a los valores por defecto. - 2
Step2: Construir un registro con carga bajo demanda
Cuando hay muchos estilos o tipos de tarea, construye una tabla de entrada ligera y carga solo el archivo de regla coincidente cada vez, en lugar de meter todas las reglas en el contexto de golpe. - 3
Step3: Escribir reglas de expansión dirigida
Especifica cómo expandir los campos en un resultado coherente en lugar de volver a listarlos, dejando espacio para la expansión y el razonamiento. - 4
Step4: Fijar límites de seguridad y un contrato de salida
Fija de forma rígida las prohibiciones y la estructura de salida para que cada invocación devuelva un formato predecible, listo para copiar. - 5
Step5: Empaquetarlo como SKILL.md
Escribe un name y una description claros que expliquen el escenario de activación y los límites, para que el agente pueda hacer coincidir de forma explícita o implícita.
FAQ
¿Qué es female-portrait-director?
¿Cómo instalo female-portrait-director en Codex?
¿En qué se diferencia escribir prompts de retrato con un Skill de escribir un bloque largo a mano?
¿El bloqueo de parámetros limita la libertad creativa?
¿Cómo construyo mi propio Skill de prompts reutilizable siguiendo este enfoque?
¿Qué puntos de seguridad y cumplimiento debo cuidar al generar retratos con él?
13 min de lectura · Publicado el: 10 jun 2026 · Actualizado el: 15 jun 2026
Caja de herramientas de AI Agents
Si llegaste desde búsqueda, lo más rápido es ir al artículo anterior o siguiente de esta misma serie.
Anterior
guizang-social-card-skill: una pipeline reutilizable para tarjetas de Xiaohongshu y portadas de WeChat
¿Cómo se usa guizang-social-card-skill? Esta guía se apoya en el README de GitHub y la documentación de Skills de Claude Code / Codex para explicar instalación, plantillas, temas, render, licencia y checklist de QA.
Parte 2 de 4
Siguiente
ADHD: cómo curar la convergencia prematura de los agentes de código con razonamiento divergente paralelo
ADHD es un skill open source construido sobre el Agent SDK de Claude y Codex que combate la convergencia prematura de los agentes de código con divergencia paralela aislada más una pasada de critic separada. Aquí van sus diferencias estructurales con Chain-of-Thought y Tree-of-Thought, cuándo recurrir a él, cómo instalarlo y activarlo, y el coste de una ejecución.
Parte 4 de 4
Artículos relacionados
Continuum y la elección de un agent runtime: 7 capacidades que mirar del notebook a producción
Continuum y la elección de un agent runtime: 7 capacidades que mirar del notebook a producción
Mnemo, capa de memoria local: recuerdo portable para Ollama y apps LLM propias
Mnemo, capa de memoria local: recuerdo portable para Ollama y apps LLM propias
vibecode-pro-max-kit: especificaciones, memoria y colaboración multiagente para programar con IA
Comentarios
Inicia sesión con GitHub para dejar un comentario