Veo 3 – inmodigitalin.com

No hay comentarios
Rober InmoDigitalIn
7 agosto, 2025

Ya podemos animar imágenes con Veo 3. Y lo más interesante es que no solo podemos animar una imagen a partir de un prompt, sino que podemos utilizar la misma imagen como indicación. Es decir, podemos animar imágenes como estas para que luzcan de este modo. Y lo interesante es que es realmente muy pero que muy sencillo.

Y quédate hasta el final porque en la segunda parte te voy a explicar un truco para aplicar esta técnica que en principio solo funciona en Veo 3 a otros generadores de vídeo mucho más económicos. Dentro vídeo.

Para ello podemos utilizar Flow, que es la propia herramienta de Google, que es la que ya nos permite acceder a esta función de Veo de animar con imágenes. De hecho, si accedemos a alguno de los proyectos de Flow, aquí estoy en uno de ellos, podemos ver que tenemos la herramienta de texto a vídeo y también la herramienta de imágenes a vídeo. Y como podéis ver, ya he ejecutado un par de instrucciones de este tipo, es decir, instrucciones donde la propia imagen es el prompt.

Fijaros, por ejemplo, aquí podemos ver esta imagen donde tenemos esta pantera, donde le digo que mira a un ratón de modo tranquilo y silencioso. Un ratón debería cruzar de derecha a izquierda. Luego veréis cómo ha quedado el vídeo y veréis que esto lo ha interpretado diferente, posiblemente porque interfiere con esta instrucción de aquí. Y finalmente en esta flecha azul de aquí le digo que un elefante pues camina a través de la calle al fondo. Pues fijaros, simplemente subiendo esta imagen y utilizándola como prompt podemos llegar a un resultado como este. Como podéis ver, más allá de que el ratón cruza en dirección contraria, ha respetado todos los elementos. Vemos como la pantera mira al ratón y vemos como el elefante camina al fondo.

Este sería un primer ejemplo. Luego tengo este otro que tampoco ha salido perfecto, ya os lo digo, pero aún así es, creo que es un ejemplo más complejo y donde respeta más o menos todas las indicaciones, excepto un pequeño matiz que seguramente es una limitación del propio modelo. Fijaros, en este caso le he subido esta imagen donde incluso añado dentro de la imagen la secuenciación de lo que va a suceder. Es decir, dentro de la imagen le digo qué tiene que pasar primero. Primero, un conjunto de vacas se escapan de la granja. Segundo, el chico mira a las vacas. Tercero, sale corriendo fuera del frame y finalmente vuelve montando a caballo para perseguir a las vacas. Y fijaros en el resultado final. Fijaros como primero aparecen las vacas. Él se gira y mira. Corre para salir del frame, pero la cámara le sigue y en vez de volver él con el caballo, pues vuelve un clon suyo montando a caballo para perseguir a las vacas. Pero fijaros cómo hemos conseguido incluso mantener la secuenciación de los hechos que queríamos que sucediesen en el clip.

Bien, ¿cómo se hace esto? Pues como os podéis imaginar, es realmente muy pero que muy sencillo. Simplemente cogemos una imagen generada con inteligencia artificial o una imagen normal, la subimos a una herramienta como Canva y aquí pues por ejemplo con la herramienta de dibujar pues dibujamos las flechas que consideremos y con la herramienta de texto pues añadimos los textos al lado de cada flecha para indicar la instrucción concreta.

Por ejemplo, ya tengo preparada esta imagen de aquí, donde el cohete debería aterrizar, el hombre debería correr hacia el cohete y la mujer debería correr hacia el edificio. Pues bien, una vez tenemos la imagen preparada, lo único que tenemos que hacer es lo siguiente en flow. Simplemente nos vamos a añadir la imagen y la añadimos como frame inicial. La ajustamos para que la coja entera y una vez subida como frame inicial, aquí la podéis ver, simplemente le damos esta instrucción, execute, ejecutar, y enviamos. En este caso, tened en cuenta que podéis seleccionar entre dos calidades. La calidad alta, que es con la que he probado alguna generación y la verdad es que no hay una diferencia sustancial en cuanto a tendencia al prompt respecto a la rápida, y la rápida que consume cinco veces menos. Por lo que si tenéis acceso a Flow, yo os recomiendo que lo hagáis con la rápida y simplemente enviamos la indicación. Y aquí tenemos el resultado que se ve de este modo. Podemos ver como ambos empiezan a correr. La chica no queda muy claro si va hacia el edificio o hacia el cohete. Al final corren juntos, pero sí que podemos ver como ambos se han girado, empiezan a correr y vemos cómo aparece el cohete por el sitio donde debía aparecer.

Y llegados a este punto, toca hacernos una pregunta que es muy pertinente. Este método se puede aplicar a cualquier otro generador de vídeo con inteligencia artificial porque es evidente que con Veo 3 conseguimos buenos resultados, pero también es cierto que es un modelo especialmente caro, por lo que si lo pudiésemos hacer con otros modelos de generación de vídeo sería ideal.

Y lo cierto es que puede conseguirse, pero con un pequeño truco que os voy a explicar a continuación. Y lo voy a hacer a través de una plataforma que nos permite acceder a una amplia gama de modelos tanto de generación de imagen como de generación de vídeo en una única suscripción. Y además lo interesante es que tienen suscripciones que nos permiten acceder, por ejemplo, a la generación de imágenes de un modo completamente ilimitado con todos los modelos que ofrecen. Mientras que en generación de vídeo ahora mismo nos permiten acceder de modo ilimitado a alguno de sus modelos de vídeo, aunque esta promoción termina muy pronto. De modo que si lo queréis probar, daros prisa.

Dicho esto, vamos a su parte de generación de vídeo, a su interfaz de generación de vídeo. Aquí podéis ver como ya he generado algunos vídeos con los sketch que he usado en Veo 3 y lo cierto es que no he conseguido los resultados que esperaba. De entrada no se puede hacer inmediatamente. Es decir, si yo intento utilizar otros modelos, fijaros qué sucede. Aquí tenemos el vídeo en cuestión y lo cierto es que las instrucciones que habíamos puesto escritas, pues no desaparecen en estos dos modelos. Aquí podéis ver lo que ha sucedido.

Sin embargo, utilizando las mismas imágenes y con un pequeño truco, fijaros cómo he conseguido un vídeo donde la instrucción se respeta al 100%. Fijaros en este vídeo que también he generado con otro modelo. Las vacas salen, el chico sale de plano y vuelve a entrar montado a caballo. Fijaros, lo volvemos a ver. Vemos cómo salen las vacas, se gira, sale de plano, entra con el caballo, que era justo todas las instrucciones que aparecían en este sketch. Primero salen las vacas, luego el chico mira, sale de plano y vuelve a entrar. Pues bien, he conseguido con estos modelos que se respeten a la perfección todos y cada uno de estos esquemas.

Fijaros, tenemos este, tenemos este de aquí, donde primero tendría que llegar el cohete y luego la mujer tendría que correr hacia el edificio y el hombre hacia el cohete. Y este, por ejemplo, lo tenemos aquí. Y fijaros en este caso con el modelo también como aterriza el cohete y en este caso los dos van hacia el cohete. Pero si nos vamos al vídeo generado con el otro modelo, podemos ver como ambos empiezan a correr, la chica gira hacia el edificio y el hombre pues parece que va a dar la vuelta para encontrarse con el cohete, por lo que la instrucción se ha respetado al milímetro. Y fijaros también en este otro esquema de aquí, que en este caso este es un ejemplo nuevo, donde la complejidad es incluso más interesante. Primero cae un meteorito que se estalla contra el edificio, luego el astronauta baja del caballo y va corriendo hacia el fondo de la calle y el caballo sale corriendo hacia el otro lado. Y fijaros en este caso qué hemos conseguido. El resultado que he conseguido con el método que combina dos cosas que ahora veremos a continuación es este. Con un modelo vemos como ha caído el meteorito y el astronauta salta del caballo y va hacia el fondo mientras el caballo avanza. Y con el otro modelo hemos conseguido esto de aquí. Bueno, cae como el meteorito. El hombre sí que sale corriendo en la dirección adecuada. El caballo va en otra dirección, pero tampoco está nada mal el resultado.

Y finalmente tenemos también el ejemplo de la pantera, que con la pantera hemos conseguido estos resultados de aquí. Con un modelo vemos como el elefante, el único defecto es que el elefante cruza en la otra dirección, pero recordemos que con Veo 3 el que lo hacía en la otra dirección era el ratón, por lo que hemos llegado a un resultado muy similar a lo que habíamos conseguido con Veo 3 y con el otro modelo hemos conseguido este resultado de aquí. Aquí vemos como el ratón va en la dirección correcta, el elefante también. Y bueno, la pantera mira más al elefante que al ratón, pero no está nada mal el resultado que hemos conseguido.

¿Cómo lo hemos hecho? Como os he dicho anteriormente, hemos partido igualmente de los esquemas con los que hemos alimentado a Veo 3 en los ejemplos iniciales del vídeo, pero como hemos visto también no los podemos utilizar directamente para prompear estos modelos, pero podemos hacer un paso previo.

En el canal principal encontraréis un vídeo donde hablo de una técnica de prompting también para Veo 3 que consiste en utilizar texto estructurado en formatos como Jason. Pues basándome en esto, lo que he hecho es crearme un asistente en Gemini. Un asistente donde lo que yo puedo hacer es, en vez de proporcionar el esquema directamente al modelo de vídeo, un esquema como este, lo que puedo hacer es proporcionárselo a Gemini, simplemente enviar la imagen y después de enviar la imagen lo que va a hacer es crearme un prompt estructurado, en formato, y en este caso, donde vemos cómo secuencia todo lo que tiene que pasar. Primero, un grupo de vacas escapa de la granja hacia la parte inferior derecha y empieza pues detrás del granero y acaba fuera de cuadro. Luego el chico mira hacia las vacas, dirección hacia la derecha y en el centro del encuadre. Y tercero, el chico corre hacia fuera del encuadre hacia la izquierda. Es decir, lo que hace es convertir las instrucciones visuales que tenemos en esta imagen en puro texto estructurado, por lo que lo que yo puedo hacer es esta instrucción e irme a un modelo de generación de vídeo como los que hemos visto antes y simplemente proporcionarle esta instrucción.

Aquí podéis ver la instrucción que le he proporcionado. Simplemente cuando lo he hecho antes, me lo ha hecho en inglés, pero veis como es exactamente el mismo formato. Y de este modo puedo pasar exactamente la información visual a una información en formato de texto estructurado que el modelo entiende perfectamente y que puedo utilizar en modelos mucho, pero mucho más económicos, tal y como podéis ver, simplemente accediendo a la página y comparando el coste que tiene Veo 3 con cualquiera de los otros modelos disponibles.

Por lo que mi recomendación, si queréis aprovechar esta manera de dar indicaciones a los modelos de generación de vídeo, es que aprovechéis una plataforma que os da acceso a una gran variedad de modelos de generación de vídeo y convertáis estos sketch en formato de texto estructurado. Si lo queréis hacer con mi asistente, os podéis suscribir a mi newsletter y con el primer correo, pues recibiréis acceso al asistente. Encontraréis el enlace en la descripción. Y si queréis saber más sobre este tipo de prompts, los prompts con texto estructurado, te recomiendo que veas este vídeo.

Rober InmoDigitalIn

Agente Inmobiliario especialista en IA Empresarial y Marketing Digital Inmobiliario