MÓDULO 1.1 - FUNDAMENTOS

🤖 O que é Geração de Imagens com IA

Entenda a revolução que está transformando a criação visual: de onde viemos, onde estamos e para onde vamos.

~30
Minutos
4
Conceitos
2015→
Timeline
🎨

A Revolução Visual do Século XXI

Uma mudança de paradigma na criação de imagens

Pela primeira vez na história, qualquer pessoa pode criar imagens de qualidade profissional usando apenas palavras. Não é exagero dizer que estamos vivendo uma das maiores revoluções criativas desde a invenção da fotografia.

📊 O Impacto em Números

275M+ vídeos gerados no Google Flow em 5 meses
2025 ano em que IA atingiu "momento GPT-3" para vídeo
4K resolução máxima do Nano Banana Pro
~10s tempo para gerar uma imagem de alta qualidade

💡 Por que isso importa para você

Dominar a geração de imagens com IA não é mais um diferencial — é uma habilidade essencial. Designers, marketers, criadores de conteúdo e até desenvolvedores estão usando essas ferramentas diariamente. Quem entende como "conversar" com a IA tem uma vantagem competitiva enorme.

📅

A Evolução: De DeepDream ao Nano Banana

Uma jornada de 10 anos de inovação

2015

DeepDream do Google

O Google lança o DeepDream, que "sonha" imagens psicodélicas e virais. É o primeiro vislumbre do potencial da IA para arte, ainda que limitado a padrões abstratos e "olhos de cachorro" por toda parte.

2016

Prisma e Style Transfer

O app Prisma populariza o "style transfer" — transformar fotos em pinturas no estilo de Van Gogh ou Picasso. Milhões de pessoas experimentam IA aplicada à arte pela primeira vez.

2021

DALL-E e a Era dos Transformers

A OpenAI lança o DALL-E, combinando modelos de linguagem com geração de imagens. Pela primeira vez, você pode descrever uma cena em texto e a IA cria uma imagem original.

2022

Stable Diffusion e Midjourney

Stable Diffusion é lançado como open-source, democratizando a tecnologia. Midjourney conquista artistas com qualidade impressionante. A corrida da IA generativa acelera.

2025

Nano Banana e a Era Multimodal

O Google lança o Gemini 2.5 Flash Image (codinome: Nano Banana) — um modelo que entende contexto, edita imagens e trabalha nativamente com o Gemini. Logo depois, o Nano Banana Pro (Gemini 3 Pro Image) eleva a qualidade para 4K. A geração de vídeo com Veo 3.1 atinge qualidade cinematográfica.

Onde estamos hoje: Os modelos atuais não apenas geram imagens — eles entendem conceitos, mantêm consistência entre múltiplas imagens, renderizam texto com precisão e até geram vídeos com áudio sincronizado.

⚙️

Como a IA Gera Imagens (Versão Simples)

Entendendo o básico sem precisar de PhD

Você não precisa entender matemática avançada para usar essas ferramentas, mas ter uma noção de como funcionam vai te ajudar a escrever prompts melhores.

🔄 O Processo de Geração (Modelos de Difusão)

1

Começa com Ruído

A IA começa com uma imagem de "estática de TV" — ruído aleatório puro, como granulação de uma foto antiga.

2

Interpreta seu Prompt

Seu texto é convertido em uma representação matemática que a IA entende. Cada palavra influencia diferentes aspectos da imagem.

3

Remove o Ruído Gradualmente

Em dezenas de passos, a IA "limpa" o ruído guiada pelo seu prompt, revelando a imagem final como uma escultura emergindo do mármore.

4

Entrega a Imagem Final

O resultado é uma imagem completamente nova, nunca antes vista, que corresponde à sua descrição.

🎭 Analogia: O Diretor e o Artista

Pense assim: você é o diretor de um filme, e a IA é um artista incrivelmente talentoso que pode desenhar qualquer coisa — mas que só fala uma língua diferente. Seu trabalho é aprender a se comunicar claramente com esse artista. Quanto mais específico e claro você for, mais o resultado vai corresponder à sua visão.

🍌

O que é o Nano Banana

A ferramenta que você vai dominar neste curso

Nano Banana é o codinome dado pela comunidade ao modelo de geração de imagens do Google, lançado como Gemini 2.5 Flash Image em agosto de 2025. Ele trabalha nativamente com o Gemini, permitindo conversas iterativas para refinar suas imagens.

📊 Nano Banana vs Nano Banana Pro

Característica Nano Banana Nano Banana Pro
Motor Gemini 2.5 Flash Image Gemini 3 Pro Image
Resolução Até 1K (~1 MP) 2K–4K (~8 MP)
Imagens de Referência Até 5 Até 14
Texto em Imagens Limitado Preciso e multilíngue
Ideal Para Edições rápidas, redes sociais Marketing, design profissional

✓ Vantagens do Nano Banana

  • Conversacional: refine imagens via chat
  • Gratuito no plano básico do Gemini
  • Rápido: ~10 segundos por imagem
  • Edição de imagens existentes
  • Integração nativa com Gemini

🚀 Quando Usar o Pro

  • Precisa de resolução 4K para impressão
  • Texto preciso em imagens (logos, cartazes)
  • Múltiplas imagens de referência
  • Consistência de personagens
  • Trabalhos comerciais e publicitários

✅ O que você aprendeu neste módulo

A geração de imagens com IA é uma revolução criativa
Evolução: DeepDream → DALL-E → Nano Banana
Modelos de difusão: do ruído à imagem
Você é o diretor, a IA é o artista
Nano Banana: rápido e conversacional
Nano Banana Pro: 4K e controle avançado

Próximo: Entenda como os modelos de IA "veem" e processam informação

Fontes: Google Blog, Max Woolf, GlobalGPT