Ferramentas

Dall-E 3: O Próximo Nível da Geração de Imagens com IA

Por Raquel Pereira

Agora, o ChatGPT vai contar com a geração de imagens exclusivas da versão 3.0 do Dall-E. Descubra como utilizar a ferramenta!

Raquel Pereira

Em setembro (20), a OpenAI anunciou oficialmente a próxima versão do seu gerador de imagens com recursos de inteligência artificial, o Dall-E 3.

Confira todos os detalhes sobre essa novidade e descubra como aplicá-la na sua estratégia de marketing digital:

Novidades na Edição de Imagens com o Dall-E e o ChatGPT

Desde o final de 2023, usuários das versões Plus e Enterprise do ChatGPT já têm acesso ao gerador de imagens da OpenAI diretamente no chatbot.

A grande novidade, anunciada em abril (3) deste ano, é que agora o gerador de imagens também possui recursos de edição, que podem ser ativados por meio de prompts no chatbot para aprimorar os resultados:

Conforme compartilhado em um vídeo pela própria startup, essa novidade permite que o usuário selecione os pontos da imagem que devem ser ajustados e, através de comandos no chatbot, consiga incluir ou remover elementos, ajustar o tamanho de objetos, etc.

A novidade já está disponível para todos os usuários das versões pagas do ChatGPT, tanto na web quanto nos dispositivos móveis (Android e iOS).

O que é o Dall-E?

O Dall-E é um modelo de IA generativa, desenvolvido pela OpenAI, com capacidades de geração de imagens criativas, de alta definição e qualidade, com base em prompts de texto.

O nome, que origina da combinação entre Salvador Dalí (famoso artista do movimento Surrealista), com o robô WALL-E, da animação de mesmo nome da Disney Pixar, foi criado para representar a eficiência robótica da máquina e a criatividade e performance artística do pintor.

(Fonte: OpenAI | Reprodução)

A ferramenta foi lançada em janeiro de 2021, em sua primeira versão, chamada apenas de Dall-E. Em seguida, a ferramenta foi atualizada para a versão Dall-E 2 e incorporada aos produtos da Microsoft, principal parceira da OpenAI no desenvolvimento da tecnologia.

Dall-E 3: A Versão Mais Recente do Gerador de Imagens

A última versão do Dall–E, anunciada pela OpenAI em 20 de setembro de 2023, representa um avanço significativo em comparação com o Dall-E 2. Conforme compartilhado pela própria startup, a ferramenta agora entende mais nuances de texto e pode processar imagens de maior qualidade, mesmo com prompts mais simples:

“O DALL·E 3 compreende significativamente mais nuances e detalhes do que nossos sistemas anteriores, permitindo que você traduza facilmente suas ideias em imagens excepcionalmente precisas.”

Segundo a OpenAI, os mesmos prompts utilizados no Dall-E 2, por exemplo, podem ser utilizados na nova versão e gerar imagens ainda mais precisas e relevantes para o usuário.

(Fonte: OpenAI | Reprodução) Tradução: “Uma rua movimentada da cidade sob o brilho da lua cheia,/ as calçadas cheias de pedestres aproveitando a vida noturna./ Na barraca da esquina, uma jovem de cabelos ruivos, vestida com uma capa de veludo exclusiva, está pechinchando com o velho vendedor mal-humorado./ O vendedor mal-humorado, um homem alto e sofisticado, veste um terno elegante, ostenta um estilo digno de nota e conversa animadamente em seu telefone estilo antigo.”

Além disso, o maior avanço considerado até o momento é a capacidade do Dall-E 3 de entender prompts de texto simples, um diferencial em comparação com as versões anteriores e, até mesmo, com outras ferramentas semelhantes que “forçam os usuários a entender engenharia automaticamente.”

Comparando o Dall-E 3 com o Dall-E 2

O Dall-E 2 já é considerado um grande avanço no modelo de processamento de prompts para imagens, no entanto, a nova versão conta com recursos ainda mais avançados e melhorias significativas, como:

  • compreensão de detalhes: apesar da melhoria em comparação com a versão 1.0, o Dall-E 2 ainda não conseguia entender significativamente as nuances e detalhes dos prompts de texto, algo que foi otimizado no Dall-E 3;
  • precisão da imagem: a OpenAI afirma que o novo Dall-E pode gerar imagens que atendem exatamente ao que foi fornecido no texto, com entregas mais precisas mesmo utilizando os mesmos prompts da versão anterior;
  • integração com o ChatGPT: um grande avanço (que será abordado com detalhes mais à frente neste artigo), é a construção de um plug-in do ChatGPT para integrar o Dall-E 3 ao chatbot e otimizar a geração de imagens diretamente nas conversas;
  • foco em segurança: o Dall-E 3 conta com medidas de segurança avançadas, incluindo recursos para mitigar os riscos de “plágio” e recusar pedidos de geração de imagens com figuras públicas que possam causar a disseminação de fake news;
  • disponibilidade: a versão anterior do Dall-E possuía algumas limitações de disponibilidade, mas a OpenAI pretende ampliar o acesso ao Dall-E 3 para todos os clientes do ChatGPT Plus e do ChatGPT Enterprise até o final de outubro.

Dall-E 3 e o ChatGPT

Como comentado anteriormente, a nova versão do Dall-E conta com um recurso muito aguardado pelos usuários do chatbot da OpenAI: a integração com o ChatGPT! Conforme compartilhado pela startup, o Dall-E 3 foi construído nativamente no ChatGPT, o que vai permitir o uso dessa ferramenta diretamente no chatbot.

“DALL· O E 3 é construído nativamente no ChatGPT, que permite que você use o ChatGPT como um parceiro de brainstorming e refinador de seus prompts. Basta perguntar ao ChatGPT o que você quer ver em qualquer coisa, desde uma simples frase até um parágrafo detalhado.”

Basicamente, ao solicitar uma imagem no chatbot, a ferramenta vai gerar automaticamente os prompts personalizados e detalhados para que o Dall-E 3 possa “dar vida à sua ideia” e a imagem gerada aparece diretamente na resposta do ChatGPT.

(Fonte: OpenAI | Reprodução)

Além de confirmar que o Dall-E 3 estará disponível para os assinantes Plus e Enterprise do ChatGPT em outubro, a startup informa que as imagens geradas são do usuário e podem ser utilizadas da forma como ele preferir, sem necessidade de de “pedir permissão para reimprimir, vender ou comercializar” essa imagens.

Direitos autorais e segurança dos artistas

Pensando ainda na segurança e nos direitos autorais dos artistas, a OpenAI afirma que a ferramenta foi treinada para rejeitar a criação de imagens em “estilos” ou “modelo” de artistas vivos.

Além disso, os artistas, designers e/ou profissionais e usuários de quaisquer áreas, poderão solicitar um “bloqueio” de suas imagens para treinamento de máquina da OpenAI. Ou seja, depois que os modelos da startup utilizarem suas informações para gerar suas imagens, eles não terão mais acessos àquelas informações e não poderão “replicar” a sua imagem em outro prompt no futuro, por exemplo.

Como o Dall-E 3 pode revolucionar o seu marketing digital?

Tenha mais controle criativo e otimize os processos da sua equipe de criação utilizando a IA para otimizar sua estratégia de marketing digital!

Atualmente, já existem algumas ferramentas no mercado que auxiliam na geração de imagens e os usuários podem solicitar que o ChatGPT crie prompts otimizados para elas. Mas, o novo Dall-E 3 está prestes a revolucionar essa geração de imagens a partir da integração com o GPT-4 e o ChatGPT.

Descubra como utilizar o ChatGPT e suas novas funcionalidades para impulsionar a sua operação de Marketing Digital. Conheça o Mestres do ChatGPT, nosso treinamento exclusivo para profissionais que querem elevar suas habilidades e tornar o ChatGPT em um verdadeiro assistente para o seu negócio.

LEIA MAIS

Google Trends: Descubra Tendências de Busca

Saiba o que é e como utilizar o Google Trends, uma ferramenta que irá ajudar você a descobrir novas palavras-chave a serem exploradas. Confira!

O Que Todo Profissional de Mídia Deve Saber Sobre Machine Learning e IA

Neste artigo você vai descobrir o que todo profissional de mídia precisa entender sobre machine learnig e inteligência artificial!

SEMrush: O Que é e Como Utilizar Para Aumentar o Tráfego do Seu Site

Saiba quais são as funcionalidades da Semrush, ferramenta muito importante para o SEO e que você precisa começar a usar.

Já pensou em fazer parte do nosso time de mestres?