A Anthropic, startup de IA co-fundada por ex-executivos da OpenAI, acaba de lançar a segunda geração do seu chatbot concorrente do ChatGPT, o Claude 2.
A partir do dia 11 de julho, o Claude 2 passa a ser disponibilizado em versão beta para os usuários nos EUA e Reino Unido, tanto na web quanto por meio de uma API paga (em acesso limitado).
Confira todos os detalhes sobre o novo chatbot aprimorado com tecnologias de IA e saiba porque ele pode concorrer diretamente com o ChatGPT:
O que é o Claude 2?
Assim como o ChatGPT, o novo Claude 2 é um sistema de inteligência artificial desenvolvido para auxiliar os usuários na execução de tarefas de forma conversacional, ou seja, por meio de um prompt de texto o usuário pode explicar o que precisa para a ferramenta e ela retornará com uma solução.
“Pense em Claude como um colega amigável e entusiasmado ou um assistente pessoal que pode ser instruído em linguagem natural para ajudá-lo em muitas tarefas.”
ChatGPT has now a serious competitor.
Anthropic has just released Claude 2 and it’s really powerful.
Here’s why you should use Claude 2 instead of ChatGPT (for free):
[Thread] pic.twitter.com/0MXRkty2cR
— Paul Couvert (@itsPaulAi) July 12, 2023
O novo modelo da Anthropic possui um desempenho superior à sua antiga versão (o Claude 1.3), oferece respostas mais longas e pode ser acessado tanto via API (para assinantes) quanto no novo site beta voltado para o público geral.
Segundo o pronunciamento oficial da Anthropic, o novo Claude foi desenvolvido com base em feedbacks dos usuários para que fosse mais fácil de conversar com ele e explicar claramente seus pensamentos, diminuindo a incidência de respostas incorretas e, agora, com uma memória mais longa também.
Como o Claude 2 pode ser utilizado?
Assim como sua versão anterior, o Claude 2 pode pesquisar documentos, resumir, escrever, codificar e responder a perguntas sobre tópicos específicos.
Segundo afirmado pela Anthropic em entrevista ao portal TechCrunch, o Claude 2 é superior em várias áreas, apesar de conter as mesmas funcionalidades da sua versão anterior.
Conforme compartilhado pelo portal, o chefe de entrada no mercado da Anthropic, Sandy Banerjee, comenta sobre a importância de acompanhar as necessidades dos usuários para implementar e otimizar os recursos oferecidos:
“Acreditamos que é importante implantar esses sistemas no mercado e entender como as pessoas realmente os usam. Monitoramos como eles são usados, como podemos melhorar o desempenho, bem como a capacidade – todas essas coisas.”
Em testes realizados internamente, a Anthropic observou que seu novo modelo obteve desempenhos superiores em todos as comparações com o modelo anterior, como:
- desempenho de 76,5% na seleção de múltipla escolha do Exame da Ordem, um crescimento de 3.5 pontos percentuais;
- desempenho de 71,2% no teste de codificação Codex Human Level Python, superior aos 65% da versão anterior;
- desempenho de 88% na resolução de problemas de matemática de nível fundamental da coleção GSM8K, 2.8 pontos percentuais a mais que o modelo anterior;
- além disso, o Claude 2 foi aprovado na fase de múltipla escolha do Exame de Licenciamento Médico dos EUA.
Banerjee afirma que o sistema está sendo treinado para ter uma “autoconsciência” sobre os comandos que recebe e como pode processá-los:
“Temos trabalhado para melhorar o raciocínio e o tipo de autoconsciência do modelo, para que seja mais consciente de ‘é assim que gosto de seguir instruções’, ‘sou capaz de processar instruções de várias etapas’ e também mais ciente de suas limitações”
Por enquanto, o Claude está disponível apenas para usuários nos EUA e Reino Unido, mas a Anthropic pretende expandir o recurso a nível global nos próximos meses.
Como o Claude 2 pode competir com o ChatGPT?
Um dos grandes diferenciais do Claude 2 é a sua “janela de contexto”, que basicamente é o texto que o modelo considera antes de gerar texto adicional.
Utilizando uma analogia com o cérebro humano, a janela de contexto é o quanto você tem de informação para responder a uma pergunta. Conforme utilizamos os modelos de IA disponíveis atualmente, como o ChatGPT, a cada novo prompt enviado em uma conversa, a janela de contexto vai se tornando menor, fazendo com que o chatbot comece a confundir as informações.
Ou seja, é como se o chatbot fosse “esquecendo” seus primeiros comandos ao longo da conversa e, por isso, começasse a trazer informações imprecisas e desconexas com o assunto principal.
Em maio deste ano, a startup de pesquisa de IA anunciou que expandiu a janela de contexto do Claude de 9.000 tokens para 100.000 tokens (para realizar uma comparação, o GPT-4 possui 32.000 tokens no seu modelo mais sofisticado como o Code Interpreter).
Essa, dentre tantas características, é a principal ameaça para o modelo atual do ChatGPT. Com uma “memória” maior, o Claude é capaz de conversar de forma relativamente coerente por horas – vários dias, até – em vez de minutos. Além disso, e talvez mais importante, é a probabilidade do novo modelo trazer menos informações imprecisas, uma vez que suas respostas estão sempre relacionadas ao seu assunto principal.
Dessa forma, o portal TechCrunch observou que o Claude 2 é capaz de analisar cerca de 75.000 palavras, aproximadamente o comprimento do clássico da literatura “O Grande Gatsby”, e gerar 4.000 tokens, ou cerca de 3.125 palavras.
Além disso, o Claude 2 pode competir com o ChatGPT num panorama mais geral, diferentemente do Auto-GPT que surgiu como uma solução segmentada para o público de desenvolvedores e programadores – por exemplo. Assim, o Claude 2 – quando anunciado em nível global – pode realmente ser implementado no cotidiano dos usuários tal qual o ChatGPT.
Quais são as limitações do Claude 2?
Mesmo sendo um modelo considerado “superior” ao ChatGPT (ou, ao menos, à altura), o Claude 2 possui suas limitações e falhas.
Assim como os demais modelos de IA, o Claude 2 não está isento de respostas incorretas ou tendenciosas, apesar da Anthropic afirmar que sua incidência é menor em comparação com outros modelos (inclusive o seu próprio, na versão 1.3).
Além disso, a startup desaconselha o uso do Claude 2 para aplicações “onde a saúde e o bem-estar físico ou mental estão envolvidos” ou em “situações de alto risco em que uma resposta incorreta causaria danos”.
Por fim, quando questionados sobre as questões de direitos autorais e segurança de dados do Claude 2, a startup foi mais ampla e comentou que seus desenvolvedores estão explorando as melhores práticas para lidar com isso e oferecer uma experiência segura a todos os usuários.
“Existem algumas técnicas geralmente aceitas no campo, incluindo desduplicação de dados de treinamento, que demonstraram reduzir o risco de reprodução. Além do lado dos dados, a Anthropic emprega uma variedade de ferramentas técnicas em todo o desenvolvimento do modelo, desde … detecção de camada de produto até controles.”
Quando o Claude 2 estará disponível no Brasil?
Por enquanto, ainda não há uma previsão concreta de expansão da ferramenta para os demais países, a startup comentou apenas que está investindo para levar o Claude 2 a nível global nos próximos meses. Atualmente, apenas usuários nos EUA e Reino Unido podem acessar a ferramenta por meio da API ou do site claude.ai:
Acompanhe nosso canal no Telegram e continue acompanhando os avanços do Claude 2 e a corrida dos sistemas de IA!