Claude 2 – O Novo Modelo de Linguagem LLM rival do ChatGPT
A Anthropic apresentou o “Claude 2”, um grande modelo de linguagem (LLM) semelhante ao ChatGPT que pode criar código, analisar texto e escrever composições. Contrariamente à versão original do “Claude” lançada em março, os utilizadores podem experimentar o “Claude 2” gratuitamente num novo site beta. Também está disponível como uma API comercial para desenvolvedores.
A Anthropic explica que o Claude foi projetado para simular uma conversa com um colega prestativo ou assistente pessoal e que a nova versão faz reflexo do feedback dos utilizadores ao modelo anterior: “ouvimos os nossos utilizadores dizerem que o Claude é fácil para conversar, explica claramente o seu pensamento, tem menos probabilidade de produzir resultados prejudiciais e tem uma memória mais longa”.
A Antrópico afirma que Claude 2 demonstra avanços em três áreas principais: codificação, matemática e raciocínio. “Quando comparado aos estudantes universitários que se inscrevem na pós-graduação, Claude 2 pontua acima do percentil 90 nos exames de leitura e redação, e de forma semelhante à do candidato mediano em raciocínio quantitativo”, descreve a notícia.

Uma das principais melhorias do “Claude 2” é o seu comportamento de entrada e de saída. A Anthropic tem experimentado o processamento de prompts até 100.000 tokens (fragmentos de palavras), o que permite ao modelo de IA analisar documentos longos, como guias técnicos ou livros inteiros. Este aumento permite também a criação de documentos mais longos.
Em termos de capacidades de codificação, “Claude 2” demonstrou um aumento relatado na proficiência. A sua pontuação no Codex HumanEval, um teste de programação Python, subiu de 56% para 71,2%. Da mesma forma, no GSM8k, um teste que compreende problemas de matemática do ensino fundamental, melhorou de 85,2 para 88 por cento.
Um dos principais focos da Anthropic tem sido tornar o seu modelo de linguagem menos propenso a gerar resultados “prejudiciais” ou “ofensivos” quando apresentado a certas instruções, embora medir essas qualidades seja subjetivo e difícil. De acordo com uma avaliação interna da empresa, “Claude 2 foi duas vezes melhor a dar respostas inofensivas em comparação com Claude 1.3”.
Fonte: ARS Technica




Sem Comentários! Seja o Primeiro.