A IA da OpenAI, baseada no GPT-4, aprende com feedbacks dos treinadores para apontar erros em respostas geradas, reforçando a inteligência artificial.
A OpenAI desenvolveu um novo modelo chamado CriticGPT, com base no GPT-4, com o objetivo de identificar falhas em respostas produzidas pelo ChatGPT. Segundo a empresa, ao utilizar o CriticGPT para revisar os textos gerados pelo ChatGPT, os usuários conseguem resolver os problemas sem assistência extra em 60% das situações. A série de modelos GPT-4 que alimenta o ChatGPT passa por um processo de correção conhecido como ‘aprendizado de reforço a partir do feedback humano’ (RLHF), no qual a plataforma aprimora seu desempenho com base na avaliação dos usuários, também chamados de treinadores de inteligência artificial.
Essa ferramenta inovadora, o CriticGPT, representa um avanço significativo no campo da inteligência artificial, permitindo uma revisão mais eficiente e precisa dos textos gerados pelo ChatGPT. O uso do CriticGPT demonstra como a combinação de modelos como o GPT-4 e técnicas de correção baseadas no feedback humano pode aprimorar a qualidade das respostas produzidas por sistemas de IA, tornando-os mais confiáveis e úteis para os usuários.
CriticGPT: A Nova Ferramenta de Correção e Revisão
À medida que a inteligência artificial avança, a necessidade de ferramentas de correção e revisão especializadas se torna cada vez mais evidente. Nesse cenário, o CriticGPT surge como uma solução inovadora para auxiliar os treinadores de IA a aprimorar seus modelos. Enquanto o ChatGPT evolui, seus erros se tornam mais complexos, o que pode dificultar a identificação por parte dos treinadores. É aí que o CriticGPT entra em ação, oferecendo insights valiosos e apontamentos precisos.
A empresa responsável pelo desenvolvimento do CriticGPT planeja integrar modelos semelhantes ao processo de Reinforcement Learning with Human Feedback (RLHF), a fim de enriquecer os feedbacks humanos com a contribuição da IA. Embora as sugestões do CriticGPT não sejam infalíveis, elas representam uma ferramenta poderosa para detectar problemas que poderiam passar despercebidos. Assim como o GPT-4, o CriticGPT se aprimora com o uso contínuo e os feedbacks recebidos dos usuários.
Um exemplo prático da eficácia do CriticGPT foi observado nos testes realizados pela OpenAI, que compararam os apontamentos feitos por essa ferramenta com os do ChatGPT. Surpreendentemente, em 63% dos casos, os apontamentos do CriticGPT superaram os do ChatGPT. Além disso, a nova ferramenta demonstrou uma redução significativa nas alucinações, o que reforça sua capacidade de oferecer correções precisas e confiáveis.
No entanto, é importante ressaltar que o CriticGPT possui limitações e pode não ser capaz de lidar com tarefas extremamente complexas. Mesmo com a assistência de um modelo avançado, a avaliação correta de situações altamente especializadas pode representar um desafio. Portanto, é fundamental reconhecer o papel complementar do CriticGPT e entender até onde sua atuação pode ser eficaz.
Em resumo, o CriticGPT se destaca como uma ferramenta essencial para aprimorar a qualidade das respostas geradas por modelos de inteligência artificial. Seu potencial de oferecer feedbacks precisos e identificar possíveis erros representa um avanço significativo no campo da IA, contribuindo para a evolução contínua das tecnologias de linguagem natural.
Fonte: © CNN Brasil
Comentários sobre este artigo