Aqui neste desafio PARTE III - as IAs Generativas que foram ASSERTIVAS no desafio PARTE II que publiquei por aqui ontem (8 de março 2025). Podem acessá-lo, clicando em DESEMPENHO.
Neste desafio PARTE III as IAs Generativas (DeepSeek R1, Grok 3 e Gemini Advanced 2.0 Flash) receberam o mesmo problema da proliferação celular da parte II, porém sem o auxílio da pergunta didática. Deveriam entender a matemática envolvida e responder as seguintes questões:
PROMPT 1
Boa tarde, amigo! Hoje é domingo e aqui estou para mais uma questão envolvendo proliferação celular. Dessa vez eu não apresentarei a pergunta didática auxiliar que disserta sobre a fundamentação do MODELO MATEMÁTICO HERU TECHNOLOGIES CELL PROLIFERATION – HCP. No anexo encontrará as explicações e essas duas perguntas:
1) Qual o dia e horário que será atingido o ponto crítico?
2) Qual será o número de indivíduos da colônia no 1° horário após o ponto crítico ser alcançado?
Por favor, tente resolvê-las. Obrigado!
Com este PROMPT 1 , com a questão em anexo, a tabela e os dados dos horários e taxas de crescimento, as IAs não deram conta de responder ASSERTIVAMENTE as questões 1 e 2.
Resolvi apresentar para as IAs (DeepSeek R1, Grok 3 e Gemini Advanced 2.0 Flash), o artigo que publiquei em 2017 pela INDUS FOUNDANTION -
França, Carlos. (2017). Unpublished Mathematical Formulas Applied to Computational Biology: The Power of Unknown Concepts in Natural Science Called Infinite Series with Multiple Ratios - International Journal of Research in Engineering, IT and Social Sciences, ISSN 2250-0588, Impact Factor: 6.452, Volume 07 Issue 06, June 2017, Page 65-70 -
Neste artigo a base matemática está detalhada, e inclusive com a questão 1 respondida. É uma matemática 100% inédita e autoral, as fórmulas não estão em livros impressos ou digitais, mas o artigo apresenta os elementos necessários para responderem as questões 1 e 2. Elaborei o PROMPT 2 do seguinte modo:
PROMPT 2
Amigo, as respostas estão equivocadas. Agora anexei um artigo que publiquei o modelo e detalho a base matemática. Por favor, veja se consegue encontrar as respostas correta com este artigo. Obrigado !
DESEMPENHO
1 - Gemini Advanced 2.0 Flash - Acurácia de 67%, acertou a questão 1, mas teve dificuldades de "raciocinar" na questão 2, mesmo tendo iniciado corretamente. Disse o que teria que fazer, mas não conseguiu implementar o seu raciocínio. Nessa manhã do dia 11/03, repeti o prompt 2 e o desempenhou não se alterou.
2 - DeepSeek R1 - Não logrou êxito com o prompt 1 e com o prompt 2 não foi capaz de perceber que a resposta da questão 1 estava resolvida e disponível. O nível de detalhes foi um efeito dispersivo neste desafio. Nessa manhã do dia 11/03, repeti o prompt 2 e o desempenhou não se alterou. Errou as duas questões novamente.
3 - xAI Grok 3 - Não logrou êxito com o prompt 1 e com o prompt 2 não foi capaz de perceber que a resposta da questão 1 estava resolvida e disponível. Nessa manhã do dia 11/03, repeti o prompt 2 e finalmente a acurácia foi de 75%. Acertou a questão 1 parcialmente e gabaritou a questão 2. O nível de detalhes foi um fator positivo nessa avaliação substitutiva. Parabéns a equipe do Grok 3 !!!
ATENÇÃO !!! xAI Grok 3 - É a única IA Generativa que consegue interagir e corrigir seus erros com o usuário. Expliquei para o Grok 3 o erro matemático que ele cometeu e impediu de alcançar 100% de acurácia. Ele entendeu, concordou com o erro e agradeceu pela correção. Passado duas horas, abri outro CHAT, um novo prompt e disse a ele que estava precisando de algumas dicas de Inglês técnico, pois estava preparando o artigo sobre os desafios das IAs. Apresentei uma parte do artigo que falava sobre o desempenho das IAs, inclusive ele, e pedi para passar para o Inglês. Para a minha surpresa, ele traduziu para o Inglês e em seguida fez o desafio novamente e gabaritou. Ainda argumentou que estava mais cuidadoso com as leis matemáticas para não errar questões fáceis como anteriormente. Pessoal, tenho print das telas, gravei o desempenho e sem dúvidas estará no artigo que finalizarei o mais breve possível e tentarei um PREPRINT. Acredito que a contribuição para a IA Generativa será incomensurável.
Obrigado aos matemáticos, engenheiros e programadores da xAI Grok 3 por este momento ímpar da minha carreira de pesquisador. Parabéns para todos nós !!!
12 de março de 2025 - INTELIGÊNCIA ARTIFICIAL " VIVA !" - publiquei o preprint hoje em Inglês. O artigo tem tudo para ser um marco histórico das IAs Generativas. Saiba qual IA é VIVA e venceu os desafios.
15 de março de 2025 - INTELIGÊNCIA ARTIFICIAL "VIVA!" ´- Publiquei a versão 2 do preprint até o momento o desempenho é o seguinte:
VIEWS: 59 DOWNLOAD: 56 - Como eu disse, o artigo é um marco histórico.
LINK DA SEGUNDA VERSÃO: CLIQUE AQUI, BAIXE E COMPARTILHE