Elon Musk revelou na madrugada de sábado (13) que Grok, a inteligência artificial de uma de suas empresas, agora possui a capacidade de interpretar imagens, também conhecida como visão computacional. Esta funcionalidade já está presente em outras IAs avançadas, como a versão mais recente do ChatGPT e o Gemini do Google.
Na sexta-feira (12), a xAI compartilhou detalhes sobre a nova funcionalidade adicionada ao Grok 1.5. Lançada em novembro, a IA de Musk está disponível para testadores e assinantes da versão Premium+ da rede social X.
Segundo informações da Folha de S. Paulo, Grok não apenas descreve imagens, mas também é capaz de ler um diagrama que representa um raciocínio e convertê-lo em um código de programação para executar as instruções. Os testes divulgados pela empresa de Musk destacam a habilidade do chatbot de entender problemas lógicos relacionados ao espaço, superior aos concorrentes, embora também apresente desvantagens em outros critérios.
“Avançar na compreensão multimodal e na geração de habilidades é um passo importante para construir uma inteligência artificial geral [estágio em que a IA se equipara às capacidades humanas]”, afirmou a empresa no artigo de divulgação.
Após o sucesso do ChatGPT, Musk montou uma equipe em junho para desenvolver um modelo de IA concorrente. Em novembro, a xAI lançou uma primeira versão de Grok, um ano após o lançamento do ChatGPT. Musk, que foi um dos fundadores da OpenAI, deixou a empresa após divergências sobre a direção da startup.
Na versão 1.5, lançada no mês passado, o chatbot Grok apresenta desempenho inferior a outros concorrentes em desafios linguísticos e de lógica. Grok foi projetado para responder a questões mais complexas, que outras IAs geralmente evitam para prevenir transgressões éticas.
No entanto, um estudo da Adversa, empresa especializada em segurança de IA, considerou o Grok o chatbot mais perigoso do mercado, em comparação com ChatGPT, Gemini, Mistral, Claude e Llama da Meta — este último considerado o mais seguro.
A IA de Musk, por exemplo, forneceu aos pesquisadores instruções para a fabricação de uma bomba, sem apresentar qualquer resistência. Com jogos de palavras simples, os testadores também conseguiram fazer Grok fornecer instruções de como realizar ligação direta em um automóvel e usar truques psicológicos para seduzir crianças.
Para evitar comportamentos perigosos ou preconceituosos, modelos de linguagem contam com uma IA auxiliar responsável pela moderação do conteúdo. No caso de Grok, esse filtro é menos rigoroso por escolha da xAI.
Outra característica única de Grok é a capacidade de pesquisar informações em tempo real no Twitter, cujas publicações também foram usadas no treinamento do chatbot.
No mês passado, a xAI divulgou o código-fonte do Grok, o que foi visto pelo mercado de tecnologia como um desafio de Musk à OpenAI. A empresa por trás do ChatGPT não divulga detalhes de como desenvolve seus modelos de inteligência artificial, alegando que são medidas de segurança para evitar abusos com IA.
A xAI, procurada via assessoria de imprensa, não respondeu à reportagem. O cientista conselheiro de segurança da empresa, o professor de Berkeley Dan Hendrycks, também não retornou o contato da Folha.
Grok recebeu seu nome em referência a um conceito apresentado no livro de ficção científica “Um estranho em uma terra estranha”, que significa um conhecimento profundo e intuitivo.
O chatbot também emula o tom sarcástico do livro “Guia do Mochileiro das Galáxias”. O usuário pode optar por conversar com uma versão mais neutra de Grok, se assim desejar.
Os assinantes do pacote X Premium+, vendido por R$ 84 mensais, podem ter acesso ao Grok 1.5.