Contrariando os rumores do adiamento da sua nova IA, a Google acaba de anunciar um novo modelo de Inteligência Artificial, o Gemini. Segundo a gigante norte-americana, este é o modelo mais capaz e mais avançado já desenvolvido pela própria.
O Gemini foi concebido para ser multimodal, o que significa que conseguirá compreender e interpretar diversas formas de comunicação. Todas as suas capacidades já se encontram ao dispor dos utilizadores através do Bard e do Google Pixel 8 Pro.
Google Gemini promete ser ainda mais impressionante que o ChatGPT
O mercado da IA foi claramente impulsionado pelo ChatGPT e este modelo é visto por muitos como a referência do segmento. Com efeito, não espanta que a Google tenha escolhido a tecnologia da OpenAI para enaltecer as capacidades do Gemini.
Na apresentação do seu modelo de IA, a Google apresentou diversos benchmarks que revelam a superioridade do Gemini face ao ChatGPT. Estes testes incluem raciocínio, matemática e capacidades de programação.
A Google afirma mesmo que o Gemini conseguiu superar especialistas humanos em tarefas de compreensão massiva de linguagem multitarefa. Falamos de um teste composto por 57 disciplinas para colocar à prova o conhecimento e capacidade de resolução de problemas.
Também no que concerne a testes multimodais que envolvem a compreensão de vídeo, áudio e imagem, o Gemini saiu vencedor face ao ChatGPT. Importa, no entanto, esclarecer que estes são resultados publicados pela própria Google e importa ver testes independentes para aferir a real superioridade da IA da Google.
Segundo a Google, a superioridade do Gemini deve-se, em grande parte, ao facto de este ser um modelo multimodal desenhado de raiz. Ou seja, as suas capacidades permitem-nos comunicar com ele através de imagens ou texto de forma fluída.
Atenta às falhas protagonizadas pela ChatGPT, a Google incorporou no Gemini várias salvaguardas de segurança e responsabilidade. O intuito é que este modelo de IA apresente respostas credíveis, factuais e desprovidas de qualquer teor ofensivo, por exemplo, violento ou racista.
Gemini chega em várias dimensões para se adequar a diferentes produtos
A Google apresentou três versões do Gemini: Ultra, Pro e Nano. Esta diversidade de versões do mesmo modelo de IA foi criado para que ele se adeque a diferentes tipos de equipamentos, desde smartphones a grandes centros de dados.
A sua versão Pro já foi incorporada no chatbot Bard e está disponível para todos os utilizadores. Contudo, por enquanto apenas funciona em inglês, dando razão aos rumores de que este novo modelo de IA ainda tem dificuldades para compreender alguns idiomas.
No próximo ano, a Google promete o lançamento do Bard Advanced que dará aos utilizadores acesso aos modelos e funcionalidades mais avançados da empresa. Ainda assim, fica por esclarecer se esta versão será paga, como vemos no ChatGPT.
Já a versão Nano do Gemini pode já ser experimentada pelos utilizadores do Pixel 8 Pro. Esta faz parte da atualização de dezembro lançada para o smartphone e irá potenciar várias funções de IA presentes neste equipamento.
Nos próximos meses, a Google irá disponibilizar o Gemini em outros serviços como a Pesquisa, Publicidades e Duet AI. Os programadores também terão acesso a este modelo de IA para que o possam integrar nas suas aplicações.
Relativamente à versão Ultra do Gemini, a Google necessita de mais algum tempo para a sua otimização. Este necessita de mais salvaguardas de segurança e promete a sua grande disponibilização no início do próximo ano para programadores e clientes empresariais.
(4gnews)