Google Gemini e SEO, o que está a mudar
Última atualização em quinta-feira, 7 de dezembro de 2023
A corrida à IA continua a intensificar-se entre a Google e a OpenAI. Enquanto esta última lançou o GPT-4 há alguns meses, a Google revelou o seu "sistema multimodal" na conferência Google IO de maio de 2023: Gemini. Normalmente associado à constelação Gemini ou ao segundo vôo espacial, pouco antes da Apollo, no projeto do Google, significa "Rede de Inteligência Multimodal Generalizada".
O que é que sabemos sobre a Gemini
A Google terá dado acesso a uma versão inicial do seu sistema Gemini a algumas empresas. Resumo do que foi filtrado sobre este "sistema multimodal".
"Imagine se o Hulk dos modelos linguísticos e o Jarvis da IA de Tony Stark tivessem um filho... Boom!" Este é o Gemini. "Na Internet, os fãs da tecnologia elogiam o sistema de inteligência artificial generativa da Google, com muitas referências mais ou menos felizes à cultura pop.
Mas como é que o modelo multimodal Gemini funciona? Quais são as suas especificidades? Será que merece todos os superlativos mesmo antes do seu lançamento?
O anterior ChatGPT tenderia a convencer-nos de que a nuance seria mais adequada: se o modelo generativo da OpenAI ultrapassasse os 100 milhões de utilizadores em janeiro de 2023, a sua frequência estagnaria em maio e começaria a cair em junho. Para além disso, o modelo da OpenAI não está isento de riscos e apresenta mesmo alguns sinais de regressão.
De acordo com a empresa de Mountain View, o Gemini foi concebido para ser "multimodal, altamente eficiente na integração de ferramentas e APIs". Espera-se que "permita inovações futuras, como a memória e o planeamento".
Desenvolvimento do Gemini
Para desenvolver este modelo massivo, o Gemini baseia-se nomeadamente na amplitude e profundidade dos dados acumulados pela Alphabet, através de plataformas como o YouTube, Google Books, Google Search e Google Scholar. Também utiliza chips de treino de última geração denominados TPUv5, alegadamente os únicos no mundo capazes de orquestrar 16 384 chips a trabalhar em conjunto. As equipas da Google também treinaram o modelo utilizando métodos semelhantes aos utilizados no desenvolvimento do AlphaGo, um jogo mais complexo do que o xadrez. Além disso, ao contrário do LaMDA, o grande modelo de linguagem de conversação da Google treinado através de aprendizagem supervisionada, o Gemini foi treinado através de aprendizagem por reforço como o GPT-3 e o GPT-4. Esta técnica de aprendizagem automática implica que um agente de IA aprenda a executar uma tarefa através de tentativa e erro num ambiente dinâmico.
De acordo com o The Information, vários antigos membros das equipas Google Brain e DeepMind estão atualmente a trabalhar no projeto, incluindo Sergey Brin, cofundador da Google. Além disso, de acordo com a mesma fonte, a Google poderá apresentar o Gemini como uma atualização do Google Bard ou como a criação de um novo chatbot antes de utilizar o Gemini para alimentar vários produtos como o Google Docs. O Gemini poderá ser lançado em breve, possivelmente em resposta ao próximo lançamento do GPT-4.5 da OpenAI antes do GPT-5, previsto para o início de 2024. "Uma vez refinado e rigorosamente testado em termos de segurança, o Gemini estará disponível em diferentes tamanhos e capacidades, tal como o PaLM 2", afirma a Google, sem mais pormenores.
Um percurso do utilizador potencialmente mais curto
Atualmente, o Google SGE (experiência de pesquisa melhorada por IA da Google) está a ser testado em cerca de cem países. Esta versão do Google oferece texto gerado por IA, fontes e um módulo de conversação. Em determinadas consultas, este motor de busca pode reduzir o número de consultas do utilizador. De acordo com um exemplo da Exposure Ninja, um utilizador que procure informações sobre um "advogado imobiliário" para um processo de mudança poderá ter apenas quatro visitas ao site em vez de oito com uma pesquisa tradicional.
O que acontece se o Gemini acabar por se integrar no SGE? "Os custos associados à divulgação das respostas do Gemini no SGE significam inicialmente que a Google não está muito inclinada a fornecer resultados do SGE baseados no Gemini, a menos que sejam necessários", adverte Tim Cameron-Kitchen, fundador da Exposure Ninja.
No caso da utilização do Gemini no SGE, a capacidade do sistema multimodal para antecipar as necessidades presumidas dos utilizadores pode reduzir ainda mais a fase de pesquisa. A utilização do Gemini poderia fornecer respostas directas nos resultados da pesquisa às perguntas seguintes do utilizador. No exemplo anterior, isto poderia criar uma viagem de pesquisa com apenas três sítios a visitar, de acordo com a Exposure Ninja.
De acordo com Tim Cameron-Kitchen, esta utilização do Gemini no SGE também pode trazer "menos duplicados, respostas mais bem estruturadas que seguem logicamente o percurso do utilizador e uma melhor integração das capacidades multimodais". É de salientar que, para este especialista em marketing digital, a potencial redução de visitas a sites pode ser compensada pelo facto de as ligações continuarem presentes nas respostas geradas e de as pessoas continuarem a fazer compras em sites através do Google.
Potenciais aplicações do Gemini
O Gemini tem potencial para ser utilizado numa variedade de aplicações, incluindo:
Chatbots: O Gemini pode ser utilizado para criar chatbots mais sofisticados e naturais. Os chatbots baseados em Gemini podem ser utilizados para prestar serviços de apoio ao cliente, responder a perguntas ou simplesmente manter uma conversa.
Resumos de texto: O Gemini pode ser utilizado para gerar resumos de texto mais precisos e concisos. Os resumos de texto baseados em Gemini podem ser utilizados para ajudar as pessoas a compreender artigos ou documentos longos.
Geradores de conteúdos criativos: O Gemini pode ser utilizado para gerar conteúdos criativos, como poemas, guiões ou música. Os geradores de conteúdos criativos baseados em Gemini podem ser utilizados para criar novas formas de arte ou entretenimento.
Aplicações de aprendizagem automática: O Gemini pode ser utilizado para melhorar o desempenho de aplicações de aprendizagem automática. O Gemini pode ser utilizado para treinar modelos de aprendizagem automática mais precisos e potentes.
Como podemos utilizar a IA do Google Gemini
Sundar Pichai, CEO da Google Alphabet, destacou durante o Google I/O 2023 os avanços que estão a ser feitos para tornar a IA generativa mais fácil de utilizar. Entre esses avanços estão o PaLM 2 e o Gemini. O Gemini da DeepMind foi criado especificamente para ser multimodal, permitindo-lhe compreender diversos tipos de dados, como texto, imagens e código. Esta versatilidade permite-lhe destacar-se em várias tarefas:
Gerar vários tipos de texto, traduzir idiomas e criar diversos conteúdos criativos.
Processar formatos de dados como gráficos e mapas.
Aproveitar uma vasta base de conhecimento derivada de uma formação extensiva em conjuntos de dados de texto e código.
Facilitar a criação de novos produtos e serviços.
Analisar dados e reconhecer padrões.
Fornecer respostas informativas a questões complexas ou não convencionais.
Embora a capacidade de processamento multimodal do Gemini ainda esteja em desenvolvimento, tem potencial para revolucionar as interacções homem-computador. As suas aplicações podem ir desde a criação de assistentes virtuais mais realistas e envolventes até à inovação de ferramentas educativas e à melhoria da nossa compreensão do mundo. Para obter mais detalhes sobre a IA Gemini da Google, incluindo o seu funcionamento, características de destaque e muito mais, continue a explorar.
Como funciona o Gemini?
O Gemini funciona como um sistema de IA multimodal, capaz de processar vários tipos de dados, como texto, imagens e código. Aproveita a formação extensiva num conjunto de dados massivo de texto e código, permitindo-lhe compreender e gerar estas diferentes formas de informação.
Em sua essência, o Gemini emprega algoritmos e modelos avançados desenvolvidos pelo DeepMind para entender e interpretar dados em vários formatos. Ao treinar em diversos conjuntos de dados, o Gemini aprende padrões, estruturas e relacionamentos dentro dos dados, permitindo que ele execute tarefas como gerar texto, processar informações visuais, como gráficos e mapas, e analisar conjuntos de dados complexos.
As suas capacidades multimodais permitem ao Gemini tratar diferentes tipos de informação em simultâneo, facilitando as tarefas que envolvem múltiplos formatos ou fontes de dados. Esta versatilidade é o que posiciona o Gemini como uma ferramenta potencialmente transformadora, capaz de revolucionar a forma como interagimos com os computadores e processamos a informação em vários domínios.
Formação e ligação
Para os profissionais de SEO, será provavelmente essencial aproveitar plenamente o potencial do Gemini. "Se as promessas da DeepMind se confirmarem e o Gemini cumprir os critérios apresentados, tornar-se-á uma ferramenta essencial para todos os SEO", sugere Giulio Stella, consultor de SEO da Gstarseo. Vale a pena notar que, de acordo com o The Information, os programadores teriam de pagar para aceder ao Gemini através do aluguer de servidores Google Cloud.
Poder á haver inúmeras ajudas para os profissionais de SEO, especialmente através da conetividade do Gemini. "Podemos pedir-lhe que carregue informações das ferramentas da Google", propõe Laurent Jean. "Por exemplo, ligar a Google Search Console, o YouTube e o Google Sheets, a partir dos quais podemos obter listas de palavras-chave posicionadas. Também podemos pedir ao Gemini que forneça uma lista de URLs de desempenho com palavras-chave associadas. Poderíamos encarregá-lo de criar classificações ou listas de conteúdo para complementar com base no Google Sheets e no YouTube. Trata-se de utilizar as capacidades do LLM para gerar texto optimizado para o utilizador e, ao mesmo tempo, aproveitar os dados e o raciocínio do Gemini para reintegrar dados externos para otimização SEO."
Artigo de:
Giulio Stella
Marketing digital
Giulio Stella, um consultor de marketing digital situado em Milão e a operar em gstarseo.it em Itália, tem uma paixão por SEO e marketing digital. Sente-se realizado ao ajudar pequenas empresas a alcançar objectivos significativos. Ao contrário do que se pensa, os italianos não comem massa todos os dias.