Google Gemini och SEO, vad förändras?
Senast uppdaterad den torsdag 7 december 2023
Tävlingen inom AI fortsätter att intensifieras mellan Google och OpenAI. Medan det senare släppte GPT-4 för några månader sedan, presenterade Google sitt "multimodala system" vid Google IO-konferensen i maj 2023: Gemini. Gemini förknippas vanligtvis med Gemini-konstellationen eller den andra rymdfärden, strax före Apollo, men i Googles projekt står det för "Generalized Multimodal Intelligence Network".
Vad vet vi om Gemini?
Google har enligt uppgift gett tillgång till en tidig version av sitt Gemini-system till ett fåtal företag. Översikt över vad som har filtrerats om detta "multimodala system".
"Tänk om språkmodellernas Hulk och Tony Starks AI Jarvis fick barn... Boom!" Det här är Gemini. " På nätet är teknikfansen fulla av lovord för Googles generativa system för artificiell intelligens, med många mer eller mindre glada popkulturreferenser.
Men hur fungerar Geminis multimodala modell? Vilka är dess specifika egenskaper? Förtjänar den alla superlativ redan innan den har släppts?
Den tidigare ChatGPT skulle kunna övertyga oss om att en nyansering skulle vara mer lämplig: om OpenAI:s generativa modell översteg 100 miljoner användare i januari 2023 stagnerade antalet besökare i maj och började sedan sjunka i juni. Dessutom är OpenAI-modellen inte utan risk och har till och med visat några tecken på regression.
Enligt Mountain Views företag var Gemini utformad för att vara "multimodal, mycket effektiv när det gäller att integrera verktyg och API: er." Det förväntas "möjliggöra framtida innovationer, såsom minne och planering."
Geminis utveckling
För att utveckla denna massiva modell förlitar sig Gemini särskilt på bredden och djupet av data som ackumulerats av Alphabet, genom plattformar som YouTube, Google Books, Google Search och Google Scholar. Den använder också banbrytande träningschips som heter TPUv5, som påstås vara de enda i världen som kan orkestrera 16 384 chips som arbetar tillsammans. Googles team tränade också modellen med hjälp av metoder som liknar dem som användes för att utveckla AlphaGo, ett spel som är mer komplext än schack. Till skillnad från LaMDA, Googles stora modell för konversationsspråk som tränats genom övervakad inlärning, tränades Gemini dessutom genom förstärkningsinlärning som GPT-3 och GPT-4. Denna maskininlärningsteknik innebär att en AI-agent lär sig att utföra en uppgift genom försök och fel i en dynamisk miljö.
Enligt The Information arbetar flera tidigare medlemmar av Google Brain- och DeepMind-teamen för närvarande med projektet, inklusive Sergey Brin, Googles medgrundare. Enligt samma källa kan Google dessutom komma att introducera Gemini som antingen en uppdatering av Google Bard eller som skapandet av en ny chatbot innan Gemini används för att driva olika produkter som Google Docs. Gemini kan släppas snart, möjligen som svar på OpenAI: s kommande GPT-4.5-release före GPT-5, som förväntas runt början av 2024. "När Gemini har förfinats och genomgått rigorösa säkerhetstester kommer den att finnas tillgänglig i olika storlekar och kapaciteter, ungefär som PaLM 2", säger Google, utan ytterligare detaljer.
En potentiellt förkortad användarresa
För närvarande testas Google SGE (Googles AI-förbättrade sökupplevelse) i ett hundratal länder. Denna version av Google erbjuder AI-genererad text, källor och en konversationsmodul. För vissa frågor kan denna sökmotor minska antalet användarfrågor. Enligt ett exempel från Exposure Ninja kan en användare som söker information om en "fastighetsadvokat" för en flyttprocedur ha endast fyra webbplatsbesök istället för åtta med en traditionell sökning.
Vad händer om Gemini så småningom integreras i SGE? "Kostnaderna för att sprida Geminis svar i SGE innebär inledningsvis att Google inte är särskilt benäget att tillhandahålla Gemini-baserade SGE-resultat om de inte är nödvändiga", varnar Tim Cameron-Kitchen, grundare av Exposure Ninja.
När det gäller Geminis användning i SGE skulle det multimodala systemets förmåga att förutse användarnas förmodade behov kunna minska sökfasen ytterligare. Genom att använda Gemini skulle man kunna ge direkta svar i sökresultaten på användarens nästa frågor. I det tidigare exemplet skulle detta kunna skapa en sökresa med endast tre webbplatser att besöka, enligt Exposure Ninja.
Denna användning av Gemini i SGE skulle också kunna ge, enligt Tim Cameron-Kitchen, "färre dubbletter, bättre strukturerade svar som logiskt följer sökarens väg och bättre integration av multimodala funktioner." Det är värt att notera att för denna expert på digital marknadsföring kan den potentiella minskningen av antalet besök på webbplatser balanseras av det faktum att länkar fortfarande finns i de genererade svaren och att människor fortsätter att göra inköp från webbplatser via Google.
Potentiella tillämpningar av Gemini
Gemini har potential att användas i en mängd olika applikationer, bland annat:
Chatbots: Gemini kan användas för att skapa mer sofistikerade och naturliga chatbots. Gemini-baserade chatbots skulle kunna användas för att tillhandahålla kundservice, svara på frågor eller till och med bara hålla en konversation.
Sammanfattningar av text: Gemini kan användas för att generera mer exakta och koncisa textsammanfattningar. Gemini-baserade textsammanfattningar kan användas för att hjälpa människor att förstå långa artiklar eller dokument.
Generatorer för kreativt innehåll: Gemini kan användas för att generera kreativt innehåll, till exempel dikter, manus eller musik. Gemini-baserade generatorer av kreativt innehåll skulle kunna användas för att skapa nya former av konst eller underhållning.
Tillämpningar för maskininlärning: Gemini kan användas för att förbättra prestanda för maskininlärningstillämpningar. Gemini kan användas för att träna mer exakta och kraftfulla maskininlärningsmodeller.
Hur vi kan använda Google Gemini AI
Sundar Pichai, VD för Google Alphabet, lyfte under Google I/O 2023 fram de framsteg som görs för att göra generativ AI mer användarvänlig. Bland dessa framsteg finns PaLM 2 och Gemini. DeepMinds Gemini är särskilt utformad för att vara multimodal, vilket gör att den kan förstå olika datatyper som text, bilder och kod. Denna mångsidighet gör det möjligt för den att utmärka sig i flera uppgifter:
Generera olika typer av text, översätta språk och skapa kreativt innehåll av olika slag.
Bearbeta dataformat som grafer och kartor.
Utnyttja en stor kunskapsbas som härrör från omfattande utbildning på text- och koddatauppsättningar.
Underlätta skapandet av nya produkter och tjänster.
Analysera data och känna igen mönster.
Ge informativa svar på komplexa eller okonventionella frågor.
Även om Geminis multimodala processorkapacitet fortfarande är under utveckling har den potential att revolutionera interaktionen mellan människa och dator. Tillämpningarna kan sträcka sig från att skapa mer realistiska och engagerande virtuella assistenter till att förnya utbildningsverktyg och förbättra vår förståelse av världen. För mer information om Googles Gemini AI, inklusive dess funktion, utmärkande funktioner och mer, fortsätt utforska.
Hur fungerar Gemini?
Gemini fungerar som ett multimodalt AI-system som kan bearbeta olika typer av data, till exempel text, bilder och kod. Det utnyttjar omfattande träning på ett massivt dataset med text och kod, vilket gör att det kan förstå och generera dessa olika former av information.
I grunden använder Gemini avancerade algoritmer och modeller som utvecklats av DeepMind för att förstå och tolka data i flera olika format. Genom att träna på olika datamängder lär sig Gemini mönster, strukturer och relationer i data, vilket gör att den kan utföra uppgifter som att generera text, bearbeta visuell information som grafer och kartor och analysera komplexa datamängder.
De multimodala funktionerna gör att Gemini kan hantera olika typer av information samtidigt, vilket underlättar uppgifter som involverar flera dataformat eller källor. Det är denna mångsidighet som gör Gemini till ett potentiellt transformativt verktyg som kan revolutionera hur vi interagerar med datorer och bearbetar information inom olika områden.
Utbildning och anslutning
För SEO-proffs kommer det sannolikt att vara viktigt att utnyttja Geminis potential fullt ut. "Om DeepMinds löften håller och Gemini uppfyller de presenterade kriterierna kommer det att bli ett viktigt verktyg för varje SEO", föreslår Giulio Stella, SEO-konsult på Gstarseo "Vi kommer att behöva utbildning för att använda det försiktigt för att förbättra våra resultat." Det är värt att notera att enligt The Information måste utvecklare betala för att få tillgång till Gemini via Google Cloud server leasing.
Det kan finnas många hjälpmedel för SEO-proffs, särskilt genom Geminis anslutningsmöjligheter. "Vi skulle kunna be den att ladda information från Googles verktyg", föreslår Laurent Jean. "Till exempel genom att ansluta Google Search Console, YouTube och Google Sheets, från vilka vi kan hämta listor med positionerade nyckelord. Vi kan också be Gemini att tillhandahålla en lista över webbadresser med tillhörande nyckelord. Vi kan ge den i uppgift att skapa klassificeringar eller listor över innehåll som ska kompletteras genom att dra från Google Sheets och YouTube. Det handlar om att använda LLM:s funktioner för att generera användaroptimerad text och samtidigt utnyttja Geminis data och resonemang för att återintegrera externa data för SEO-optimering."
Artikel av:
Giulio Stella
Digital marknadsföring
Giulio Stella, en digital marknadsföringskonsult i Milano och verksam på gstarseo.it i Italien, har en passion för SEO och digital marknadsföring. Han finner tillfredsställelse i att hjälpa småföretag att uppnå betydande prestationer. I motsats till vad många tror äter italienarna inte pasta varje dag.