Google Gemini Live: AI-assistent med brister

Google Gemini Live: AI-assistent med brister

Sep 17

Google Gemini Live: En lovande men ofullständig röstassistent

Google har nyligen lanserat Gemini Live, en ny röstbaserad AI-assistent som är tänkt att konkurrera med OpenAIs Advanced Voice Mode. Gemini Live erbjuder en mer naturlig och engagerande chatbot-upplevelse, med realistiska röster och möjligheten att avbryta boten när som helst. Men hur väl fungerar det i praktiken? Kyle Wiggers på TechCrunch har testat Gemini Live och delar med sig av sina intryck.

En mer naturlig konversation - med brister

Gemini Live använder avancerade textgenereringsmodeller i kombination med text-till-tal för att skapa en mer flytande konversation. Rösten som Wiggers testade, kallad Ursa, beskrivs som mer uttrycksfull än Googles tidigare syntetiska röster. Dock behåller Gemini Live en viss distanserad ton som gör att den inte känns helt mänsklig. Till skillnad från OpenAIs assistent saknar Gemini Live skratt, andningar och andra mänskliga ljud.

En fördel är att man kan avbryta Gemini Live mitt i en mening, vilket gör konversationen mer naturlig. Dock kan detta ibland leda till förvirring när assistenten fortsätter prata tyst i bakgrunden.

Imponerande minne men opålitliga svar

Wiggers noterar att Gemini Live har ett imponerande minne och kan referera till tidigare konversationer. Dock har assistenten en tendens att "hallucinera" och hitta på information, vilket gör den opålitlig som källa. I ett test gav Gemini Live felaktig information om nattklubbar i New York, vilket visar på bristerna i dess kunskapsbas.

Etiska begränsningar och tekniska problem

Likt andra AI-assistenter har Gemini Live etiska begränsningar kring vad den kan diskutera. Den vägrade till exempel att kommentera ett politiskt uttalande. Wiggers stötte också på flera tekniska problem under testningen, som röstbortfall och svårigheter att aktivera funktionen.

Slutsats: Lovande men ofärdig

Sammanfattningsvis anser Wiggers att Gemini Live är ett intressant steg framåt för röstbaserade AI-assistenter, men att det fortfarande finns mycket att förbättra. De största problemen är assistentens tendens att ge felaktig information och bristen på personlighet jämfört med mänskliga konversationer.

"Detta känns som en prototyp", skriver Wiggers. "Det saknar expressiviteten hos Advanced Voice Mode och det finns inte mycket anledning att använda Gemini Live framför den textbaserade Gemini-upplevelsen. Faktum är att jag skulle argumentera för att den textbaserade Gemini är mer användbar för tillfället. Och det reflekterar inte väl på Live alls."

För att Gemini Live ska bli ett verkligt användbart verktyg behöver Google adressera problemen med felaktig information och göra interaktionen mer engagerande. Tills dess förblir det en intressant men begränsad teknikdemonstration. Som många nya AI-produkter visar Gemini Live stor potential, men det krävs mer utveckling innan det kan leva upp till löftet om en verkligt naturlig konversation med en AI.

Läs hela Kyle Wiggers recension av Gemini Live på TechCrunch för fler detaljer och insikter.

No items found.