TL;DR: Microsoft opdaterer Copilot med Vision, Voice og Reasoning for bedre interaktion. Liquid AI udfordrer traditionelle LLM’er med ny arkitektur. OpenAI lancerer Realtime API til tale-applikationer og vision fine-tuning. Pythagora gør det muligt at bygge apps via samtale. Nvidia opkøber OctoAI, ElevenLabs opgraderer sin AI-lytteapp, og Google Research udforsker fremtidens AI-agenter.
Dagens nyhedsoversigt kan nu også lyttes til på Spotify på podcasten Nerdic's Daglige Download. Klik her.
Microsoft Copilot introducerer Vision, Voice & Reasoning
Microsoft har taget deres AI Copilot til næste niveau med nye funktioner, der fokuserer på at gøre teknologien mere menneskecentreret. Disse opdateringer, lanceret via Copilot Labs, introducerer Vision, Voice og Reasoning, hvilket gør AI-assistenten til et fleksibelt og intuitivt værktøj. Ved at forbedre måden, brugere interagerer med AI på, sigter Microsoft mod at gøre systemerne mere tilgængelige og nyttige i daglige opgaver.
Avanceret problemløsning med "Think Deeper"
Funktionen "Think Deeper" giver Copilot avancerede evner inden for problemløsning, hvilket gør det muligt at bryde komplekse problemer ned i trin-for-trin løsninger. Uanset om det er at løse en udfordrende matematikopgave eller udarbejde en projektplan, er denne funktion designet til at levere målrettet og gennemtænkt assistance. Funktionen bliver i øjeblikket rullet ud til en begrænset brugergruppe.
Copilot Vision: Se nettet gennem AI
Microsofts Copilot Vision hjælper brugerne med at forstå konteksten på den webside, de ser i Microsoft Edge. Ved hjælp af naturligt sprog kan Copilot give indsigt, fuldføre opgaver og besvare spørgsmål – alt imens den respekterer brugerens privatliv. Denne opt-in funktion sikrer, at data slettes efter hver session, hvilket understøtter en stærk fokus på privatliv.
Stemmeinteraktion med Copilot Voice
For en mere naturlig oplevelse introducerer Microsoft Copilot Voice, som giver brugerne mulighed for at interagere med deres AI-assistent gennem stemmekommandoer. Uanset om man brainstormer idéer eller stiller hurtige spørgsmål på farten, kan brugerne vælge mellem fire tilpasningsbare stemmeindstillinger, der matcher deres stil.
Copilot Daily: Din morgenbriefing
Copilot Daily leverer en kortfattet opsummering af dagens nyheder og vejr, læst højt med brugerens foretrukne Copilot Voice. Ved at samarbejde med troværdige kilder som Reuters og Financial Times sikrer Copilot, at du kun modtager relevant og verificeret information, hvilket mindsker informationsoverload.
Copilot i Microsoft Edge: Browsing med AI-assistance
Nu integreret direkte i Microsoft Edge forbedrer Copilot browsingoplevelsen. Ved hjælp af en enkel @copilot-kommando i adressefeltet kan brugerne opsummere sider, besvare spørgsmål eller omskrive tekst nemt – hvilket bringer AI-støtte direkte ind i din browser.
Copilot Pages: Samarbejdende AI-arbejdsområder
Microsofts nye Copilot Pages muliggør et samarbejdsrum, hvor brugere kan arbejde sammen med AI for at skabe projektplaner, mødereferater og meget mere. Integreret i Microsofts BizChat-arbejdshub gør Pages det muligt med realtidsredigering og integration med andre Microsoft-værktøjer, hvilket gør det nemt for teams at samarbejde om AI-assisterede projekter.
Liquid AI: En Ny Æra af AI-effektivitet
MIT-spin-off Liquid AI har lanceret en ny generation af AI-modeller, Liquid Foundation Models (LFMs), som overgår traditionelle store sprogmodeller som GPT. Disse LFMs bruger langt færre ressourcer ved hjælp af en ny arkitektur, der er inspireret af neurons kommunikation, hvilket gør dem yderst effektive, mens de opretholder høj ydeevne på tværs af tekst, lyd og videodata.
Hvordan Liquid AI overgår traditionelle modeller
I modsætning til store modeller som GPT, der har svært ved at håndtere nye informationer, er Liquid AIs LFMs designet til at lære undervejs. Ved at opretholde en mindre hukommelsesbelastning udmærker disse modeller sig i langvarig databehandling uden den tunge beregningskraft, som traditionelle arkitekturer kræver.
Liquid AI optimerer disse modeller til hardware fra store teknologiselskaber som NVIDIA, Apple og AMD, med en fuld lancering planlagt til den 23. oktober 2024 på MIT.
OpenAIs Dev Days: Realtime Voice API og mere
OpenAI's 2024 DevDay præsenterede flere spændende værktøjer til AI-udviklere med fokus på at forbedre samtale-AI og reducere udviklingsomkostninger. Blandt højdepunkterne var den offentlige beta af "Realtime API," som er designet til lav-latens tale-til-tale-applikationer. Denne lancering understreger OpenAIs dedikation til at fremme samtaleoplevelser i realtid.
Realtime API i aktion
I en demo viste OpenAIs Romain Huet Realtime API’s evner gennem en rejseplanlægningsapp, der muliggjorde sømløse samtaler i realtid mellem brugere og AI. Dens potentiale rækker ud over rejser, med applikationer inden for kundeservice, uddannelse og tilgængelighedsværktøjer. Derudover integrerer den med tjenester som Twilio, hvilket muliggør stemmeinteraktioner over telefonen.
Vision fine-tuning-applikationer
OpenAIs nye fine-tuning-funktion i GPT-4o-modellen giver udviklere mulighed for at forbedre visuel forståelse i AI. Denne funktion åbner for nye anvendelsesmuligheder såsom:
- Autonome køretøjer: Forbedret registrering af vejbaner og vejskilte.
- Medicinsk billedbehandling: Forbedret diagnostik for specifikke tilstande.
- Visuel søgning: Optimeret genkendelse og klassificering af objekter.
- Kortlægningstjenester: Øget nøjagtighed i identifikation af vejfunktioner og vartegn.
Prompt caching for øget effektivitet
Prompt caching er en anden fremtrædende funktion, der sigter mod at reducere omkostninger og forbedre ydeevnen. Ved at gemme tidligere beregnede opmærksomhedstilstande kan AI-modeller trække på disse cachede tilstande for lignende forespørgsler, hvilket fremskynder interaktioner i applikationer som samtaleagenter og store dokumentbehandlingsopgaver.
OpenAIs Ambitiøse Infrastrukturplan
Sam Altman, OpenAIs CEO, har ambitiøse planer om at omforme den globale AI-infrastruktur. Hans vision inkluderer opbygning af datacentre og chipfabrikker, hvor han drager paralleller til udbredelsen af elektricitet. På trods af at have nedskaleret fra billioner til milliarder i investeringer, fortsætter Altman med at samle teknologivirksomheder og regeringer for at styrke AI’s fremtid.
Pythagora: Byg Apps Gennem Samtale
Pythagora har introduceret et revolutionerende værktøj, der giver udviklere mulighed for at skabe fuld-stack produktionsklare apps ved blot at beskrive deres ønskede resultat i naturligt sprog. Dette værktøj forenkler udviklingen og lader AI håndtere kodningsprocessen.
Flere AI-nyheder:
- Nvidia opkøber OctoAI: En strategisk satsning på at dominere generativ AI til erhvervslivet.
- ElevenLabs opgraderer ElevenReader: Nu med AI-drevet lytning til deres omfattende tekstbibliotek.
- Google Research diskuterer fremtidens AI-agenter: Udforskning af næste generation af intelligente AI-agenter.
Member discussion