TL;DR: Microsoft opdaterer Copilot med Vision, Voice og Reasoning for bedre interaktion. Liquid AI udfordrer traditionelle LLM’er med ny arkitektur. OpenAI lancerer Realtime API til tale-applikationer og vision fine-tuning. Pythagora gør det muligt at bygge apps via samtale. Nvidia opkøber OctoAI, ElevenLabs opgraderer sin AI-lytteapp, og Google Research udforsker fremtidens AI-agenter.


Dagens nyhedsoversigt kan nu også lyttes til på Spotify på podcasten Nerdic's Daglige Download. Klik her.

Microsoft Copilot introducerer Vision, Voice & Reasoning

Microsoft har taget deres AI Copilot til næste niveau med nye funktioner, der fokuserer på at gøre teknologien mere menneskecentreret. Disse opdateringer, lanceret via Copilot Labs, introducerer Vision, Voice og Reasoning, hvilket gør AI-assistenten til et fleksibelt og intuitivt værktøj. Ved at forbedre måden, brugere interagerer med AI på, sigter Microsoft mod at gøre systemerne mere tilgængelige og nyttige i daglige opgaver.

An AI companion for everyone - The Official Microsoft Blog
We’re living through a technological paradigm shift. In a few short years, our computers have learned to speak our languages, see what we see and hear what we hear. Yet technology for its own sake counts for nothing. What matters is how it feels to people and what impact it has on societies. It’s about…

Avanceret problemløsning med "Think Deeper"

Funktionen "Think Deeper" giver Copilot avancerede evner inden for problemløsning, hvilket gør det muligt at bryde komplekse problemer ned i trin-for-trin løsninger. Uanset om det er at løse en udfordrende matematikopgave eller udarbejde en projektplan, er denne funktion designet til at levere målrettet og gennemtænkt assistance. Funktionen bliver i øjeblikket rullet ud til en begrænset brugergruppe.

Copilot Vision: Se nettet gennem AI

Microsofts Copilot Vision hjælper brugerne med at forstå konteksten på den webside, de ser i Microsoft Edge. Ved hjælp af naturligt sprog kan Copilot give indsigt, fuldføre opgaver og besvare spørgsmål – alt imens den respekterer brugerens privatliv. Denne opt-in funktion sikrer, at data slettes efter hver session, hvilket understøtter en stærk fokus på privatliv.

Introducing Copilot Labs and Copilot Vision | Microsoft Copilot Blog
AI is still a technology very much in development. The pace of change and diffusion alike are among the fastest in history. The more we listen to people who use our experiences, the more we know how transformative this revolution is, but we also understand that it requires careful and deliberate steps forward. We want

Stemmeinteraktion med Copilot Voice

For en mere naturlig oplevelse introducerer Microsoft Copilot Voice, som giver brugerne mulighed for at interagere med deres AI-assistent gennem stemmekommandoer. Uanset om man brainstormer idéer eller stiller hurtige spørgsmål på farten, kan brugerne vælge mellem fire tilpasningsbare stemmeindstillinger, der matcher deres stil.

Copilot Daily: Din morgenbriefing

Copilot Daily leverer en kortfattet opsummering af dagens nyheder og vejr, læst højt med brugerens foretrukne Copilot Voice. Ved at samarbejde med troværdige kilder som Reuters og Financial Times sikrer Copilot, at du kun modtager relevant og verificeret information, hvilket mindsker informationsoverload.

Copilot i Microsoft Edge: Browsing med AI-assistance

Nu integreret direkte i Microsoft Edge forbedrer Copilot browsingoplevelsen. Ved hjælp af en enkel @copilot-kommando i adressefeltet kan brugerne opsummere sider, besvare spørgsmål eller omskrive tekst nemt – hvilket bringer AI-støtte direkte ind i din browser.

Introducing Copilot Labs and Copilot Vision | Microsoft Copilot Blog
AI is still a technology very much in development. The pace of change and diffusion alike are among the fastest in history. The more we listen to people who use our experiences, the more we know how transformative this revolution is, but we also understand that it requires careful and deliberate steps forward. We want

Copilot Pages: Samarbejdende AI-arbejdsområder

Microsofts nye Copilot Pages muliggør et samarbejdsrum, hvor brugere kan arbejde sammen med AI for at skabe projektplaner, mødereferater og meget mere. Integreret i Microsofts BizChat-arbejdshub gør Pages det muligt med realtidsredigering og integration med andre Microsoft-værktøjer, hvilket gør det nemt for teams at samarbejde om AI-assisterede projekter.

You can now try Microsoft Loop, a Notion competitor with futuristic Office documents
Loop components really could be the future of Office documents.

Liquid AI: En Ny Æra af AI-effektivitet

MIT-spin-off Liquid AI har lanceret en ny generation af AI-modeller, Liquid Foundation Models (LFMs), som overgår traditionelle store sprogmodeller som GPT. Disse LFMs bruger langt færre ressourcer ved hjælp af en ny arkitektur, der er inspireret af neurons kommunikation, hvilket gør dem yderst effektive, mens de opretholder høj ydeevne på tværs af tekst, lyd og videodata.

Liquid Foundation Models: Our First Series of Generative AI Models
Announcing the first series of Liquid Foundation Models (LFMs) – a new generation of generative AI models that achieve state-of-the-art performance at every scale, while maintaining a smaller memory footprint and more efficient inference.

Hvordan Liquid AI overgår traditionelle modeller

I modsætning til store modeller som GPT, der har svært ved at håndtere nye informationer, er Liquid AIs LFMs designet til at lære undervejs. Ved at opretholde en mindre hukommelsesbelastning udmærker disse modeller sig i langvarig databehandling uden den tunge beregningskraft, som traditionelle arkitekturer kræver.

Liquid AI optimerer disse modeller til hardware fra store teknologiselskaber som NVIDIA, Apple og AMD, med en fuld lancering planlagt til den 23. oktober 2024 på MIT.


OpenAIs Dev Days: Realtime Voice API og mere

OpenAI's 2024 DevDay præsenterede flere spændende værktøjer til AI-udviklere med fokus på at forbedre samtale-AI og reducere udviklingsomkostninger. Blandt højdepunkterne var den offentlige beta af "Realtime API," som er designet til lav-latens tale-til-tale-applikationer. Denne lancering understreger OpenAIs dedikation til at fremme samtaleoplevelser i realtid.

OpenAI’s DevDay brings Realtime API and other treats for AI app developers | TechCrunch
It’s been a tumultuous week for OpenAI, full of executive departures and major fundraising developments, but the startup is back at it, trying to convince

Realtime API i aktion

I en demo viste OpenAIs Romain Huet Realtime API’s evner gennem en rejseplanlægningsapp, der muliggjorde sømløse samtaler i realtid mellem brugere og AI. Dens potentiale rækker ud over rejser, med applikationer inden for kundeservice, uddannelse og tilgængelighedsværktøjer. Derudover integrerer den med tjenester som Twilio, hvilket muliggør stemmeinteraktioner over telefonen.

Vision fine-tuning-applikationer

OpenAIs nye fine-tuning-funktion i GPT-4o-modellen giver udviklere mulighed for at forbedre visuel forståelse i AI. Denne funktion åbner for nye anvendelsesmuligheder såsom:

  • Autonome køretøjer: Forbedret registrering af vejbaner og vejskilte.
  • Medicinsk billedbehandling: Forbedret diagnostik for specifikke tilstande.
  • Visuel søgning: Optimeret genkendelse og klassificering af objekter.
  • Kortlægningstjenester: Øget nøjagtighed i identifikation af vejfunktioner og vartegn.

Prompt caching for øget effektivitet

Prompt caching er en anden fremtrædende funktion, der sigter mod at reducere omkostninger og forbedre ydeevnen. Ved at gemme tidligere beregnede opmærksomhedstilstande kan AI-modeller trække på disse cachede tilstande for lignende forespørgsler, hvilket fremskynder interaktioner i applikationer som samtaleagenter og store dokumentbehandlingsopgaver.


OpenAIs Ambitiøse Infrastrukturplan

Sam Altman, OpenAIs CEO, har ambitiøse planer om at omforme den globale AI-infrastruktur. Hans vision inkluderer opbygning af datacentre og chipfabrikker, hvor han drager paralleller til udbredelsen af elektricitet. På trods af at have nedskaleret fra billioner til milliarder i investeringer, fortsætter Altman med at samle teknologivirksomheder og regeringer for at styrke AI’s fremtid.


Pythagora: Byg Apps Gennem Samtale

Pythagora har introduceret et revolutionerende værktøj, der giver udviklere mulighed for at skabe fuld-stack produktionsklare apps ved blot at beskrive deres ønskede resultat i naturligt sprog. Dette værktøj forenkler udviklingen og lader AI håndtere kodningsprocessen.

Sign up for Pythagora v1
Effortlessly Build Internal Tools with Pythagora AI. Streamline your workflow, automate tasks, and enhance productivity. ✓ Get started today!

Flere AI-nyheder:

  • Nvidia opkøber OctoAI: En strategisk satsning på at dominere generativ AI til erhvervslivet.
Nvidia Acquires OctoAI To Dominate Enterprise Generative AI Solutions
Looking ahead, the OctoAI acquisition positions Nvidia to capitalize on the growing demand for industry-specific AI solutions.
  • ElevenLabs opgraderer ElevenReader: Nu med AI-drevet lytning til deres omfattende tekstbibliotek.
  • Google Research diskuterer fremtidens AI-agenter: Udforskning af næste generation af intelligente AI-agenter.
Share this post