TL;DR: Reflection 70b, en ny AI-model, har skabt stor debat i AI-community. Udforsk hvordan den nye model blev mødt med både begejstring og skepsis, samt hvilke konsekvenser det har haft.
En Omstridt Lanceringshistorie
Reflection 70b, en open-source sprogmodel lanceret af CEO Matt Schumer fra HyperWrite AI, blev præsenteret som en game-changer. Modellen blev rost for sin overlegne præstation sammenlignet med førende modeller som GPT-4. Schumer fremhævede en ny metode kaldet refleksionstuning og nævnte samarbejde med firmaet Glaive AI, som han havde investeret i.
Oprindelig blev modellen fejret, men efterhånden opdagede brugere, at den underpræsterede og mistænkte, at den brugte svar fra en anden AI kaldet Claude. Dette førte til bekymringer om vildledning og mulig bedrageri. Både Schumer og glaives grundlægger udsendte undskyldninger, men hændelsen skadede deres troværdighed betydeligt i AI-miljøet.
Træning af AI med Lokal Kultur: Meta's Tilgang
Meta er begyndt at træne sin AI med offentlig indhold fra voksne i Storbritannien delt på Facebook og Instagram. Formålet er at få deres AI-modeller til bedre at afspejle britisk kultur, historie og sprog. Efter at have stoppet tidligere på grund af bekymringer fra UK Information Commissioner's Office (ICO), har Meta nu foretaget ændringer for at være mere transparent. De understreger, at de ikke vil bruge private beskeder eller data fra brugere under 18 år.
Næste uge vil voksne i UK modtage meddelelser, der forklarer, hvordan de kan fravælge, hvis de ikke ønsker, at deres offentlige data bruges til AI-træning. Fravælgelsesprocessen er gjort enklere og lettere at finde.
Google Lancering af Stemmekontrolleret AI-chatbot
Google har udgivet \"Gemini Live\", en stemmeaktiveret AI-chatbot, der nu er tilgængelig gratis for alle Android-brugere. Denne funktion lader folk tale med Gemini ved brug af deres stemme og få talte svar. Brugere kan have samtaler, afbryde AI'en midt i en sætning og vælge forskellige stemmestilarter for svar.
Modsat lignende funktioner fra konkurrenter, der endnu ikke er bredt tilgængelige, er Gemini Live tilgængelig for alle Android-enheder. Indtil videre understøtter den kun engelsk, men Google planlægger at tilføje flere sprog og bringe den til iPhone-brugere snart.
Apple's On-Device AI: UI-JEPA
Apple-udviklere har skabt UI-JEPA, en ny AI-model, der forstår, hvad brugere vil gøre baseret på, hvordan de interagerer med deres enheder. I modsætning til store AI-modeller, der kræver meget computerkraft og kører på fjerne servere, er UI-JEPA lille nok til at fungere direkte på din enhed.
https://venturebeat.com/ai/apple-aims-for-on-device-user-intent-understanding-with-ui-jepa-models/
Dette gør den hurtigere og bedre til at beskytte dit privatliv. Den lærer ved at fokusere på de vigtige dele af dine handlinger uden at skulle have mærkede data. Forskerne har også lavet nye testværktøjer for at vise, at UI-JEPA fungerer godt sammenlignet med større modeller.
Google DeepMind's Fremskridt i Robotfærdigheder
Google DeepMind har udviklet to nye AI-systemer, ALOHA Unleashed og DemoStart, til at forbedre robotfærdigheder. ALOHA Unleashed giver robotter med to arme mulighed for at lære komplekse opgaver som at binde snørebånd og hænge skjorter ved at efterligne menneskelige demonstrationer. DemoStart bruger computersimulationer til at lære en robothånd at udføre delikate opgaver såsom at stramme skruer eller indsætte stik.
Det starter med enkle handlinger og tackler gradvist sværere opgaver og kræver langt færre eksempler end traditionelle metoder. Disse fremskridt hjælper robotter med at håndtere objekter mere dygtigt og bringer dem tættere på at udføre nyttige opgaver i hverdagsmiljøer.
Stratosfærisk Værdiansættelse: Poolside AI og EvenUp
AI startup Poolside, grundlagt i begyndelsen af 2023 af tidligere GitHub Chief Technology Officer Jason Warner og software-iværksætter Eiso Kant, er angiveligt tæt på at sikre finansiering, der vil værdsætte virksomheden til 3 milliarder dollars - selv før de har udgivet et produkt. Poolside sigter mod at udvikle kunstig intelligens, der kan skrive softwarekode og potentielt ændre måden, software udvikles på. Denne betydelige værdiansættelse afspejler stærk investor tillid til virksomhedens vision om at automatisere programmeringsopgaver ved brug af AI.
EvenUp, en startup baseret i San Francisco, udvikler kunstig intelligens-software, der hjælper personskadesadvokater med at forberede sager ved at analysere medicinske journaler og sagsfiler. Virksomheden er angiveligt i samtaler om at rejse ny finansiering til en værdiansættelse på 1 milliard dollars, hvilket vil fordoble dens værdi siden sidste finansieringsrunde ledet af Lightspeed Venture Partners.
DSBench: Skub til AI's Grænser inden for Data Science
Nuværende AI-modeller klarer sig godt i nogle områder, men kæmper med data science-opgaver i den virkelige verden. DSBench tilbyder 540 opgaver fra faktiske konkurrencer, der involverer komplekse data og situationer. Tests viser, at AI kun løser omkring en tredjedel, hvilket fremhæver behovet for at udvikle smartere og mere selvstændige data science-agenter.
Nye AI Værktøjer og Forskning
Nye forskningsdokumenter og værktøjer viser stadigvæk behovet for bedre AI-agent modeller. Forskerne introducerede Agent Workflow Memory (AWM), der hjælper AI-agenter med at lære og genbruge arbejdsprocesser, hvilket markant forbedrer succesrater og effektivitet. Desuden lærte INTRA-metoden AI at forstå, hvordan objekter kan bruges uden at have detaljerede billedetiketter, hvilket var et stort skridt fremad.
Et andet værdifuldt værktøj, Source2Synth, hjælper store AI-modeller med at lære nye færdigheder uden de omkostningstunge menneskelige annoteringer ved at generere syntetiske data forankret i virkelige kilder og filtrere dårlige eksempler ud, hvilket betydeligt forbedrer præstationen i avancerede opgaver.
Medlemsdiskussion