TL;DR: Reflection 70b, en ny AI-model, har skabt stor debat i AI-community. Udforsk hvordan den nye model blev mødt med både begejstring og skepsis, samt hvilke konsekvenser det har haft.

En Omstridt Lanceringshistorie

Reflection 70b, en open-source sprogmodel lanceret af CEO Matt Schumer fra HyperWrite AI, blev præsenteret som en game-changer. Modellen blev rost for sin overlegne præstation sammenlignet med førende modeller som GPT-4. Schumer fremhævede en ny metode kaldet refleksionstuning og nævnte samarbejde med firmaet Glaive AI, som han havde investeret i.

Reflection Writer | AI-powered tool for reflective writing | HyperWrite AI Writing Assistant
Generates reflective essays or journal entries based on your input about a specific experience or event. HyperWrite’s Reflection Writer is an AI-powered tool that helps you craft insightful reflective essays or journal entries. By inputting a description of a specific event or experience, your reactions, and the lessons you’ve learned, the tool generates a well-structured, personal and introspective reflection in a natural tone. This tool is powered by advanced AI models, making reflective writing easier and more effective.

Oprindelig blev modellen fejret, men efterhånden opdagede brugere, at den underpræsterede og mistænkte, at den brugte svar fra en anden AI kaldet Claude. Dette førte til bekymringer om vildledning og mulig bedrageri. Både Schumer og glaives grundlægger udsendte undskyldninger, men hændelsen skadede deres troværdighed betydeligt i AI-miljøet.

Træning af AI med Lokal Kultur: Meta's Tilgang

Meta er begyndt at træne sin AI med offentlig indhold fra voksne i Storbritannien delt på Facebook og Instagram. Formålet er at få deres AI-modeller til bedre at afspejle britisk kultur, historie og sprog. Efter at have stoppet tidligere på grund af bekymringer fra UK Information Commissioner's Office (ICO), har Meta nu foretaget ændringer for at være mere transparent. De understreger, at de ikke vil bruge private beskeder eller data fra brugere under 18 år.

Building AI Technology for the UK in a Responsible and Transparent Way | Meta
We’ll begin training for AI at Meta using public content by adults on Facebook and Instagram in the UK.

Næste uge vil voksne i UK modtage meddelelser, der forklarer, hvordan de kan fravælge, hvis de ikke ønsker, at deres offentlige data bruges til AI-træning. Fravælgelsesprocessen er gjort enklere og lettere at finde.

Google Lancering af Stemmekontrolleret AI-chatbot

Google har udgivet \"Gemini Live\", en stemmeaktiveret AI-chatbot, der nu er tilgængelig gratis for alle Android-brugere. Denne funktion lader folk tale med Gemini ved brug af deres stemme og få talte svar. Brugere kan have samtaler, afbryde AI'en midt i en sætning og vælge forskellige stemmestilarter for svar.

Google rolls out voice-powered AI chat to the Android masses
Gemini Live allows back-and-forth conversation, now free to all Android users.

Modsat lignende funktioner fra konkurrenter, der endnu ikke er bredt tilgængelige, er Gemini Live tilgængelig for alle Android-enheder. Indtil videre understøtter den kun engelsk, men Google planlægger at tilføje flere sprog og bringe den til iPhone-brugere snart.

Apple's On-Device AI: UI-JEPA

Apple-udviklere har skabt UI-JEPA, en ny AI-model, der forstår, hvad brugere vil gøre baseret på, hvordan de interagerer med deres enheder. I modsætning til store AI-modeller, der kræver meget computerkraft og kører på fjerne servere, er UI-JEPA lille nok til at fungere direkte på din enhed.

https://venturebeat.com/ai/apple-aims-for-on-device-user-intent-understanding-with-ui-jepa-models/

Dette gør den hurtigere og bedre til at beskytte dit privatliv. Den lærer ved at fokusere på de vigtige dele af dine handlinger uden at skulle have mærkede data. Forskerne har også lavet nye testværktøjer for at vise, at UI-JEPA fungerer godt sammenlignet med større modeller.

Google DeepMind's Fremskridt i Robotfærdigheder

Google DeepMind har udviklet to nye AI-systemer, ALOHA Unleashed og DemoStart, til at forbedre robotfærdigheder. ALOHA Unleashed giver robotter med to arme mulighed for at lære komplekse opgaver som at binde snørebånd og hænge skjorter ved at efterligne menneskelige demonstrationer. DemoStart bruger computersimulationer til at lære en robothånd at udføre delikate opgaver såsom at stramme skruer eller indsætte stik.

Our latest advances in robot dexterity
Two new AI systems, ALOHA Unleashed and DemoStart, help robots learn to perform complex tasks that require dexterous movement

Det starter med enkle handlinger og tackler gradvist sværere opgaver og kræver langt færre eksempler end traditionelle metoder. Disse fremskridt hjælper robotter med at håndtere objekter mere dygtigt og bringer dem tættere på at udføre nyttige opgaver i hverdagsmiljøer.

Stratosfærisk Værdiansættelse: Poolside AI og EvenUp

AI startup Poolside, grundlagt i begyndelsen af 2023 af tidligere GitHub Chief Technology Officer Jason Warner og software-iværksætter Eiso Kant, er angiveligt tæt på at sikre finansiering, der vil værdsætte virksomheden til 3 milliarder dollars - selv før de har udgivet et produkt. Poolside sigter mod at udvikle kunstig intelligens, der kan skrive softwarekode og potentielt ændre måden, software udvikles på. Denne betydelige værdiansættelse afspejler stærk investor tillid til virksomhedens vision om at automatisere programmeringsopgaver ved brug af AI.

AI startup Poolside nears $3 billion valuation
The company hasn’t even released it’s initial product yet, illustrating investors’ appetite for AI.

EvenUp, en startup baseret i San Francisco, udvikler kunstig intelligens-software, der hjælper personskadesadvokater med at forberede sager ved at analysere medicinske journaler og sagsfiler. Virksomheden er angiveligt i samtaler om at rejse ny finansiering til en værdiansættelse på 1 milliard dollars, hvilket vil fordoble dens værdi siden sidste finansieringsrunde ledet af Lightspeed Venture Partners.

https://www.theinformation.com/articles/legal-ai-startup-evenup-in-talks-to-raise-at-1-billion-valuation

DSBench: Skub til AI's Grænser inden for Data Science

Nuværende AI-modeller klarer sig godt i nogle områder, men kæmper med data science-opgaver i den virkelige verden. DSBench tilbyder 540 opgaver fra faktiske konkurrencer, der involverer komplekse data og situationer. Tests viser, at AI kun løser omkring en tredjedel, hvilket fremhæver behovet for at udvikle smartere og mere selvstændige data science-agenter.

Paper page - DSBench: How Far Are Data Science Agents to Becoming Data Science Experts?
Join the discussion on this paper page

Nye AI Værktøjer og Forskning

Nye forskningsdokumenter og værktøjer viser stadigvæk behovet for bedre AI-agent modeller. Forskerne introducerede Agent Workflow Memory (AWM), der hjælper AI-agenter med at lære og genbruge arbejdsprocesser, hvilket markant forbedrer succesrater og effektivitet. Desuden lærte INTRA-metoden AI at forstå, hvordan objekter kan bruges uden at have detaljerede billedetiketter, hvilket var et stort skridt fremad.

Paper page - Agent Workflow Memory
Join the discussion on this paper page

Et andet værdifuldt værktøj, Source2Synth, hjælper store AI-modeller med at lære nye færdigheder uden de omkostningstunge menneskelige annoteringer ved at generere syntetiske data forankret i virkelige kilder og filtrere dårlige eksempler ud, hvilket betydeligt forbedrer præstationen i avancerede opgaver.

Paper page - Source2Synth: Synthetic Data Generation and Curation Grounded in Real Data Sources
Join the discussion on this paper page
Del dette indlæg