Google lansează Gemma 3
Google a lansat Gemma 3, o familie de modele AI open-source construite pe tehnologia Gemini 2.0. Modelele sunt disponibile în dimensiuni de la 1 miliard la 27 de miliarde de parametri, suportă peste 140 de limbi, înțelegere multimodală și un context de 128.000 de tokeni. Sunt optimizate pentru inferență rapidă pe GPU-uri NVIDIA și TPUs Google Cloud, și includ ShieldGemma 2, un model de 4 miliarde de parametri pentru verificarea siguranței imaginilor.
Luma AI introduce Ray2 Flash
Luma AI a anunțat Ray2 Flash, un model de generație video text-la-video îmbunătățit, care produce videoclipuri de trei ori mai rapid și mai ieftin decât predecesorul său, Ray2. Modelul păstrează capabilitățile de generație video, inclusiv suport pentru imagini, audio și control, și este disponibil acum pentru abonații plătitori pe platforma Dream Machine.
Reka lansează Flash 3 Reasoning
Reka AI a lansat Reka Flash 3, un model open-source de 21 de miliarde de parametri, antrenat de la zero pentru eficiență. Este conceput pentru chat general, codificare, urmărirea instrucțiunilor și apelarea funcțiilor, oferind performanțe competitive cu modele precum OpenAI o1-mini. Modelul folosește etichete precum “ pentru a controla timpul de gândire și este disponibil cu o lungime de context de 32.000 de tokeni.
Tencent lansează Hunyuan-TurboS
Tencent a introdus Hunyuan-TurboS, un model hibrid Transformer-Mamba MoE, care combină procesarea secvențelor lungi eficientă a Mamba cu înțelegerea contextuală a Transformerelor. Modelul oferă performanțe îmbunătățite în matematică, raționament și aliniere, cu costuri de inferență reduse cu 1/7 față de predecesorul Turbo, și este disponibil prin API-ul Tencent Cloud.
OpenAI lansează un framework pentru agenți AI
OpenAI a prezentat un nou set de instrumente pentru dezvoltatori, permițând crearea de agenți AI personalizați. Acestea includ căutare web în timp real, integrare cu aplicații și executarea de sarcini complexe, accesibile prin API-ul Responses și SDK-ul Agents, disponibile în versiune preview pentru dezvoltatori.
Google adaugă editare nativă de imagini în Gemini 2.0 Flash
Google a integrat funcționalități de generare și editare de imagini în modelul Gemini 2.0 Flash, disponibile prin Google AI Studio. Utilizatorii pot crea și modifica imagini folosind prompturi textuale, fără a folosi un model separat precum Imagen, în interacțiuni multi-turn, îmbunătățind capabilitățile de procesare multimodală.
Hedra lansează Character 3
Hedra a lansat Character 3, un model omnimodal pentru generarea de personaje animate vorbitoare, bazat pe text sau audio. Modelul combină sinteza vocală, sincronizarea buzelor și vizualuri expresive, fiind destinat creatorilor de conținut video care prioritizează realismul, cu aplicații în producția video.
Freepik integrează Veo 2 pentru video din imagini
Freepik a colaborat cu Google pentru a integra Veo 2, permițând transformarea imaginilor statice în videoclipuri scurte de calitate, cu mișcare naturală. Funcționalitatea este disponibilă prin platforma Freepik AI Suite, extinzând capabilitățile de generare video pentru utilizatori.