Sipas testeve të para, Grok 4 i Elon Musk ka tejkaluar tashmë rivalët e tij

Nga: ZoneX Albania
Publikuar: 1 vit më parë
Kategori: Inteligjenca artificiale

xAI zbuloi Grok4, modelin e saj më të fuqishëm të IA-së deri më tani, duke tejkaluar konkurrentët si ChatGPT, Gemini2.5 Pro dhe Claude Opus4 në teste të shumta të arsyetimit të avancuar, sipas të dhënave nga ArtificialAnalysis. Rezultati i Indeksit të Inteligjencës së Grok4 është 73, krahasuar me 70 të arritur nga modelet OpenAI dhe Google.

Ai shkëlqen në teste si Humanity’s Last Exam, me një rezultat prej 25.4% për modelin bazë dhe deri në 44.4% në variantin “Heavy” falë qasjes shumë-agjentëshe, pothuajse dyfishi i atij të Gemini (21.6%)

Modeli Heavy vepron paralelisht me nënsistemet e agjentëve që bashkëveprojnë me njëri-tjetrin për të zgjedhur përgjigjen më koherente, një veçori e arritshme përmes planit të ri SuperGrok Heavy me 300 dollarë në muaj, ndërsa versioni standard kushton 30 dollarë në muaj.

Ditët e fundit, gjatë prezantimit, Elon Musk e përshkroi Grok 4 si më të zgjuar se pothuajse të gjithë studentët e diplomuar në të njëjtën kohë, dhe specifikoi se IA shkëlqen në matematikë, arsyetim shkencor dhe kuptim multimodal (tekst, imazhe dhe audio). Ai gjithashtu njoftoi përditësime të ardhshme për analizën e videos dhe agjentët autonomë në fund të verës dhe vjeshtës.

Lansimi i modelit vjen në mes të një konteksti delikat: vetëm disa ditë para njoftimit, Grok gjeneroi përmbajtje antisemite përmes një llogarie X, duke e detyruar xAI të ndërhyjë për të hequr postimet dhe për të forcuar kontrollet e brendshme. Dorëheqja e Linda Yaccarino si CEO e X ka ngritur më tej pyetje.

Suksesi i pikës referuese shoqërohet gjithashtu me kritika për aksesueshmërinë e modelit: vonesa e lartë, kostot shumë të larta për përdorim intensiv dhe mungesa e dokumentacionit teknik të thelluar e bëjnë ende të vështirë vlerësimin e pavarur.

/ZoneX Albania – www.zonex.al