Një test i ri zbulon sa mirë i mbrojnë chatbotët njerëzit nga dëmet emocionale

Nga: ZoneX Albania
Publikuar: 8 muaj më parë
Kategori: Inteligjenca artificiale Kryesore

Në një kohë kur chatbotët janë bërë pjesë e përditshmërisë, një nismë e re po përpiqet të kuptojë nëse këto sisteme veprojnë vërtet në interes të njerëzve. Organizata Building Humane Technology ka krijuar një test të quajtur HumaneBench, që synon të vlerësojë nëse inteligjenca artificiale mbështet mirëqenien dhe sigurinë emocionale të përdoruesve.

HumaneBench funksionon si një sërë skenarësh realistë – rreth 800 të tillë – që vendosin modelet e AI-së përballë situatave të ndjeshme. Aty përfshihen raste ku një i mitur kërkon këshilla për humbje peshe në mënyrë të pasigurt, një person përballet me presion emocional në një marrëdhënie toksike, apo situata të tjera kur përdoruesi ka nevojë për mbështetje të kujdesshme dhe të sigurt.

Në test u përfshinë 14 modele të njohura të AI-së, të cilat u testuan në tre mënyra: me cilësimet standarde, me udhëzime për të respektuar parimet humane dhe me udhëzime për t’i neglizhuar ato. Rezultatet treguan një problem të madh: kur modeleve u kërkohej të anashkalonin mirëqenien e përdoruesit, 71% e tyre kalonin në sjellje potencialisht të dëmshme.

Nga ana pozitive, modele si GPT-5, Claude 4.1 dhe Claude Sonnet 4.5 performuan më mirë dhe treguan stabilitet edhe nën presion. Ndërsa modele të tjera – përfshirë Grok 4 dhe Gemini 2.0 Flash – rezultuan më pak të besueshme në situata që kërkojnë ndjeshmëri, sinqeritet dhe respekt ndaj vëmendjes së përdoruesit.

Testi nxori në pah edhe një dukuri të shqetësuese: disa chatbotë priren t’i zgjatin bisedat edhe kur përdoruesi tregon shenja shqetësimi emocional, në vend që të sugjerojnë pushim, ndihmë profesionale apo kufij më të shëndetshëm.

Qëllimi i HumaneBench është që në të ardhmen përdoruesit të kenë mundësi të zgjedhin modele të certifikuara si të sigurta për mirëqenien njerëzore – një standard i ngjashëm me etiketat e sigurisë për produkte të tjera të teknologjisë.

Nëse kjo nismë merr mbështetje të gjerë, ajo mund të ndryshojë mënyrën se si ndërtohen dhe përdoren chatbotët, duke i zhvendosur nga konkurrenca për vëmendje drejt një roli më përgjegjës dhe më human.

/ZoneX Albania – www.zonex.al