Minimal oder hoch? Der Erwägungsgrund 53 des AI Acts der EU zielt unter anderem darauf ab, KI-Systeme in Risikoklassen einzuteilen. So sollen KI-Systeme mit
Alle Beiträge zu KI Evaluierung
AI Agent
Verborgene Fehler: Wie wir KI-Systeme falsch bewerten (und was wir dagegen tun können)
Herkömmliche Metriken wie „Genauigkeit“ versagen bei der Bewertung moderner KI. Dieser Artikel zeigt, warum alte Methoden zu verborgenen Fehlern wie Halluzinationen führen, und stellt einen ...


