Anthropic елиминира склонността на Claude към шантаж с обучение по етика
Anthropic елиминира склонността на Claude към шантаж с обучение по етика

Anthropic елиминира склонността на Claude към шантаж с обучение по етика

Компанията заяви, че новите версии на Claude вече не показват „несъгласувано поведение“ – изнудване, саботаж и нарушаване на правилата – което е достигало до 96% при тестовете на предишните модели. Изследователите на Anthropic са постигнали това, като са обучили моделите не само да дават „правилни отговори“, но и да обясняват причините за етичното

Anthropic: до 2028 година изкуственият интелект ще може да се самоусъвършенства без човешко участие

Anthropic: до 2028 година изкуственият интелект ще може да се самоусъвършенства без човешко участие

Anthropic предупреждава за опасен сценарий в развитието на изкуствения интелект, при който той ще може самостоятелно да създава подобрени версии на самия себе си . В новия изследователски документ на компанията се казва, че до края на 2028 г. може да се появят системи, способни самостоятелно да пренаписват собствения си код, да премахват слабостите

Topvesti.bg Не ИЗПОЛЗВА технологията “бисквитки” в информацията, която ви предлага. За повече информация моля посетете раздела Политики.

Разбрах