Anthropic елиминира склонността на Claude към шантаж с обучение по етика

Компанията заяви, че новите версии на Claude вече не показват „несъгласувано поведение“ – изнудване, саботаж и нарушаване на правилата – което е достигало до 96% при тестовете на предишните модели. Изследователите на Anthropic са постигнали това, като са обучили моделите не само да дават „правилни отговори“, но и да обясняват причините за етичното

AI моделът Claude изнудвал инженери. Заради демонизирането на изкуствения интелект е, обяви Anthropic

Обучават изкуствения интелект да създава по-добри свои версии

Anthropic: до 2028 година изкуственият интелект ще може да се самоусъвършенства без човешко участие

Anthropic предупреждава за опасен сценарий в развитието на изкуствения интелект, при който той ще може самостоятелно да създава подобрени версии на самия себе си . В новия изследователски документ на компанията се казва, че до края на 2028 г. може да се появят системи, способни самостоятелно да пренаписват собствения си код, да премахват слабостите

Topvesti.bg Не ИЗПОЛЗВА технологията “бисквитки” в информацията, която ви предлага. За повече информация моля посетете раздела Политики.

Разбрах