OpenAI розробила новий метод, який налаштовує моделі на безпечну поведінкуOpenAI впроваджує винагороди на основі правил (RBR) як частину системи безпеки, щоб узгодити дії моделі з бажаною поведінкою користувача. 25.07.2024 14:58