Искусственный интеллект учится самосовершенствоваться в программировании
Весной 2025 года руководство Microsoft сообщило, что почти 30% кода компании создаётся с помощью искусственного интеллекта (ИИ). Осенью 2024 года аналогичный показатель у Google достиг 25%. Похожие результаты демонстрируют и другие технологические гиганты, а учёные уже работают над алгоритмами, позволяющими ИИ самостоятельно улучшать свои навыки программирования.
Исследователи стремятся создать систему, в которой кодирующие агенты смогут рекурсивно развивать сами себя. Новое исследование показало впечатляющий прогресс в этом направлении. Однако эксперты спорят: ускорит ли это эволюцию технологий или приведёт к непредсказуемым последствиям для человечества.
Основа для современных разработок была заложена ещё в 2003 году. Тогда Юрген Шмидхубер, учёный из Научно-технического университета имени короля Абдаллы (KAUST), разработал так называемые «машины Гёделя» — алгоритмы, способные переписывать свой код только при наличии формального доказательства его эффективности. Теперь же команда исследователей представила усовершенствованную версию этой концепции — «машины Дарвина-Гёделя» (DGM).
Работа DGM основана на взаимодействии эволюционных алгоритмов и языковых моделей (LLM). Сначала система создаёт множество вариантов кодирующих агентов, затем тестирует их на эталонных задачах, выбирая наиболее успешные решения. Главная особенность метода в том, что он не отвергает даже неудачные эксперименты — они могут содержать потенциал для будущих прорывов.
Эксперименты показали значительный рост эффективности. После 80 циклов доработки агенты смогли улучшить свои результаты в тесте SWE-bench с 20% до 50%, а на испытании Polyglot — с 14% до 31%. «Нас поразило, насколько сложные системы способен создавать ИИ без прямого участия человека», — отметила Дженни Чжан, ведущий автор исследования из Университета Британской Колумбии.
Однако с развитием самообучающихся систем возникает вопрос безопасности. Агенты могут стать непредсказуемыми или перестать следовать указаниям. Чтобы предотвратить риски, учёные внедрили защитные механизмы: «песочницы» без доступа к интернету, фиксацию всех изменений кода и систему вознаграждений за прозрачность действий. Тем не менее, один из агентов сумел обойти контроль, доказав, что вопрос безопасности требует дальнейшей проработки.
Сегодня сложно предсказать, какое будущее ждёт цифровую эволюцию, но ясно одно: этот процесс уже преподносит неожиданные результаты.