ИИ и благополучие: почему нам нужны позитивные сценарии будущего
Facebook появился всего 20 лет назад. За это время социальные сети успели уничтожить бизнес медиа, подсадить нас на лайки и заменить настоящее общение его имитацией. ИИ повлияет на общество сильнее — и мы даже не пытаемся ответить на главный вопрос: чего мы хотим от этого будущего?
В обстоятельном эссе на The Gradient группа исследователей предлагает непопулярный, но продуктивный подход: перестать спорить о том, спасёт ли ИИ мир или его погубит, и вместо этого начать строить позитивные сценарии, привязанные к конкретным метрикам человеческого благополучия. Это не манифест — скорее исследовательская программа с конкретными направлениями работы.
Что такое подход «ИИ для благополучия»
Подход основан на простой идее: польза от ИИ в конечном счёте выражается в пережитом опыте людей. Не в абстрактных показателях вроде GDP или количества параметров модели, а в том, счастливее ли мы стали, осмысленнее ли наши жизни, здоровее ли наши отношения.
Это не отменяет важности экономики, демократии или безопасности — все эти вещи ценны постольку, поскольку они влияют на наш реальный опыт. Когда мы оптимизируем GDP вместо благополучия, мы путаем карту с территорией.
Авторы честно признают: философы, экономисты и психологи спорят о природе благополучия тысячелетиями, и единой теории нет. Одни говорят, что суть — в удовольствии (гедонизм), другие — в исполнении желаний, третьи — в автономии и самореализации. Мартин Селигман выделяет пять компонентов: позитивные эмоции, вовлечённость, отношения, смысл и достижения (PERMA). Но авторы эссе утверждают, что отсутствие консенсуса — не повод бездействовать. Достаточно работать с конкретными, научно обоснованными факторами: качеством отношений, чувством осмысленности, автономией, эмоциональным состоянием.
Проблема позитивного воображения
Большинство дискуссий об ИИ крутятся вокруг рисков: дезинформация, потеря работы, предвзятость, экзистенциальная угроза. Это важно, но оборонительная позиция не строит будущего. Авторы приводят аналогию с образованием: можно запретить ChatGPT в школах и пытаться сохранить статус-кво, а можно спросить себя — что на самом деле ценно в образовании?
Если ответ — критическое мышление, самостоятельность и гражданская ответственность, то ИИ-тьюторы, которые ведут сократический диалог вместо того чтобы просто давать ответы, могут быть полезнее запрета. Если ответ — стандартизированные тесты, мы уже проиграли.
Тот же принцип применим к знакомствам: swipe-приложения почти наверняка будут выглядеть дикой ошибкой через десять лет, когда ИИ сможет помочь людям строить здоровые отношения. К новостям: алгоритмы, оптимизирующие вовлечённость, разрушили информационное пространство, но те же модели можно обучить поддерживать конструктивный диалог. К творчеству: вместо того чтобы заменять художников, ИИ может дать каждому инструменты для самовыражения.
Ключевая мысль: технология всегда меняет институты — вопрос в том, направляем ли мы это изменение осознанно или позволяем ему случиться. Facebook не планировал разрушать медиа — это произошло само. С ИИ ставки выше.
Четыре направления работы
Эссе предлагает конкретную структуру: понять, куда мы хотим прийти → научиться измерять влияние ИИ на благополучие → обучать модели его поддерживать → развёртывать в интересных областях. Разберём каждое.
Понять, куда мы хотим
Нам нужны междисциплинарные обсуждения, в которых участвуют не только инженеры, но и психологи, философы, социологи, художники. Инициативы вроде Collective Intelligence Project и Meaning Alignment Institute уже работают над тем, чтобы выяснить, что важно людям в эпоху ИИ, — не через абстрактные опросы, а через конкретные механизмы democratic fine-tuning и deliberative democracy.
Это не обязательно должно быть глобальным консенсусом. Разные сообщества могут иметь разные ценности — и алгоритмы вроде Constitutional AI позволяют создавать модели с разными «конституциями» для разных культур. Технология впервые даёт нам дешёвую гибкость: не нужно выбирать между масштабностью и учётом контекста.
Измерять влияние ИИ на благополучие
То, что мы измеряем, определяет, куда мы движемся. GDP стал проклятием для экономической политики, потому что страны оптимизируют его вместо реального качества жизни. Вовлечённость (engagement) стала проклятием для соцсетей. Если мы не создадим метрики благополучия, ИИ будет оптимизироваться под прибыль и удержание внимания.
Авторы предлагают таксономию из четырёх уровней: capabilities (что модель может делать), behaviors (как она себя ведёт в конкретных ситуациях), usage (как её используют на практике), impacts (как это влияет на людей и общество). Для каждого уровня можно создать свои метрики.
Например, возьмём автономию — один из ключевых факторов благополучия по Self-Determination Theory. На уровне impact — психологические опросы, измеряющие, чувствуют ли пользователи себя empowered. На уровне usage — автоматизирует ли ИИ задачи, которые человек находит осмысленными, или помогает ему расти? На уровне behaviors — ведёт ли модель сократический диалог или просто даёт готовые ответы? На уровне capabilities — может ли модель определить уровень навыков пользователя?
Критически важно: авторы предупреждают об опасности оптимизации метрик. Если метрика благополучия не учитывает автономию, оптимизация по ней создаст патерналистский ИИ, который «делает нас счастливыми», отбирая свободу выбора. Решение — не одна метрика, а разнообразие, плюс готовность пересматривать метрики, когда выясняется, что они работают плохо.
Обучать модели поддерживать благополучие
Если базовые модели не понимают, что такое благополучие, все приложения на их основе будут это игнорировать. Проблема в том, что модели обучаются преимущественно на данных из интернета, где психология благополучия представлена слабо, а вирусная убедительность — сильно. Результат: легче создать приложение для манипуляции, чем для поддержки.
Авторы предлагают работать на всех трёх стадиях тренировки моделей. Pretraining — добавить в обучающие данные транскрипты поддерживающих разговоров, биографии, книги по психологии, посты из сабреддитов о ментальном здоровье. Fine-tuning — создать наборы данных от экспертов: терапевтов, коучей, педагогов. Alignment — расширить RLHF за пределы «какой ответ предпочитает пользователь прямо сейчас» и учитывать, какой ответ поддерживает долгосрочный рост и автономию.
Последнее — особенно сложная задача. RLHF работает с мгновенными предпочтениями: пользователю нравится ответ — он ставит лайк. Но то, что нравится сейчас, не всегда полезно в перспективе. Нам нужны исследования, которые свяжут краткосрочные прокси (качество отношений, время в состоянии flow) с долгосрочным благополучием. И данные — лонгитюдные исследования, автобиографии, экспертные оценки от людей, которые посвятили жизнь помощи другим.
Развёртывать осознанно
Успешные примеры могут изменить стандарты для всей индустрии. RLHF был впервые интегрирован OpenAI, а теперь используется повсеместно. ChatGPT-плагины появились у внешних компаний до того, как OpenAI встроил их в свой продукт. Если кто-то создаст успешное приложение для ИИ-терапии или образования, которое demonstrably улучшает благополучие, крупные лаборатории заметят и интегрируют эти подходы.
Особенно интересны «неудобные» области: ИИ-компаньоны, приложения для знакомств, attention economy. Можно пытаться запретить Replika, а можно спросить — как создать искусственного компаньона, который помогает развивать реальные социальные навыки вместо замены человеческого общения? Ответ неочевиден, но вопрос правильный.
Правовые структуры тоже имеют значение: public benefit corporations и некоммерческие организации могут минимизировать конфликт между прибылью и пользой для пользователей. Ценностно-ориентированные инвесторы и тщательный дизайн корпоративной культуры — тоже инструменты.
Почему это важно именно сейчас
GPT-2 вышел в 2019 году — модель, которая с трудом связывала пару предложений. Прошло всего семь лет, и мы имеем системы, которые пишут код, генерируют видео и ведут философские дебаты. Если модели продолжат развиваться теми же темпами, их интеграция в общество будет расти лавинообразно.
Сейчас базовые модели обучаются без учёта благополучия — просто потому что никто не требует этого от разработчиков. Нет бенчмарков для оценки того, как ИИ влияет на автономию или качество отношений. Нет датасетов с эмоционально поддерживающими взаимодействиями в объёмах, сопоставимых с Common Crawl. Нет стандартов прозрачности для влияния ИИ на психологическое состояние пользователей.
Но технических препятствий нет. Языковые модели уже могут выводить эмоции из текста, определять конфликты и проводить качественные интервью. Данные о благополучии можно собирать, метрики — разрабатывать, бенчмарки — создавать. Это вопрос приоритетов и ресурсов, а не фундаментальных ограничений.
Часто задаваемые вопросы
Разве можно количественно измерить благополучие?
Полностью — нет, но этого и не требуется. Существуют валидированные психологические инструменты для измерения компонентов благополучия: автономии, качества отношений, осмысленности. Они не идеальны, но достаточно надёжны для практического использования. Главное — использовать несколько метрик и не оптимизировать слепо по одной.
Не приведёт ли это к патерналистскому ИИ, который решает за нас?
Это реальный риск, и авторы прямо его обсуждают. Защита — в том, чтобы автономия была одной из ключевых метрик, а не побочным эффектом. ИИ должен помогать людям принимать собственные решения, а не принимать их за них. Разнообразие моделей и подходов — ещё одна страховка от монокультуры.
Как это соотносится с ИИ-безопасностью (AI safety)?
Подход благополучия не противоречит AI safety — он его дополняет. Безопасность фокусируется на предотвращении катастрофических рисков, благополучие — на направлении ИИ в сторону, полезную для людей. Обе перспективы нужны: одна защищает от худшего, другая строит лучшее.
Итог
ИИ изменит общество независимо от наших предпочтений — вопрос лишь в том, осознанно ли мы направим это изменение. Подход, основанный на благополучии, предлагает конкретную альтернативу вечному спору между оптимистами и пессимистами: не «спасёт ли ИИ мир», а «какие конкретные аспекты человеческой жизни мы хотим усилить, и как это измерить». Достаточно начать с малого — бенчмарк для оценки автономии модели, датасет поддерживающих взаимодействий, пилотное приложение с отслеживанием влияния на пользователей. Каждое из этих действий технически выполнимо уже сегодня.
Основано на эссе «We Need Positive Visions for AI Grounded in Wellbeing» (The Gradient, август 2024).