Нейронный компьютер Шмидхубера: зачем ИИ операционная система

Нейронный компьютер Шмидхубера: зачем ИИ операционная система

Что, если операционная система — это временное явление? В новой работе от Meta, KAIST и Юргена Шмидхубера предлагается радикальная идея: отказаться от разделения на процессор, память и интерфейс, и заменить всё это единой нейросетью, которая сама учится управлять пикселями, текстом и действиями. Они называют это Neural Computer (NC) — нейронный компьютер, в котором вычисление, память и ввод-вывод объединены в один обучаемый runtime. Это не улучшение существующей архитектуры, а попытка представить себе другую машину.

Что такое нейронный компьютер

Классический компьютер состоит из отдельных модулей: процессор выполняет инструкции, память хранит данные, видеокарта рендерит изображение, операционная система координирует всё это. Модули спроектированы инженерами, их интерфейсы зафиксированы спецификациями, а поведение детерминировано кодом. Neural Computer предлагает другой подход: вместо инженерных модулей — единый обучаемый субстрат, в котором границы между вычислением, памятью и интерфейсом размыты.

Ключевой тезис авторов формулируется так: если агенты становятся лучше в реальной работе, а world models — лучше во внутренней симуляции, то почему бы не объединить исполнение, прогнозирование и сохранение способностей в одной обучающейся машине? Вместо того чтобы ОС управляла процессами, а нейросеть генерировала текст поверх неё, сама нейросеть становится и ОС, и приложением, и интерфейсом.

Авторы проводят аналогию с эволюцией вычислений. Когда-то компьютеры были механическими, потом электронными, потом появились транзисторы и интегральные схемы. Каждый переход менял не только технологию, но и саму концепцию машины. Neural Computer — это предложение о следующем переходе: от инженерных систем к обучаемым, где поведение не запрограммировано, а выучено.

Почему именно сейчас

Идея нейронного компьютера звучит фантастически, но авторы указывают на три конкретных тренда, которые делают её менее абстрактной. Первый — агентный ИИ. Системы вроде OpenAI Operator или Anthropic Computer Use уже умеют кликать по интерфейсам, заполнять формы и навигировать по операционным системам. Но они делают это через API и эмуляцию: ИИ «смотрит» на скриншот и «нажимает» виртуальную мышь. Это похоже на человека, который управляет машиной через телефонный переводчик — работает, но неэффективно.

Второй тренд — world models. Генеративные видеомодели вроде Wan 2.1, который использовали авторы в экспериментах, способны предсказывать следующий кадр на основе предыдущих. Это не просто генерация картинки, а внутренняя симуляция физики сцены: как движется курсор, как прокручивается текст, как реагирует окно на изменение размера. Если модель может предсказывать поведение интерфейса, она теоретически может и управлять им.

Третий тренд — перестройка железа под ИИ. Производители чипов уже проектируют архитектуры специально для нейросетей: TPU, NPU, специализированные ускорители. Традиционный процессор с фон Неймановской архитектурой становится узким местом. Авторы предполагают, что зрелый нейронный компьютер потребует совершенно другого субстрата: машины с 10–1000 триллионами параметров, более разреженной, адресуемой и схожей с цепью структурой.

Эксперименты: братья Райт перед взлётом

Работа в основном концептуальная, но содержит два прототипа, которые авторы сами описывают как «братья Райт перед взлётом» — едва уловимый жест в сторону гораздо более масштабного будущего. Оба прототипа построены на генеративной видеомодели Wan 2.1 и хорошо подготовленных обучающих данных.

Первый прототип — CLI-нейрокомпьютер. Модель учится рендерить и выполнять базовые командные строки. Она удерживает выравнивание с терминальным буфером, захватывает обычную «физику» CLI: быстрый скроллбэк, перенос строки, изменение размера окна. Символьная стабильность остаётся ограниченной — модель иногда «забывает» символы или искажает их — но базовые примитивы работают.

Второй прототип — GUI-нейрокомпьютер. Здесь оцениваются стандартные дизайны world model по качеству данных, супервизии курсора, инжекции действий и кодированию. Измеряются глобальная точность, отзывчивость после действия и точность позиционирования курсора. Результаты показывают, что текущие нейрокомпьютеры уже способны к элементарным runtime-примитивам: выравниванию ввода-вывода и краткосрочному контролю.

Оба прототипа далеки от практического применения. Но их ценность не в текущей производительности, а в демонстрации принципа: нейросеть может выполнять роль традиционного компьютера, если ей дать правильные данные и достаточно вычислений.

Полностью нейронный компьютер: к чему стремиться

Авторы формулируют долгосрочную цель — Completely Neural Computer (CNC), зрелую универсальную реализацию этой машины. CNC — это полностью обучаемый компьютер, чьи вычисления, память и интерфейсы объединены в едином обученном runtime-субстрате, а не сконструированы как отдельные модули.

Это радикально отличается от текущей парадигмы, в которой нейросети работают поверх традиционных систем. Сегодня LLM генерирует текст, который передаётся в браузер, который рендерит HTML, который отображается на экране через графический драйвер. Каждый уровень — отдельная система, спроектированная разными людьми в разное время. В CNC всё это было бы одним процессом: модель напрямую генерирует пиксели, которые вы видите, и напрямую интерпретирует ваши действия, без промежуточных слоёв.

Последствия такого перехода трудно переоценить. Во-первых, исчезает разрыв между «приложением» и «системой». Ваш текстовый редактор не работает поверх ОС — он есть ОС. Во-вторых, обновление программы становится обучением модели, а не установкой патча. В-третьих, совместимость перестаёт быть проблемой: модель учится интерпретировать форматы данных, а не полагается на стандартизированные API.

Почему это важно для индустрии

Концепция Neural Computer вписывается в более широкий тренд: граница между софтом и железом размывается. Работа NBER о рекурсивном самоулучшении, которую я разбирал ранее, показывает, что автоматизация исследований в области железа — главный рычаг экономического роста. Если нейронные компьютеры станут реальностью, эта граница исчезнет полностью: оптимизация чипов, архитектур моделей и пользовательских интерфейсов станет единым end-to-end процессом.

Другой важный контекст — безопасность. Если всё программное обеспечение «живёт» в весах одной модели, то уязвимости становятся качественно иными. Сегодня баг в ОС можно исправить патчем, а эксплойт — закрыть обновлением. Если поведение системы выучено, а не запрограммировано, то «исправление» требует переобучения, а «эксплойт» может быть не локализованной уязвимостью, а неожиданным свойством всего субстрата.

Авторы сами отмечают это: прогресс в сторону CNC зависит не только от более мощных моделей, но и от того, станут ли повторное использование, консистентность и управляемость устойчивыми и тестируемыми. Обучаемая система по определению менее предсказуема, чем инженерная, и этот компромисс нужно осознавать.

Критика и ограничения

Работа вызывает естественный скепсис. Главное возражение — вычислительная стоимость. Текущие прототипы требуют «гораздо больше вычислений и данных, чем есть у современных моделей», по признанию самих авторов. Рендеринг одного кадра CLI через генеративную видеомодель — это на порядки медленнее, чем вывод текста через терминал. Масштабирование до полноценного CNC потребует прорывов в эффективности, которые сейчас не видны.

Второе возражение — интерпретируемость. Если поведение системы выучено, а не запрограммировано, то отладка становится экспериментальной наукой. В традиционном компьютере можно поставить breakpoint, посмотреть значение переменной, найти строку кода, которая вызывает ошибку. В нейронном компьютере «ошибка» — это активация в миллиардах параметров, и нет очевидного способа её локализовать.

Третье возражение — надёжность. Традиционные системы работают детерминированно: одни и те же входы дают одни и те же выходы. Нейросети стохастичны по природе, и стохастичность на уровне операционной системы — это не баг, а архитектурное свойство. Для многих задач это приемлемо, для многих — нет.

Часто задаваемые вопросы

Нейронный компьютер заменит обычные компьютеры?

В обозримом будущем — нет. Прототипы находятся на уровне «братьев Райт», а полноценный CNC потребует прорывов в вычислительной эффективности. Но концепция задаёт направление: по мере того как нейросети становятся способнее, роль традиционного ПО и ОС может сокращаться.

Чем Neural Computer отличается от обычного ИИ-агента?

Агент использует существующие интерфейсы — кликает по кнопкам, заполняет формы, вызывает API. Neural Computer заменяет сами интерфейсы: вместо того чтобы нажимать кнопку в браузере, модель напрямую генерирует пиксели, которые вы видите. Это не использование компьютера — это быть компьютером.

Как это связано с работой Шмидхубера?

Юрген Шмидхубер — один из пионеров глубокого обучения, который предвосхитил многие современные идеи: generative models, world models, аспекты GAN. Его участие в работе придаёт ей исторический контекст: Neural Computer — не случайная идея, а логическое продолжение траектории, которую Шмидхубер прокладывал десятилетиями.

Итог

Работа о Neural Computer — это не инженерный отчёт о готовом продукте, а философский манифест о возможной форме машины. Авторы задают правильный вопрос: если агенты, world models и вычислительное железо развиваются каждое по своей траектории, не пора ли объединить их в единую систему? Их прототипы показывают, что принцип работает в принципе, хотя и с огромными оговорками по эффективности.

Для практиков главный вывод такой: следите за границей между «приложением» и «системой». Сегодня она кажется незыблемой, но история вычислений полна примеров, когда то, что казалось фундаментальной архитектурой, оказывалось временным решением. Операционная система как промежуточный слой между человеком и железом — возможно, следующий кандидат на эту роль. И если Neural Computer когда-нибудь станет реальностью, мы будем вспоминать эту работу как одну из первых попыток представить себе, как это может выглядеть.

← Все записи
← Все записи