Почему LLM не станут следующим оракулом Уолл-стрит
Почему LLM не станут следующим оракулом Уолл-стрит
В 2023 году генеративный ИИ захватил воображение инвесторов и публики. ChatGPT показал, что языковые модели (LLM) способны улавливать структуру в последовательностях токенов и выполнять задачи от перевода до генерации текста. Неудивительно, что квантовые трейдеры тут же спросили: а можно ли научить эти же модели предсказывать цены акций и сделки? Ответ оказывается неоднозначным — и говорит он многое о том, чем финансовые ряды отличаются от человеческого языка.
Что такое LLM и почему их сравнивают с трейдингом
Большие языковые модели — это автогрессионные системы. Они предсказывают следующий токен на основе предыдущих. В квантовом трейдинге, например в статистическом арбитраже, исследователи десятилетиями ищут автогрессионную структуру в рыночных данных: последовательности новостей, заявок или фундаментальных изменений, которые предсказывают будущие цены.
Схема заманчива: вместо слов и слогов подавать модели цены и сделки, а на выходе получать прогноз. Но на практике всё ломается уже на этапе данных. Чтобы понять почему, стоит заглянуть внутрь самой природы финансовых временных рядов и сравнить их с языком на уровне информационной теории.
Почему рынок — не язык: четыре фундаментальные разницы
Первая и главная проблема — объём и информационная ёмкость данных. На конференции NeurIPS 2023 компания Hudson River Trading сравнила масштабы: GPT-3 обучался на 500 миллиардах токенов, тогда как весь фондовый рынок США генерирует примерно 177 миллиардов «токенов» в год — при условии 3000 торгуемых акций, 10 точек данных на акцию в день и 252 торговых дня. Цифры сопоставимы, но содержание кардинально отличается.
Язык имеет внутреннюю структуру — грамматику, семантику, контекст. Предсказать следующее слово в предложении человеку относительно просто, потому что язык эволюционировал для коммуникации, а коммуникация требует предсказуемости. Но попробуйте предсказать следующую доходность акции по истории сделок — и вы быстро поймёте, почему миллиардеров-дейтрейдеров так мало. На рынке работают очень умные люди, которые мгновенно «съедают» любой сигнал, делая рынок почти эффективным. Никто не пытается намеренно усложнить предсказание предложений — авторы, напротив, стремятся к ясности. Рынок же ведёт себя как активный противник, который адаптируется к вашей стратегии в реальном времени.
Вторая разница — соотношение шума и сигнала. В языковых корпусах, на которых обучаются LLM, соотношение сигнала к шуму исключительно высокое: каждое предложение несёт смысл, каждый параграф связан с предыдущим. В финансовых данных картина противоположная. Люди и институты торгуют по причинам, которые могут быть иррациональными и никак не связанными с фундаментальными изменениями бизнеса. История GameStop в 2021 году — когда розничные инвесторы через Reddit подняли акции с $20 до $483 за три недели — яркий пример того, как эмоции и социальная динамика могут полностью отключить фундаментальную составляющую. Финансовые временные ряды постоянно меняются под влиянием новой информации, регуляторных изменений и макроэкономических сдвигов. Язык эволюционирует гораздо медленнее.
Третья разница — отсутствие стационарности. В языке правила грамматики и значения слов остаются относительно стабильными годами. На рынке же корреляции между активами, волатильность и сама природа «аномалий» меняются постоянно. Стратегия, которая работала в прошлом квартале, может стать убыточной в следующем — и не потому, что кто-то «исправил баг», а потому, что другие участники рынка начали её использовать. Это явление называется «альфа-декей» — постепенное исчезновение прибыльной аномалии по мере её обнаружения конкурентами. В языковом моделировании такого нет: правила английской грамматики не меняются в ответ на то, что BERT их выучил.
Четвёртая разница — природа ошибки. Когда LLM ошибается в предсказании следующего слова, последствия минимальны: предложение звучит немного странно, но смысл обычно сохраняется. Когда торговая модель ошибается в предсказании цены, последствия измеряются в миллионах долларов. Это создаёт совершенно другую культуру разработки: в трейдинге модели проходят жёстчайшую валидацию, а live-тестирование — это не A/B тест на рекомендациях, а реальные деньги на кону. Ошибка в LLM — баг; ошибка в торговом алгоритме — банкротство.
Где LLM действительно полезны в финансах
Несмотря на скепсис в отношении прямого прогнозирования цен, идеи из мира ИИ находят применение в финансах — просто в других областях.
Мультимодальный анализ: цены плюс новости, спутники и соцсети
Одно из самых перспективных направлений — мультимодальное обучение. Вместо того чтобы полагаться только на временные ряды цен, модели комбинируют данные из разных источников: текстовые новости и корпоративные отчёты, графические взаимодействия в социальных сетях, спутниковые снимки портов для оценки товарных потоков. LLM могут извлекать сентимент из новостей, выявлять скрытые связи между отраслями и даже анализировать тон выступлений руководства компаний.
Здесь языковые модели работают не как предсказатели цен, а как мощные инструменты обработки неструктурированных данных — области, где традиционные квантовые методы historically слабы. Например, анализ тональности earnings call с помощью LLM позволяет выявлять нюансы, которые упускают простые словарные методы: ирония, эвфемизмы или намеренное уклонение от прямого ответа на неудобный вопрос аналитика.
Резидуализация: общая идея в разных мирах
Интересный параллель возникает вокруг концепции резидуализации. В финансах факторные модели разбивают доходности активов на общую составляющую (рыночную доходность или факторы) и идиосинкратическую — уникальную для конкретного актива. Общую составляющую сложно предсказать, поэтому аналитики часто «вычищают» её, чтобы сфокусироваться на специфичном сигнале.
В архитектурах нейросетей, таких как трансформеры, есть похожая идея: вместо того чтобы напрямую учить функцию h(X), сеть учит остаток h(X) − X. Если функция близка к тождественному отображению, остаток близок к нулю, и учить его проще. В обоих случаях цель одна — использовать структуру данных, чтобы сделать предсказание эффективнее.
Этот параллель интересен не только теоретически. Он подсказывает, где именно LLM могут принести пользу в квантовом трейдинге: не в предсказании абсолютных цен, а в моделировании остаточных сигналов — тех микроскопических отклонений от факторной модели, которые остаются после удаления общерыночной составляющей. Именно в этой нише, где сигнал слаб и требует обработки неструктурированного контекста, языковые модели могут оказаться конкурентным преимуществом.
Контекстные окна для многошкального анализа
Одна из сильных сторон LLM — способность удерживать контекст на длинных дистанциях. В финансах это напрямую транслируется в анализ многошкальных явлений: фундаментальная информация (отчёты о прибылях) включается в цены за месяцы, технические паттерны (моментум) реализуются за дни, а микроструктурные эффекты (дисбаланс стакана) живут секунды.
Однако есть важное отличие: в языковых моделях предсказание обычно одношаговое — следующий токен. В трейдинге же нужно предсказывать траекторию доходностей на нескольких горизонтах одновременно. Система может одновременно торговать на микроструктурном событии и на корпоративном — и для этого нужен прогноз всей терм-структуры ожидаемых доходностей, а не только следующего периода. Это требует архитектурных модификаций стандартных трансформеров: вместо одномерного выхода нужен многомерный вектор доходностей, оптимизированный под совместную торговлю на разных временных масштабах.
Синтетические данные: обучение в симуляторе
Финансовые данные дороги и редки относительно других доменов. Здесь на помощь приходит генерация синтетических данных — симулированные траектории цен, которые сохраняют статистические свойства реального рынка. Этот подход хорошо знаком из робототехники, где контроллеры сначала обучаются в дешёвых физических симуляторах, а затем калибруются на дорогих реальных экспериментах.
В финансах симуляторы позволяют грубо обучать и оптимизировать стратегии: модель усваивает высокоуровневые концепции вроде неприятия риска и диверсификации, а также тактические — например, торговлю медленно, чтобы минимизировать рыночное воздействие сделки. Затем на реальных рыночных данных происходит точная калибровка — определение оптимальной скорости исполнения.
Особенно интересно применение генеративных моделей для сэмплирования экстремальных сценариев — событий, когда стратегии испытывают максимальные прибыли или убытки. Проблема в том, что экстремальные события по определению редки, и определить правильные параметры для их генерации — задача, требующая глубокого понимания хвостов распределений. Генеративные модели, обученные на исторических кризисах (2008, 2020, 2022), могут порождать сценарии, которых не было в обучающей выборке, но которые статистически согласованы с наблюдавшимися паттернами панических продаж и ликвидностных кризисов.
Фундаментальный анализ: Чарли Мангер для каждого инвестора
Несмотря на сомнения в применимости LLM к квантовому трейдингу, фундаментальный анализ — другая история. По мере улучшения моделей становится легко представить, как они помогают аналитикам уточнять инвестиционные тезисы, выявлять противоречия в комментариях руководства компаний и находить скрытые связи между смежными отраслями. По сути, LLM могут стать «Чарли Мангером в кармане» для каждого инвестора — интеллектуальным партнёром, который задаёт неудобные вопросы и указывает на слепые зоны.
Эта область менее гламурна, чем предсказание цен, но гораздо более реалистична. Здесь модели работают с текстом — своей родной стихией — и дополняют человеческую экспертизу, а не пытаются её заменить.
Часто задаваемые вопросы
Могут ли LLM предсказывать цены акций лучше, чем классические модели?
Пока нет убедительных доказательств. Основная проблема не в архитектуре, а в данных: финансовые ряды содержат слишком много шума и слишком мало сигнала. Там, где LLM выигрывают — обработка неструктурированных данных: новостей, отчётов, социальных сигналов.
Что такое мультимодальный анализ в финансах?
Это подход, при котором модель объединяет данные разных типов: числовые временные ряды, текстовые новости, изображения спутников, аудиозаписи выступлений CEO. Цель — построить более полную картину, чем даёт анализ только цен.
Почему синтетические данные важны для трейдинга?
Реальные рыночные данные дороги и ограничены. Синтетические траектории позволяют обучать стратегии в симуляции, тестировать экстремальные сценарии и применять методы мета-обучения — перенос знаний между разными рынками и активами.
Итог
Генеративный ИИ удивил всех — исследователей, технологические компании и наблюдателей. Идея о том, что увеличение моделей приведёт к возникающим способностям, была неожиданной и до сих пор не до конца понятой. Этот успех привлёк огромный поток человеческого и финансового капитала в ИИ, что в свою очередь породит ещё более мощные модели.
Поэтому, хотя вероятность того, что GPT-4 возьмёт квантовый трейдинг штурмом, сейчас невелика, мы советуем сохранять открытый разум. Ожидать неожиданного — прибыльная стратегия не только на рынке, но и в бизнесе искусственного интеллекта. А пока самое реалистичное применение LLM в финансах — не предсказание цен, а усиление человеческого анализа: обработка неструктурированных данных, генерация гипотез и поиск слепых зон в инвестиционных тезисах.