Как изучать AI в 2025: дорожная карта для начинающих

Как изучать AI в 2025: дорожная карта для начинающих

Есть одна мысль, которая снимает всё напряжение вокруг изучения AI. Звучит она так: не нужно знать всё. Нужно знать ровно столько, чтобы решать свои задачи — и всё. Если вы смотрите это видео, вы уже приняли правильное решение. Вопрос не в том, «быть или не быть с AI», а в том, как начать так, чтобы не утонуть в потоке новостей, моделей и «революционных» обновлений. Расскажу, как устроена эта дорожная карта.

Три пути: какой ваш

Большинство людей, которые хотят освоить AI, делятся на три группы. Первый путь — рядовой исследователь. Вы не строите сложных систем. Вам нужно упростить жизнь: summarize документы, писать понятные письма, готовить презентации, систематизировать заметки. Типичный пример: учитель составляет планы уроков с помощью ChatGPT, адаптируя их под разные уровни учеников. Или студент загружает лекции в NotebookLM и получает структурированную выжимку перед экзаменом. Это путь экономии времени и снижения стресса.

Второй путь — продвинутый пользователь. Вы хотите делать больше и быстрее. Создаёте контент, генерируете идеи, решаете сложные задачи. Пример стека: Perplexity для исследования, ChatGPT для написания текстов, Midjourney для визуалов, Runway для видео, Sunno для музыки, Descript для монтажа и нотификация в Telegram через Make. Комбинирование инструментов даёт мультипликативный эффект — то, что занимало дни, делается за часы.

Третий путь — строитель. Вы хотите автоматизировать процессы, создавать собственные инструменты и масштабировать часть бизнеса. Инструменты вроде n8n, Make и Cursor позволяют собирать агентов, которые обрабатывают заявки, генерируют лиды или экономят команде часы ежедневной рутины. И всё это — без строчки кода.

Переход между путями проще, чем кажется. Исследователь через пару недель может стать строителем первого агента. Эти границы размыты, и на каждом этапе вы получаете навыки, которые пригодятся дальше.

Базовые понятия: что на самом деле стоит за всеми этими терминами

Перед тем как погружаться в инструменты, полезно понимать три уровня абстракции. Artificial Intelligence — широкий термин для софта, который имитирует человеческий интеллект: обучение, рассуждение, решение задач. Machine Learning — подраздел, где системы учатся на паттернах в данных и улучшаются без явного программирования. Deep learning — дальше, это нейросети с несколькими слоями. А generative AI — отдельный класс, который создаёт новый контент: текст, картинки, видео, музыку. Именно о нём и пойдёт речь.

Из конкретных терминов, которые постоянно всплывают: LLM (Large Language Model) — большая языковая модель, нейросеть, обученная на огромных объёмах текста. Prompt — инструкция, которую вы даёте модели. token — фрагмент текста, обычно несколько символов. Модели обрабатывают и генерируют текст токенами, не словами, и понимание этого помогает при работе с лимитами и ценами. Hhallucination — ситуация, когда модель уверенно выдаёт выдумку за факт. Это происходит регулярно, поэтому важно перепроверять критически важные результаты. RAG (Retrieval Augmented Generation) — подход, когда модель сначала ищет релевантные данные, а потом отвечает на их основе, а не только из своих обучающих данных.

LLM — ваш главный инструмент

В большинстве случаев решение — это большая языковая модель. И неважно, какой именно вы пользуетесь: ChatGPT, Claude, Gemini, Grok или что-то ещё. Все они работают на основе схожих концепций, и prompt engineering — умение формулировать запросы — одинаково применимо везде. Выбирайте тот интерфейс, который удобнее, и не гонитесь за каждым новым релизом. Модели догоняют друг друга в течение месяца.

Конкретные сценарии использования: загрузить ссылку и получить краткое изложение статьи, скормить черновик и попросить сохранить ваш голос, загрузить PDF на 50 страниц и получить структурированную выжимку, решать сложные математические задачи, мозговой штурм, автоматизация написания. Если хотите глубже разобраться в возможностях ChatGPT — у автора видео есть отдельный материал.

Исследование: Perplexity и Notebook LM

Следующая категория — AI-поисковики. Они построены на LLM, но дают реальные источники и возможность работать с вашими данными. Perplexity — это AI-powered поисковик, который использует RAG и даёт ответы с привязкой к конкретным источникам. В отличие от ChatGPT, он сразу ищет в интернете и цитирует.

Notebook LM — вероятно, самый мощный «второй мозг» на данный момент. Вы загружаете свои материалы: заметки, PDF, статьи, видео с YouTube — и он помогает вам работать с ними. Можно задавать вопросы по вашей базе знаний, получать изложения и находить связи между документами. Для студентов, стратегов и исследователей это серьёзный апгрейд в обработке информации.

Изображения, видео, аудио: что умеет генерация

Генерация изображений достигла уровня, когда по одному текстовому описанию создаются гиперреалистичные сцены, графика для брендов, иллюстрации и даже редактируемый текст. Большинство моделей используют диффузионный подход: начинают с шума и постепенно убирают его, формируя картинку по вашему промпту. Midjourney остаётся лидером по реализму и эстетике. Ideogram сильна в графическом дизайне и тексте внутри изображений — логотипы, постеры, UI-макеты. DALL-E и Imagen интегрированы в ChatGPT и Gemini, что делает их удобными для итеративной работы: сгенерировали картинку, попросили изменить деталь, убрали фон, добавили элемент.

Видеогенерация — одна из самых быстро развивающихся областей. Недавно Google представил Veo 3, который создаёт полноценные сцены с синхронизированным видео, диалогом, звуковыми эффектами и эмоциями из одного промпта. Kling от Haouva довёл физику до невероятного уровня — сложные движения, которые казались невозможными ещё несколько месяцев назад. Есть два основных подхода: text-to-video (описание → видео) и image-to-video (начальный и/или конечный кадр → анимированное видео). Второй подход даёт больше контроля над эстетикой.

В аудио главных направлений три. Text-to-speech — генерация голоса, где лидером остаётся ElevenLabs. Можно клонировать свой голос, создавать кастомные с разными акцентами и тонами. Music generation — Suno и Udio позволяют генерировать полноценные многод инструментальные песни со словами из текстового описания. Voice input — возможность говорить с AI в реальном времени и получать естественные голосовые ответы. Это уже работает в ChatGPT и Gemini.

Промпт-инжиниринг: единственный навык, который работает везде

Промпт-инжиниринг — это не магия и не хак. Это умение разбивать задачу на части и давать модели чёткие инструкции. Четыре базовых принципа. Один запрос — одна задача. Не пытайтесь дать LLM огромный многошаговый запрос разом — результат развалится. Разбейте на чёткие шаги и используйте правильные инструменты для каждого. Контекст решает. Чем больше релевантного контекста вы дадите, тем точнее ответ. Это может быть документ, пример, описание формата.

Few-shot prompting — дайте модели пару примеров того, какой результат вы хотите. Не объясняйте правила словами — покажите образец. Chain of Thought — попросите модель рассуждать вслух, прежде чем дать ответ. Это радикально улучшает качество на сложных задачах. Модель допускает меньше ошибок, если показывает ход рассуждений.

Отдельно стоит сказать про creative remixing — навык комбинирования инструментов неожиданным образом. Иногда вы начинаете с одной целью, получаете интересный результат и решаете двигаться в другом направлении. Это нормально. Особенно с генеративными инструментами, где результат непредсказуем, но иногда AI оказывается лучшим судьёй того, что работает, чем ваш изначальный план.

Автоматизации и агенты: в чём разница

Как только вы научились работать с отдельными инструментами и связывать их друг с другом, пора автоматизировать. Автоматизации — это последовательные шаги A → B → C. Фиксированный путь, даже если он сложный и с ветвлениями. Агенты — динамические. Они могут рассуждать, принимать решения и выбирать действия на основе контекста. Для работы агенту нужны три компонента: мозг (LLM), память (чтобы сохранять контекст между взаимодействиями) и инструменты (действия: отправка сообщений, обновление документов, вызов API).

Практический способ начать — собрать AI-ассистента для личных задач. Начните с простого: агент, который читает ваш календарь и даёт краткое резюме дня, приоритизируя дела. Потом добавьте возможность переносить события. Затем — читать и summarize письма. Постепенно — отправлять ответы. Потом подключите доступ к вашим SOP или базе знаний в Notion. И всё через простой чат, хоть в Telegram. Такой подход позволяет перехватывать ошибки на каждом шаге и безопасно экспериментировать, прежде чем автоматизировать что-то в бизнесе.

Кстати, вы, возможно, уже пользуетесь агентами: ChatGPT Deep Research, Perplexity или Gemini с аналогичным режимом — это готовые агенты. Вы даёте исследовательскую задачу, а они планируют подход, ищут в нескольких источниках, находят пробелы, корректируют стратегию и выдают структурированный отчёт.

Vibe coding: как создавать софт без кода

Последний тренд — vibe coding. Вы описываете, что хотите, на естественном языке. AI генерирует код или базовую структуру приложения. Вы тестируете. Смотрите, что работает, а что нет. Описываете правки. AI обновляет. И так до работающего прототипа. Получается proof of concept или MVP без строчки кода.

Инструменты для этого: Windsurf — строит простые приложения с готовым интерфейсом, без кода, лучше всего для MVP и внутренних инструментов. Lovable — заточен под небольшие команды и продукты, быстрое создание AI-продуктов с фокусом на UX. Replit — позволяет собирать и тестировать приложения целиком в браузере, хорош для быстрого прототипирования. Cursor — самый мощный вариант, это IDE с AI, если вы уже знаете код или хотите научиться.

Почему это важно: создание софта стало доступнее, чем когда-либо. Если вы строите что-то для себя или тестируете идею — часто быстрее и приятнее, чем традиционная разработка. По мере улучшения инструментов больше людей смогут заменить платные SaaS-решения персонализированными версиями, собранными из промптов.

План действий: с чего начать прямо сейчас

Пять шагов. Первый: определите главную боль в вашей работе или жизни — что вызывает больше всего стресса или прокрастинации, что забирает больше всего времени. Второй: опишите, как могло бы выглядеть решение, даже если оно сырое и неполное. Третий: найдите инструменты, которые помогут, и попросите ChatGPT подсказать, с чего начать. Часто решением будет LLM, но теперь у вас есть карта категорий. Четвёртый: итерируйтесь — возможно, нужно разбить задачу на подзадачи, возможно, потребуется пара промптов. Не нужно сразу делать идеально. Пятый: пробуйте новое внутри уже знакомых инструментов. Если вы используете ChatGPT — попробуйте создать проект, сгенерировать картинку, сделать mind map, проанализировать документ. У него возможностей больше, чем кажется.

В параллели с этим — просто экспериментируйте с Perplexity и NotebookLM. Бесплатные версии дают много. Когда освоите отдельные инструменты — комбинируйте их. Соберите простой workflow из двух-трёх. Потом автоматизируйте что-то базовое и повторяющееся. Первый автоматизированный процесс снимает психологический барьер, и дальше возможности становятся очевидны.

Часто задаваемые вопросы

Мне нужно учиться программировать, чтобы пользоваться AI?

Нет. Подавляющее большинство современных AI-инструментов созданы для нетехнических пользователей. Если вы готовы учиться и экспериментировать — этого достаточно. В этом видео специально ноль строк кода.

Как не отстать от потока новостей про AI?

Не пытайтесь. Если вы не создаёте AI-контент профессионально, нет причины читать каждую новость. Подпишитесь на одну-две хорошие рассылки и читайте только их. Этого достаточно, чтобы видеть реальные тренды, а не шум.

Какой путь выбрать первым?

Тот, который ближе всего к вашей текущей работе. Исследователь, продвинутый пользователь или строитель — все три дают навыки, которые усиливают друг друга. Начните с одного болевого точки и решайте его. Остальное приложится.

Итог

Не нужно осваивать все 10 000 AI-инструментов. Нужно три-пять проверенных, которые закрывают ваши задачи, и понимание базовых принципов: как писать промпты, как комбинировать инструменты, как автоматизировать рутину. Модели будут меняться, фундаментальные навыки — нет. Даже если вы примените малую часть из этого — вы уже впереди 99% людей, которые просто думают «а надо ли мне это». Начните с боли, найдите инструмент, итерируйтесь. Дорожная карта работает.

← Все записи
← Все записи