Только три типа ИИ-продуктов действительно работают
Самый первый продукт на основе LLM, ChatGPT, был просто возможностью поговорить с самой моделью: другими словами, чистым чат-ботом. Это по-прежнему самый популярный LLM-продукт с большим отрывом. На самом деле, учитывая количество денег, вложенных в индустрию, шокирует, сколько «новых ИИ-продуктов» — это просто чат-боты. Насколько я могу судить, существует только три типа ИИ-продуктов, которые работают в настоящее время.
О чем пойдет речь
Самый первый продукт на основе LLM, ChatGPT, был просто1 возможностью поговорить с самой моделью: другими словами, чистым чат-ботом. Это по-прежнему самый популярный LLM-продукт с большим отрывом.
На самом деле, учитывая количество денег, вложенных в индустрию, шокирует, сколько «новых ИИ-продуктов» — это просто чат-боты. Насколько я могу судить, существует только три типа ИИ-продуктов, которые работают в настоящее время.
Чат-боты
В первые пару лет бума ИИ все LLM-продукты были чат-ботами. Они брендировались по-разному — может быть, LLM знала о вашей электронной почте или статьях службы поддержки компании, — но фундаментальным продуктом была просто возможность общаться на естественном языке с LLM.
Проблема с чат-ботами в том, что лучший продукт-чат-бот — это сама модель. Основная причина, по которой пользователи хотят поговорить с LLM, является общей: они хотят задать вопросы, или получить совет, или исповедоваться в своих грехах, или сделать любое из сотни дел, которые не имеют ничего общего с вашим конкретным продуктом.
Другими словами, ваши пользователи просто будут использовать ChatGPT2. У ИИ-лабораторий есть два решающих преимущества перед вами: во-первых, они всегда будут иметь доступ к самым передовым моделям раньше вас; и во-вторых, они могут разрабатывать «обвязку» своего чат-бота одновременно с самой моделью (как Anthropic специально тренирует свои модели для использования в Claude Code, или OpenAI тренирует свои модели для использования в Codex).
Явный ролевой отыгрыш (Explicit roleplay)
Один из способов, которым ваш продукт-чат-бот может победить ChatGPT, — делать то, чего не будет делать OpenAI: например, с радостью отыгрывать ИИ-бойфренда или генерировать порнографию. В настоящее время существует очень прибыльная ниша таких продуктов, которые обычно полагаются на менее способные, но менее ограниченные open-source модели.
У этих продуктов есть проблемы, которые я обсуждал выше. Но не имеет значения, что их чат-боты менее способны, чем ChatGPT или Claude: если вы ищете сексуально откровенный ИИ-ролевой отыгрыш, а ChatGPT и Claude не будут этого делать, вы возьмете то, что сможете получить.
Я думаю, что существуют серьезные этические проблемы с этим типом продукта. Но даже с практической точки зрения, этот сегмент индустрии, скорее всего, будет съеден заживо крупными ИИ-лабораториями, поскольку они становятся более комфортными с расширением границ контента для взрослых. Grok Companions уже идет по этому пути, и Сэм Альтман сказал, что модели OpenAI будут более открыты для генерации контента для взрослых в будущем.
Чат-боты с инструментами
Есть небольшая вариация чат-ботов, которая дает модели инструменты: так что вместо простого общения с вашим календарем, вы можете попросить чат-бота забронировать встречи и так далее. Этот тип продукта обычно называют «ИИ-ассистентом».
Это не работает хорошо, потому что продвинутые пользователи могут манипулировать чат-ботом, заставляя его вызывать инструменты. Поэтому вы никогда не сможете дать чат-боту поддержки реальные полномочия поддержки, такие как «вернуть деньги этому клиенту», потому что в тот момент, когда вы это сделаете, тысячи людей немедленно найдут правильный способ взломать (jailbreak) вашего чат-бота, чтобы он дал им денег. Вы можете дать своим чат-ботам только те инструменты, которые пользователь мог бы использовать сам — в этом случае ваш чат-бот конкурирует с юзабилити вашего реального продукта и, вероятно, проиграет.
Почему ваш чат-бот проиграет? Потому что чат не является хорошим пользовательским интерфейсом. Пользователи просто не хотят печатать «эй, можешь увеличить размер шрифта для меня», когда они могли бы просто нажать «ctrl-плюс» или кликнуть одну кнопку3.
Я думаю, это тяжелый урок для инженеров. Заманчиво верить, что раз чат-боты стали в 100 раз лучше, они теперь должны быть лучшим пользовательским интерфейсом для многих задач. К сожалению, они начинали в 200 раз хуже обычного пользовательского интерфейса, так что они все еще в два раза хуже.
Дополнение (Completion)
Второй реальный ИИ-продукт на самом деле вышел раньше, чем ChatGPT: GitHub Copilot. Идея оригинального продукта Copilot (и всех его подражателей, таких как Cursor Tab) заключается в том, что быстрая LLM может действовать как умное автодополнение. Сканируя код, который вы печатаете, по мере набора, редактор кода может предлагать автодополнения, которые на самом деле пишут остальную часть функции (или файла) за вас.
Гениальность этого типа продукта в том, что пользователям никогда не приходится разговаривать с моделью. Как я сказал выше, чат — это плохой пользовательский интерфейс. Сгенерированные LLM дополнения позволяют пользователям получить доступ к мощи ИИ-моделей, не меняя никакой части их текущего рабочего процесса: они просто видят тот же вид предложений автодополнения, который их редактор уже давал им, но гораздо более мощный.
Я немного удивлен, что продукты на основе дополнения не взлетели за пределами кодинга (где они немедленно создали многомиллиардный рынок). Google Docs и Microsoft Word имеют что-то подобное. Почему вокруг этого не так много хайпа?
- Может быть, ответ в том, что люди, использующие этот продукт, не участвуют в ИИ-онлайн-пространствах и просто тихо используют продукт?
- Может быть, в обычном профессиональном письме есть что-то, что менее поддается автодополнению, чем код? Я сомневаюсь в этом, так как так много обычного профессионального письма копируется из окна ChatGPT.
- Возможно, редакторы кода уже имели автодополнение, так что пользователи были знакомы с ним. Держу пари, что автодополнение совершенно ново и сбивает с толку многих пользователей Word.
Агенты
Третий реальный ИИ-продукт — это кодинг-агент. Люди говорили об этом годами, но только в 2025 году технология, лежащая в основе кодинг-агентов, стала осуществимой (с Claude Sonnet 3.7, а позже GPT-5-Codex).
Агенты чем-то похожи на чат-ботов, в том смысле, что пользователи взаимодействуют с ними, печатая текст на естественном языке. Но они отличаются от чат-ботов тем, что вам нужно сделать это только один раз: модель принимает ваш первоначальный запрос и уходит реализовывать и тестировать все это сама.
Причина, по которой агенты работают, а чат-боты с инструментами — нет, заключается в разнице между просьбой к LLM нажать одну кнопку для вас и просьбой к LLM нажать сто кнопок в определенном порядке. Даже если каждое отдельное действие было бы проще выполнить человеку, агентные LLM теперь достаточно умны, чтобы взять на себя весь процесс.
Кодинг-агенты естественным образом подходят для ИИ-агентов по двум причинам:
- Легко проверить изменения, запустив тесты или проверив, компилируется ли код.
- ИИ-лаборатории заинтересованы в создании эффективных кодинг-моделей для ускорения собственной работы.
На мой взгляд, текущий многомиллиардный вопрос: могут ли ИИ-агенты быть полезны для задач, отличных от кодинга? Имейте в виду, что Claude Sonnet 3.74 был выпущен всего лишь чуть меньше девяти месяцев назад. За это время технологическая индустрия успешно построила агентные продукты для своей собственной работы. Они только начинают создавать агентные продукты для других задач. Еще предстоит увидеть, насколько успешным это будет, или как будут выглядеть эти продукты.
Исследования
Есть еще один вид агента, который не касается кодинга: исследовательский агент. LLM особенно хороши в таких задачах, как «просмотреть десять страниц результатов поиска» или «поиск по ключевым словам в этом гигантском наборе данных любой информации по определенной теме». Я использую эту функциональность много для самых разных вещей.
Есть несколько примеров ИИ-продуктов, построенных на этой возможности, таких как Perplexity. В крупных ИИ-лабораториях это было поглощено продуктами-чат-ботами: «глубокое исследование» (deep research) OpenAI превратилось из отдельной функции в просто то, что GPT-5-Thinking делает автоматически, например.
Я думаю, что здесь почти наверняка есть потенциал для специфических исследовательских агентов (например, в медицине или юриспруденции).
Ленты (Feeds)
Если агенты — это самый недавний успешный ИИ-продукт, то сгенерированные ИИ ленты могут быть тем, что находится прямо за горизонтом. ИИ-лаборатории в настоящее время экспериментируют со способами создания бесконечных лент персонализированного контента для своих пользователей:
- Марк Цукерберг говорил о наполнении Instagram автоматически сгенерированным контентом.
- OpenAI недавно запустила видео-генеративную ленту на основе Sora.
- OpenAI также начала подталкивать пользователей к «Pulse», персонализированному ежедневному обновлению внутри продукта ChatGPT.
- xAI работает над тем, чтобы внедрить бесконечную ленту изображений и видео в Twitter.
Пока что ни один из них не взлетел. Но скроллинг лент стал основным способом взаимодействия пользователей с технологиями в целом, так что потенциал здесь огромен. Мне вовсе не кажется маловероятным, что через пять лет большинство интернет-пользователей будут проводить большую часть своего дня, прокручивая сгенерированную ИИ ленту.
Как и продукт на основе дополнения, преимущество ленты в том, что пользователям не нужно взаимодействовать с чат-ботом. Входные данные для модели поступают из того, как пользователь взаимодействует с лентой (лайки, скорость скроллинга, время просмотра элемента и так далее). Пользователи могут испытать преимущества сгенерированной LLM ленты (если они есть), не меняя своих привычек потребления вообще.
Технология, стоящая за текущими бесконечными лентами, созданными людьми, уже является зрелым приложением современного машинного обучения. Когда вы взаимодействуете с Twitter или LinkedIn, вы взаимодействуете с моделью, за исключением того, что вместо генерации текста она генерирует списки постов других людей. Другими словами, ленты уже поддерживают сложное векторное представление (embedding) ваших личных симпатий и антипатий. Шаг от «использовать этот эмбеддинг для показа релевантного контента» до «использовать этот эмбеддинг для генерации релевантного контента» может быть действительно очень коротким.
Я довольно подозрительно отношусь к сгенерированным ИИ бесконечным лентам сгенерированного видео, но я действительно думаю, что другие виды бесконечных лент — это недостаточно изученный вид продукта. На самом деле, я создал свой собственный хобби-проект на основе ленты под названием Autodeck5. Идея заключалась в использовании сгенерированной ИИ ленты для создания карточек интервального повторения для обучения. Это работает довольно хорошо! Он все еще получает разумное количество использования от людей, которые нашли его через мой блог (а также от меня и моего партнера).
Игры
Еще один вид сгенерированного ИИ продукта, о котором люди говорят годами, — это видеоигра на основе ИИ. Наиболее спекулятивные усилия в этом направлении были полными симуляциями мира, такими как Genie от DeepMind, но люди также исследовали использование ИИ для генерации подмножества игрового контента, такого как чисто текстовые игры, как AI Dungeon, или этот мод для Skyrim, который добавляет сгенерированные ИИ диалоги. Гораздо больше разработчиков игр включили ИИ-арт или аудиоактивы в свои игры.
Может ли существовать преобразующий продукт, который включает LLM в видеоигры? Я не думаю, что ARC Raiders считается «ИИ-продуктом» только потому, что он использует ИИ-озвучку, а более амбициозные проекты еще не совсем взлетели. Почему нет?
Одна из причин может заключаться в том, что разработка игр просто занимает очень много времени. Когда Stardew Valley штурмом взяла мир в 2016 году, я ожидал потока подражателей уютных фермерских игр в пиксель-арте, но это действительно началось только в 2018 и 2019 годах. Вот сколько времени нужно, чтобы сделать игру! Так что даже если у кого-то есть действительно хорошая идея для видеоигры на основе LLM, мы, вероятно, все еще в году или двух от ее выпуска.
Другая причина в том, что многие геймеры действительно не любят ИИ. Включение генеративного ИИ в вашу игру — это гарантированная полемика (хотя, похоже, это не фатально, как показывает успех ARC Raiders). Я бы не удивился, если бы некоторые разработчики игр просто не думали, что стоит рисковать, пробуя идею игры на основе ИИ6.
Третья причина может заключаться в том, что сгенерированный контент просто плохо подходит для гейминга. Конечно, диалоги в стиле ChatGPT торчат как бельмо на глазу в большинстве видеоигр. ИИ-чат-боты также довольно плохи в том, чтобы бросать вызов пользователю: их пост-тренировка направлена на то, чтобы попытаться удовлетворить пользователя немедленно7. Тем не менее, я не думаю, что это непреодолимая техническая проблема. Вы могли бы просто пост-тренировать языковую модель в другом направлении (хотя, возможно, необходимые ресурсы для этого еще не были доступны игровым компаниям).
Итог
По моему подсчету, существует три успешных типа продуктов языковых моделей:
- Чат-боты, такие как ChatGPT, которые используются сотнями миллионов людей для огромного разнообразия задач.
- Продукты для кодинга на основе дополнения, такие как Copilot или Cursor Tab, которые очень нишевые, но позволяют получить немедленную ценность.
- Агентные продукты, такие как Claude Code, Codex, Cursor и режим Copilot Agent, которые действительно начали работать только в последние шесть месяцев.
Кроме того, есть два типа продуктов на основе LLM, которые еще не работают, но могут скоро заработать:
- Сгенерированные LLM ленты.
- Видеоигры, основанные на сгенерированном ИИ контенте.
Почти все ИИ-продукты — это просто чат-боты (например, техподдержка на базе ИИ). Они страдают от необходимости конкурировать с ChatGPT, который является превосходным общим продуктом, и невозможности использовать мощные инструменты, потому что пользователи смогут легко взломать (jailbreak) модель.
Агентные продукты новы и были дико успешны для кодинга. Еще предстоит увидеть, как они будут выглядеть в других областях, но мы почти наверняка увидим специфичных для предметной области исследовательских агентов в таких сферах, как право. Исследовательские агенты в кодинге также добились определенного успеха (например, продукты для код-ревью или автоматического сканирования безопасности).
Бесконечные сгенерированные ИИ ленты еще не были успешны, но сотни миллионов долларов в настоящее время вливаются в них. Будет ли Sora от OpenAI реальным конкурентом Twitter или Instagram, или эти компании выпустят свой собственный продукт сгенерированной ИИ ленты?
Сгенерированные ИИ игры звучат так, как будто они могут быть хорошей идеей, но все еще нет четкой работающей стратегии того, как внедрить LLM в видеоигру. Чистые модели мира — где вся игра генерируется кадр за кадром — это крутые демо, но далеки от того, чтобы быть продуктами.
Еще одна вещь, которую я не упомянул, — это генерация изображений. Является ли это частью продукта-чат-бота или инструментом само по себе? Честно говоря, я думаю, что генерация изображений ИИ все еще больше игрушка, чем продукт, но она, безусловно, видит тонну использования. Вероятно, здесь есть плодородная почва для продуктов, если они смогут успешно дифференцировать себя от встроенной генерации изображений в ChatGPT.
В целом, это ощущается как ранние дни интернета. У LLM так много потенциала, но мы все еще в основном строим копии одного и того же. Должны быть какие-то действительно простые идеи продуктов, на которые мы оглянемся и подумаем: «это так очевидно, интересно, почему они не сделали это сразу».
UPD: Этот пост получил довольно много комментариев на Hacker News. Некоторые комментаторы считают, что мои категории слишком широки, что является справедливой критикой: это как сказать, что есть только два «электрических продукта» — те, которые вращают мотор, и те, которые нагревают проволоку.
Другие комментаторы утверждают, что саммаризация (обобщение), легкий перевод и транскрипция — это продукты, которые я упустил. Я не согласен: вы сами покупали какую-нибудь программу для саммаризации, перевода или транскрипции на основе LLM? Вероятно, нет — вы просто используете чат-бота напрямую, верно? Поэтому я считаю их функциями продукта-чат-бота, а не продуктами самими по себе.
Один комментатор указывает, что может быть куча продуктов без хайпа, бурлящих под радаром. Справедливо! Я не знаю того, чего не знаю.
Footnotes
-
Конечно, «просто» здесь охватывает массу прогресса в обучении более сильных моделей и реальные инновации вокруг RLHF, которые вообще сделали возможным общение с чистыми LLM. ↩
-
Это большая причина, почему большинство ИИ-корпоративных проектов терпят неудачу. Как я слышал, многие разочарованы заказными корпоративными чат-ботами. Люди просто хотят использовать ChatGPT! ↩
-
Если вы не убеждены, возьмите любое устройство, которым вам удобно пользоваться (скажем, ваш телефон, вашу машину, вашу микроволновку), и представьте, что вам нужно печатать каждую команду. Может быть, действительно хорошее распознавание речи исправит это, но я сомневаюсь. ↩
-
Изначально у меня здесь было неправильно указано «3.5 Sonnet». Спасибо читателю за исправление. ↩
-
Я писал об этом здесь, и ссылка есть в верхней панели. ↩
-
Хотя это может быть уравновешено тем, что, я уверен, является сильным давлением со стороны руководителей, чтобы принять участие в этом и «построить что-то с ИИ». ↩
-
Если вы когда-нибудь пробовали просить ChatGPT быть мастером подземелий (DM) для вас, вы испытали это на собственном опыте: модель немедленно попытается показать вам что-то крутое, пропуская необходимую скуку, которая создает напряжение и придает правдоподобие. ↩