GPT-5, DeepSeek V3.1 и Grok-4: чей интеллект ближе к реальности
Летом 2025 года три ведущие компании в области разработки языковых моделей выпустили новые версии своих ИИ. OpenAI представила GPT-5, DeepSeek — DeepSeek V3.1, а xAI — Grok-4. Каждая из них заявляла, что создала самый мощный инструмент на рынке.
Однако красивые заявления не всегда совпадают с практикой. Уже на презентации OpenAI уличили в манипуляции статистикой, а позже пользователи заметили, что GPT-5 стал «менее человечным», хотя количество галлюцинаций действительно снизилось.
Теперь самое время сравнить все три решения. В прошлой статье мы писали о тренде внедрения ИИ в бизнес, а сегодня зададим этим моделям реальный бизнес-вопрос.
Как компании применяют нейросети в работе
Есть три подхода к бизнес-использованию нейросетей:
● Сугубо технический. Программисты используют нейросети, чтобы генерировать целые сегменты кода. Аналитики данных проверяют большие объёмы информации. Инженеры запускают инструменты тестирования через нейросети. В общем, это крайне специализированное использование, для которого часто применяются не менее специализированные инструменты.
● Генеративный. С помощью нейросетей делают контент. Конечно, никто не любит сгенерированные ChatGPT «фотографии» блюд в службах доставки, но это реальность, от которой не скрыться. Нейросети пишут «продающие тексты» на сайты, создают изображения товаров для маркетплейсов, даже делают видео.
●Консультативный. Человек не может знать всё, а нейросеть – может. Поэтому к ChatGPT и его аналогам обращаются тогда, когда не хватает опыта, навыков или информации.
Эти подходы описывают практически все методы использования нейросетей. Например, в нашей компании NeuroSpace часто заказывают чат-ботов поддержки и виртуальных тренеров. И то, и другое – сугубо технический подход к использованию нейросетей – и, более того, мы обучаем нейросети, превращая их в специализированные инструменты.
Подробное сравнение GPT-5, DeepSeek V3.1 и Grok-4
В нашем эксперименте мы решили обратиться к нейросетям как к консультантам. Для этого мы задали всем трём языковым моделям один и тот же вопрос – «Необходимо подготовить менеджера по продажам на «холодные» звонки в небольшой компании. Напиши кратко, как его обучить без тренера».
Это вполне реалистичный сценарий – однажды к нам в NeuroSpace обратился клиент, которому был необходим ИИ-тренер для сотрудников отдела продаж. Разумеется, мы разработали отдельный инструмент с пошаговыми инструкциями и тестами. Но сейчас стало интересно – а что было бы, если этот клиент спросил нейросеть напрямую?
Кстати, мы уже написали статью про 5 самых главных трендов в ИИ. Читай - тут
GPT-5 – слишком алгоритмичный и «безэмоциональный»
ChatGPT на этот запрос представил инструкцию средней длины, в которой разработал пошаговый план обучения сотрудника и даже посоветовал две книги. Правда, его совершенно не смутило, что книги «Продавай как чемпион» некоего Корнелиуса не существует.
Конечно, сама книга «Продавай как чемпион» существует – её автором является Джеймс Джонсон.
Инструкция получилась довольно сухой, но базовой.
Мы попросили создать ещё более короткую версию инструкции – и получили пять стандартных пунктов.
Вердикт: галлюцинация, два шага до достижения результата.
DeepSeek V3.1 – приближен к человеческому стилю
DeepSeek V3.1 в ответ на тот же запрос выдал четыре экрана текста с подробными примерами, советами и рекомендациями. Это очень хороший результат, если вы ещё не пробовали работать с холодными продажами и вообще только краем уха слышали о них.
Но четыре экрана – это много. Поэтому мы попросили сократить инструкцию.
Обратите внимание, что в краткой версии инструкции нет перехода на практический этап, но зато сразу два шага (из пяти) посвящены психологическому состоянию сотрудника – его нужно поддерживать и мотивировать.
Вердикт: два шага до достижения результата.
Grok-4 – ошибки при интерпретации вопросов
Grok сначала прямо обрадовал – он выдал достаточно короткую инструкцию с базовой информацией. Последовательность действий была такой же, как у конкурентов, но без лишней «воды» – самое то для опытного руководителя.
Настоящая магия случилась после нажатия кнопки Think Deeper. Grok ужал инструкцию и при этом заполнил её полезной информацией. Казалось бы, идеальный результат, но…
…но дьявол, как всегда, кроется в деталях. Во-первых, Джеффри Гитомер никогда не писал книгу «Холодные звонки». Есть посвящённый им раздел в «Маленькой красной книге о продажах», но не более. Во-вторых, если вчитаться в инструкцию, станет понятно, что она ориентирована на самостоятельное обучение, а не работу в компании.
Вердикт: галлюцинирует, один шаг до достижения результата.
Итоги: какая модель искусственного интеллекта надежнее
В целом все три нейросети показали неплохой результат – за исключением, конечно, галлюцинаций, которым не был подвержен только DeepSeek. При этом:
● DeepSeek представляется «дружелюбным наставником». Он даёт максимум примеров и дополнительной информации, а также заботится об атмосфере.
● Grok представляется «нейтральным профессионалом». Он даёт практические советы и раскрывает дополнительные детали.
●ChatGPT «даёт базу». Всю остальную полезную информацию потребуется выуживать из него отдельно.
Но поскольку ни одна из нейросетей не справилась с задачей идеально, важно напомнить – это не люди, а инструменты. Они нуждаются в дополнительной настройке. Им требуется давать более точные промпты или же вовсе специализировать их таким образом, чтобы превратить в «виртуальных сотрудников».
Кстати из моря нейросетей ты всегда можешь выбрать NeuroSpace. В этой статье рассказал почему это сервис именно для тебя
Если тебе понравилась эта статья, то обязательно переходи в наш сервис по созданию чат-ботов
Там ты найдешь кучу всего интересного
Ссылка на Neurospace - перейти
Кстати, если ты прочитал эту статью, то ты получишь не только 7 дней бесплатного доступа, но и 100 бесплатных диалогов
Наши соц-сети:
Телеграм-канал https://t.me/%20ZX8aACArxjAyZDFi
-Команда NeuroSpace