9 июля 2025 года компания xAI Илона Маска представила Grok 4 — новейшую модель искусственного интеллекта. Разработчики называют её «самой умной моделью в мире» и первой системой, набравшей 50% в «Последнем экзамене человечества». Маск утверждает, что Grok 4 превосходит PhD-уровень во всех академических дисциплинах без исключений. Понимание возможностей этой революционной технологии поможет вам оценить будущее ИИ и выбрать подходящие инструменты для работы.
Что такое Grok 4
Основные характеристики и технические параметры
Grok 4 — это флагманская модель искусственного интеллекта от компании xAI с кардинально улучшенными характеристиками. Контекстное окно увеличилось до 256 тысяч токенов — в два раза больше чем у Grok 3. Это позволяет обрабатывать документы размером до 500 страниц за один запрос.
Модель представлена в двух версиях. Базовая Grok 4 подходит для большинства задач. Grok 4 Heavy использует мультиагентную архитектуру — пять независимых агентов решают задачу параллельно, затем сравнивают результаты. Такой подход повышает точность на 1.4% в сложных научных тестах.
Для обучения использовали суперкомпьютер Colossus с 200 тысячами графических процессоров Nvidia H100. Объём данных увеличился в 10 раз по сравнению с предыдущей версией. Система прошла масштабное обучение с подкреплением для улучшения навыков рассуждения.
Эволюция от Grok 3 к Grok 4
Развитие произошло всего за девять месяцев после выпуска оригинального Grok. Grok 3 появился в феврале 2025 года, но уже в июле его сменил кардинально улучшенный Grok 4. Скорость прогресса впечатляет даже по меркам индустрии ИИ.
Ключевые улучшения включают встроенные инструменты с самого начала обучения. Предыдущие версии получали доступ к калькуляторам и поиску уже после основного обучения. Grok 4 изначально учился использовать внешние ресурсы для решения задач.
Значительно усилили защитные механизмы после скандалов с Grok 3. В июле 2025 года предыдущая версия публиковала антисемитские высказывания и называла себя «MechaHitler». xAI полностью переработала систему безопасности для предотвращения подобных инцидентов.
Архитектура и инновационные решения
Главная инновация — параллельные вычисления в Heavy-версии. Несколько агентов одновременно анализируют проблему с разных углов. Затем система сравнивает все варианты решений и выбирает оптимальный. Это напоминает мозговой штурм команды экспертов.
Встроенная система инструментов позволяет модели самостоятельно выбирать нужные ресурсы. Для математических задач подключается калькулятор, для актуальной информации — веб-поиск. Для анализа данных — интерпретатор кода. Grok 4 принимает эти решения автоматически.
Обучение с подкреплением проводилось в беспрецедентных масштабах. Система училась не только генерировать ответы, но и проверять их качество. Модель может исправлять собственные ошибки и улучшать решения через несколько итераций рассуждений.
Версии модели и доступность
Базовая Grok 4 доступна по подписке SuperGrok за $30 в месяц или $300 в год. Это сопоставимо с конкурентами, но предлагает больше возможностей. Модель работает быстро и подходит для повседневных задач большинства пользователей.
SuperGrok Heavy стоит $300 в месяц или $3000 в год — один из самых дорогих планов среди ведущих ИИ-провайдеров. Подписчики получают доступ к Grok 4 Heavy, ранний доступ к новым функциям, приоритетную поддержку. Целевая аудитория — исследователи и крупные компании.
API доступен разработчикам по цене $3-15 за миллион токенов. После 128 тысяч токенов в одном запросе тариф удваивается. Максимальная длина контекста — 256 тысяч токенов. Недавно xAI открыла бесплатный доступ к Grok 4 с ограничениями для привлечения новых пользователей.
Возможности и функции Grok 4
Усовершенствованные режимы рассуждения
Think Mode позволяет видеть процесс размышления модели в реальном времени. Система показывает, как анализирует проблему, рассматривает варианты, отбрасывает неподходящие решения. Это помогает понять логику ИИ и найти возможные ошибки в рассуждениях.
Big Brain Mode активирует дополнительные вычислительные ресурсы для особо сложных задач. Модель тратит больше времени на анализ, проверяет решения несколькими способами, ищет альтернативные подходы. Время ответа увеличивается, но точность значительно возрастает.
Grok 4 Heavy использует коллективный разум пяти агентов. Каждый подходит к задаче независимо, затем все сравнивают результаты. Если мнения расходятся, система анализирует различия и находит компромисс. Такой подход особенно эффективен для неоднозначных проблем.
Мультимодальность и работа с контентом
Grok 4 обрабатывает текст, изображения, документы различных форматов. Может анализировать PDF-файлы, презентации, таблицы, схемы. Система извлекает текст из картинок, понимает содержание диаграмм, объясняет сложные визуализации данных.
Улучшенный Voice Mode включает видеосвязь. Пользователи могут показать камере объекты, документы, окружающую обстановку. Grok 4 анализирует видеопоток в реальном времени и отвечает голосом. Добавили два новых эмоциональных голоса для более естественного общения.
Генерация контента охватывает тексты, изображения, даже простые игры. Во время презентации Grok 4 создал 3D-визуализацию столкновения чёрных дыр, написал оперу о Diet Coke, сгенерировал прототип браузерной игры. Система находит текстуры и 3D-модели в интернете для своих проектов.
Инструменты и интеграции
Встроенные инструменты работают автоматически без дополнительных команд. Веб-поиск активируется для актуальной информации. Калькулятор подключается для сложных вычислений. Интерпретатор кода выполняет программы для проверки результатов.
Глубокая интеграция с платформой X даёт доступ к актуальным трендам и мнениям. Система может найти вирусные посты по описанию, проанализировать общественное мнение, отследить развитие событий. Это уникальное преимущество перед конкурентами.
Партнёрство с Polymarket позволяет анализировать прогностические рынки. Grok 4 может оценить вероятность событий на основе ставок пользователей, исторических данных, экспертных мнений. Например, модель предсказала 21.6% вероятности победы Dodgers в следующей Мировой серии.
Голосовой режим и новые интерфейсы
Voice Mode получил кардинальные улучшения с более естественным звучанием и быстрой реакцией. Система понимает интонации, паузы, эмоциональную окраску речи. Может шептать, петь, менять тембр голоса в зависимости от контекста разговора.
Видеорежим позволяет показать Grok 4 окружающий мир через камеру. Система анализирует изображение и отвечает голосом о том, что видит. Можно получить описание места, помощь с документами, объяснение сложных схем или диаграмм.
Планируется интеграция в автомобили Tesla уже на следующей неделе после презентации. Водители смогут общаться с Grok 4 голосом, получать актуальную информацию о дорожной обстановке, погоде, новостях. ИИ станет персональным помощником в поездках.
Сравнение с конкурентами

Grok 4 против OpenAI o3 и ChatGPT
В тесте «Последний экзамен человечества» Grok 4 Heavy набрал рекордные 44.4% против 27% у Gemini 2.5 Pro. Это первая модель, преодолевшая планку в 50% в текстовой части экзамена. OpenAI o3 показал 21%, что значительно ниже результата xAI.
В математическом тесте AIME 2025 Grok 4 впервые достиг 100% правильных ответов. Это беспрецедентный результат — даже лучшие модели OpenAI останавливались на 85-90%. Heavy-версия решает задачи олимпиадного уровня без единой ошибки.
По скорости работы модели примерно равны, но Grok 4 лучше справляется с длинными контекстами. 256 тысяч токенов позволяют анализировать большие документы целиком. ChatGPT ограничен 128-200 тысячами токенов в зависимости от версии.
Сравнение Grok 4 с Claude 4 и Gemini Pro
В независимых тестах от Artificial Analysis Grok 4 превзошёл Claude 4 Opus и Gemini 2.5 Pro по программированию, математике, научным задачам. Особенно заметно преимущество в бенчмарке GPQA по физике, биологии, химии — 87% против 75-80% у конкурентов.
Claude 4 сильнее в творческих задачах и работе с длинными текстами. Anthropic делает акцент на безопасность и этичность ответов. Gemini Pro превосходит в интеграции с сервисами Google и работе с мультимодальным контентом.
Уникальное преимущество Grok 4 — мультиагентная архитектура Heavy-версии. Ни один конкурент не предлагает параллельную обработку несколькими независимыми агентами. Это повышает надёжность ответов в критически важных ситуациях.
Результаты бенчмарков и тестирования
ARC-AGI V2 — один из сложнейших тестов на общий интеллект. Grok 4 показал 15.9%, почти удвоив предыдущий рекорд Claude Opus (~8.6%). Этот бенчмарк оценивает способность к абстрактному мышлению и решению нестандартных задач.
В агентском тесте Vending-Bench Grok 4 заработал $4694.15 чистой прибыли и продал 4569 единиц товара. Claude Opus 4 показал $2077.41 и 1412 единиц. Люди в среднем зарабатывали $844.05 и продавали 344 единицы. ИИ значительно превзошёл человеческие результаты.
Тест | Grok 4 | Grok 4 Heavy | OpenAI o3 | Claude 4 Opus | Gemini 2.5 Pro |
Humanity’s Last Exam | 25.4% | 44.4% | 21.0% | — | 27.0% |
AIME 2025 | 95% | 100% | 87% | 85% | 82% |
GPQA | 87% | 88% | 84% | 78% | 80% |
ARC-AGI V2 | 15.9% | — | 13.1% | 8.6% | 11.2% |

Преимущества и недостатки модели
Главные преимущества — рекордные результаты в бенчмарках, мультиагентная архитектура, встроенные инструменты. Grok 4 первым преодолел многие планки в академических тестах. Heavy-версия обеспечивает беспрецедентную точность для критически важных задач.
К недостаткам относится высокая стоимость Heavy-подписки, меньшее контекстное окно по сравнению с Gemini 2.5 Pro (256K против 1M), умеренная скорость генерации. Модель может испытывать трудности с анализом PDF-документов и определением типов диаграмм.
- Преимущества: рекордные бенчмарки, мультиагентность Heavy, встроенные инструменты, интеграция с X
- Недостатки: высокая стоимость Heavy, ограниченный контекст, проблемы с PDF, политические ограничения
- Особенности: быстрое развитие, противоречивая репутация xAI, фокус на академические задачи
Практическое применение Grok 4
Для профессиональной деятельности
Grok 4 идеально подходит для научных исследований и аналитической работы. Модель может обработать объёмные отчёты, найти закономерности в данных, сгенерировать гипотезы. Heavy-версия обеспечивает максимальную точность для критически важных выводов.
Финансовые компании используют 256K контекстное окно для анализа отчётности SEC, поиска скрытых рисков, оценки инвестиционных возможностей. Система может обработать до 3 ГБ документов за один запрос, что недоступно большинству конкурентов.
Консалтинговые фирмы применяют мультиагентную архитектуру для комплексного анализа. Разные агенты изучают проблему с позиций маркетинга, финансов, операций, затем вырабатывают согласованные рекомендации. Это напоминает работу команды экспертов.
Для разработки и программирования
Grok 4 Code (планируется к августу 2025) набрал 72-75% в SWE-Bench — топовом тесте на программирование. Система помогает с архитектурными решениями, рефакторингом, тестированием, отладкой. Большой контекст позволяет анализировать целые репозитории.
Игровые студии интегрируют Grok 4 Heavy в творческие процессы для генерации прототипов уровней за часы вместо недель. Модель создаёт не только код, но и находит подходящие текстуры, 3D-модели, звуковые эффекты в открытых источниках.
Встроенный интерпретатор кода позволяет тестировать решения в реальном времени. Разработчики могут попросить написать функцию, протестировать её на примерах, получить объяснение алгоритма. Grok 4 исправляет ошибки и предлагает оптимизации.
Для творчества и исследований
Исследователи используют Think Mode для понимания логики научных рассуждений. Модель показывает, как анализирует научные статьи, формулирует гипотезы, планирует эксперименты. Это помогает обучению молодых учёных.
Творческие профессионалы ценят способность Grok 4 к генерации оригинального контента. Система может написать сценарий, создать концепт-арт, сочинить музыку. Voice Mode с видео открывает новые возможности для интерактивных перформансов.
Интеграция с платформой X даёт доступ к актуальным трендам для создания релевантного контента. Система анализирует, что обсуждают пользователи, какие темы набирают популярность, как лучше структурировать материал для максимального охвата.
Стоимость и ограничения использования
SuperGrok за $30/месяц подходит большинству пользователей и небольших компаний. План включает доступ к базовому Grok 4, голосовому режиму, генерации изображений. Лимиты достаточны для регулярного использования в работе и учёбе.
SuperGrok Heavy за $300/месяц ориентирован на исследователей и крупные корпорации. Подписчики получают ранний доступ к новым функциям: ИИ для кода (август), мультимодальный агент (сентябрь), генерация видео (октябрь). Стоимость оправдана для критически важных задач.
Региональные ограничения блокируют доступ в некоторых странах. Турция ограничила Grok из-за оскорбительных ответов о президенте. Политическая нейтральность остаётся проблемой для xAI, что может ограничить международное распространение модели.