Grok 4 лидирует в бенчмарке по торговле акциями: +5,7% за пять недель

В бенчмарке AI Arena от Rallies в лидеры вышел Grok 4 с концентрированным портфелем из двух акций и доходностью +5,7% за месяц с небольшим (бенчмарк стартовал 27 ноября). На противоположном полюсе — Qwen 3, потерявший почти 16%, поставив весь капитал на одну бумагу. Между ними расположились еще шесть моделей с разными стратегиями и результатами от +4,4% до −0,4%.

AI Arena стартовала 27 ноября 2025 года. Восемь ИИ-моделей — Grok 4, GPT-5.1, GPT-5.2, Claude Sonnet 4.5, Opus 4.5, Gemini 2.5 Pro, Deepseek V3 и Qwen 3 — получили по $100 000 виртуального капитала. Модели анализируют котировки, новости, отчетность компаний, рейтинги аналитиков и опционный поток, после чего самостоятельно принимают решения о покупке, продаже или удержании позиций. Все сделки исполняются по рыночным ценам и публикуются в открытом доступе вместе с объяснениями логики каждого решения.

На срезе 3 января 2026 года четко видны два полюса стратегий. Grok 4 держит всего две позиции — Salesforce (CRM) и Micron (MU) — при этом более половины портфеля остается в наличных. Deepseek V3, занимающий второе место с +4,4%, выбрал противоположный путь: восемь позиций в разных секторах (AVGO, MU, BMY, XOM, MDB, UNH, SNOW, RBLX) и менее тысячи долларов свободных средств.

Провал Qwen 3 стал самым драматичным сюжетом эксперимента. Модель вложила практически весь капитал в одну акцию — Datadog (DDOG) — и потеряла почти $16 000, оставшись с $2,33 свободных средств. Это наглядная иллюстрация риска концентрации без хеджирования: стратегия "все в одну бумагу" сработала против Qwen 3, тогда как у Grok 4 концентрация в двух акциях при большой доле кэша дала противоположный результат.

Делать выводы о превосходстве какой-либо модели пока рано — эксперимент идет чуть больше месяца, а для оценки инвестиционных стратегий нужен горизонт хотя бы в несколько кварталов. Тем не менее AI Arena — редкий случай, когда сравнение ИИ-моделей происходит не на синтетических бенчмарках, а на реальных рыночных данных с полной прозрачностью решений.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

---
2026-01-03

Что такое Grok

Регистрация Grok в России

Claude Sonnet 4.6: обзор, бенчмарки, сравнение

Отравление данных: бэкдоры в датасетах, поисковой выдаче и инструментах ИИ — и как защищаться

Галлюцинации недели: Gemini 3.1 Pro, Sonnet 4.6 в бою и новый дом llama.cpp

Маск проиграл OpenAI в суде — но главное дело на $134,5 млрд еще впереди

«Украли у воров»: Маск высмеял Anthropic за обвинения в адрес DeepSeek, Moonshot AI и MiniMax

Как оживить фото нейросетью бесплатно и без регистрации? Нормально никак, но пойдем варианты

Топ-6 бесплатных AI-сервисов для генерации 3D-моделей

Иск на $134 миллиарда: как ChatGPT теряет пользователей, пока Google и Илон Маск захватывают трон

Внимание!

Официальный сайт бота по ссылке ниже.

Официальный сайт

Кому принадлежит Grok?
Как работает Grok?
Является ли Grok точным?
Может ли Grok помочь с конкретными задачами или вопросами?
Является ли Grok бесплатным сервисом?
Можно ли использовать Grok на мобильных устройствах?
Доступен ли Grok на разных языках?
Как начать работу с Grok?

Обновления new

Что такое Grok ^2025-08-31
Grok — это нейросеть, созданная компанией xAI Илона Маска. Её можно назвать прямым конкурентом ChatGPT от OpenAI.

Войти в Grok ^2025-08-31
Появление революционного искусственного интеллекта, способного коренным образом изменить наше настоящее и сформировать контуры будущего. Grok от xAI

Регистрация Grok в России ^2025-08-31
Grok — это современная нейросеть от компании xAI (Илона Маска), которая отличается прямым, иногда провокационным и юмористическим стилем общения. В