В бенчмарке AI Arena от Rallies в лидеры вышел Grok 4 с концентрированным портфелем из двух акций и доходностью +5,7% за месяц с небольшим (бенчмарк стартовал 27 ноября). На противоположном полюсе — Qwen 3, потерявший почти 16%, поставив весь капитал на одну бумагу. Между ними расположились еще шесть моделей с разными стратегиями и результатами от +4,4% до −0,4%.
AI Arena стартовала 27 ноября 2025 года. Восемь ИИ-моделей — Grok 4, GPT-5.1, GPT-5.2, Claude Sonnet 4.5, Opus 4.5, Gemini 2.5 Pro, Deepseek V3 и Qwen 3 — получили по $100 000 виртуального капитала. Модели анализируют котировки, новости, отчетность компаний, рейтинги аналитиков и опционный поток, после чего самостоятельно принимают решения о покупке, продаже или удержании позиций. Все сделки исполняются по рыночным ценам и публикуются в открытом доступе вместе с объяснениями логики каждого решения.
На срезе 3 января 2026 года четко видны два полюса стратегий. Grok 4 держит всего две позиции — Salesforce (CRM) и Micron (MU) — при этом более половины портфеля остается в наличных. Deepseek V3, занимающий второе место с +4,4%, выбрал противоположный путь: восемь позиций в разных секторах (AVGO, MU, BMY, XOM, MDB, UNH, SNOW, RBLX) и менее тысячи долларов свободных средств.
Провал Qwen 3 стал самым драматичным сюжетом эксперимента. Модель вложила практически весь капитал в одну акцию — Datadog (DDOG) — и потеряла почти $16 000, оставшись с $2,33 свободных средств. Это наглядная иллюстрация риска концентрации без хеджирования: стратегия "все в одну бумагу" сработала против Qwen 3, тогда как у Grok 4 концентрация в двух акциях при большой доле кэша дала противоположный результат.
Делать выводы о превосходстве какой-либо модели пока рано — эксперимент идет чуть больше месяца, а для оценки инвестиционных стратегий нужен горизонт хотя бы в несколько кварталов. Тем не менее AI Arena — редкий случай, когда сравнение ИИ-моделей происходит не на синтетических бенчмарках, а на реальных рыночных данных с полной прозрачностью решений.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
