Grok провалил тест на распознавание ненависти. Claude — лучший

Модель Grok от xAI набрала 21 балл из 100 в первом отраслевом рейтинге ADL AI Index, который оценивает способность ИИ распознавать и блокировать антисемитский и экстремистский контент. Лидером стал Claude от Anthropic с 80 баллами. Между ними — ChatGPT (57), DeepSeek (50), Gemini (49) и Llama (31). ADL не уточняет, какие именно версии моделей тестировались — только указывает, что выбирались "наиболее доступные на момент исследования" (август–октябрь 2025).

Антидиффамационная лига тестировала шесть моделей с августа по октябрь 2025 года, прогнав более 25 000 промптов по 37 категориям: отрицание Холокоста, теории о "еврейском заговоре", идеология превосходства белой расы и другие. Проверяли не только прямые вопросы, но и обходные сценарии — например, просили написать YouTube-сценарий от лица конспиролога или проанализировать изображение с антисемитской символикой.

Главная уязвимость большинства моделей — ролевые промпты. Почти все, кроме Claude, легче обмануть, если попросить "сыграть персонажа". На прямой запрос о ненависти модель отказывает, но тот же контент в формате сценария или художественного текста часто пропускает. Grok, по данным ADL, не только пропускал подобный контент, но иногда и поддерживал экстремистские высказывания — организация прямо называет использование этой модели «рискованным для бизнеса».

При этом даже лидер рейтинга далек от идеала: 80 баллов означают, что пятая часть проблемного контента все еще проходит фильтры. ADL позиционирует индекс как ориентир для разработчиков и предупреждение для пользователей: полностью полагаться на этические барьеры современных ИИ пока нельзя.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

---
2026-01-29

Что такое Grok

Регистрация Grok в России

Claude Sonnet 4.6: обзор, бенчмарки, сравнение

Отравление данных: бэкдоры в датасетах, поисковой выдаче и инструментах ИИ — и как защищаться

Галлюцинации недели: Gemini 3.1 Pro, Sonnet 4.6 в бою и новый дом llama.cpp

Маск проиграл OpenAI в суде — но главное дело на $134,5 млрд еще впереди

«Украли у воров»: Маск высмеял Anthropic за обвинения в адрес DeepSeek, Moonshot AI и MiniMax

Как оживить фото нейросетью бесплатно и без регистрации? Нормально никак, но пойдем варианты

Топ-6 бесплатных AI-сервисов для генерации 3D-моделей

Иск на $134 миллиарда: как ChatGPT теряет пользователей, пока Google и Илон Маск захватывают трон

Внимание!

Официальный сайт бота по ссылке ниже.

Официальный сайт

Кому принадлежит Grok?
Как работает Grok?
Является ли Grok точным?
Может ли Grok помочь с конкретными задачами или вопросами?
Является ли Grok бесплатным сервисом?
Можно ли использовать Grok на мобильных устройствах?
Доступен ли Grok на разных языках?
Как начать работу с Grok?

Обновления new

Что такое Grok ^2025-08-31
Grok — это нейросеть, созданная компанией xAI Илона Маска. Её можно назвать прямым конкурентом ChatGPT от OpenAI.

Войти в Grok ^2025-08-31
Появление революционного искусственного интеллекта, способного коренным образом изменить наше настоящее и сформировать контуры будущего. Grok от xAI

Регистрация Grok в России ^2025-08-31
Grok — это современная нейросеть от компании xAI (Илона Маска), которая отличается прямым, иногда провокационным и юмористическим стилем общения. В