Claude Code vs Codex: почему я на две недели перешёл на Codex

Коротко

Это не вечный рейтинг “что лучше: Claude Code или Codex”. Это snapshot на середину мая 2026: почему я временно переехал с Claude Code на Codex, что стало хуже, что стало лучше и какие привычки пришлось поменять.

Это как раз формат страницы, где сухая таблица мало помогает: людям важнее понять, как ощущается ежедневная работа, что ломает контекст, где приходится менять флоу и где инструмент начинает бесить.

Почему я временно переехал

2 недели назад я перешел на Codex

TL:DR; Claude Code увидели клюшку в метриках. Не справились с ростом - на помощь пришли серверы Илона. Ранее добавили кеширование и «оптимизации» в опус 4.7 - юзеры стали чувствовать, что СС тупит жоска. Весь апрель длилась не смешная шутка не только со мной в главной роли, но и в нашем чате и во всем тви. Вот и решил перейти на Codex.

Сами CC объясняют свой тупизм количеством наших установленных скилов, mcp и др контекстной грязи.

Они, конечно, добавили /doctor для чистки и поливают дождем из кредитов и больших лимитов, но я уже чёрнулся, сори. Fuck you, pay me to return. Пока такой вайбик, ждем релиза mythos.

Мой фидбек по Кодексу:

  1. Дал задачу - Долго думает - Выдает хороший ответ, но контекст уже заполнен. Приходится чаще явно начинать новую сессию и менять привычки.
  1. Чтобы экономить контекст, приходится напоминать использовать субагентов. Немного надоело, нужно найти норм поваренную книгу по кодексу.
  1. В кодексе сижу через их десктоп прилу. Чувствую себя корпоратом, скучаю по CC CLI. Микрофончик есть, но продолжаю юзать Spokenly на правый command.
  1. Нет рисков словить бан из-за экспериментов с другими тулами. Пока что.

В планах научиться работать с контекстом через gbrain/openbrain, а не просто md с вики-ссылками. И тогда переезжать туда-сюда будет проще, как и шерить фрагменты коллегам. Ну и t3code, ладно, попробую тоже.

Опрос в чате показывал тогда баланс CC/C : ~50/50, вот новый:

Что важно в этом сравнении

Сравнение Claude Code и Codex быстро устаревает, если обсуждать только “какая модель умнее”. Сегодня один релиз, завтра другой лимит, послезавтра поменялась политика доступа, а через неделю весь Twitter уже ругает новый regression.

Более стабильные критерии такие:

КритерийПочему важно
Работа с контекстомАгент может быть умным, но если сессия быстро забивается, вы платите вниманием за cleanup
СубагентыДля длинных задач важно уметь разгружать основной контекст и не превращать чат в кашу
CLI/Desktop привычкиИнтерфейс влияет на скорость: голос, хоткеи, файлы, permissions, рабочие директории
Риск блокировок и экспериментовЕсли вы подключаете другие тулзы, важно понимать, где вас может наказать платформа
Переносимость знанийGBrain/OpenBrain/markdown-вики нужны, чтобы не быть заложником одного клиента

Что добавилось из обсуждений

В ohld_chat вокруг этого периода шло много сравнений Claude Code и Codex. Полезный сигнал не в том, что “один точно победил”, а в том, что опыт стал примерно поляризованным: часть людей оставалась на Claude Code из-за привычного CLI и качества флоу, часть уходила в Codex из-за стабильности, доступности и меньших рисков.

Еще один повторяющийся community insight: люди недооценивают стоимость context hygiene. Когда в Claude Code лежит много MCP, skills и локальной грязи, деградация ощущается как “модель тупит”, хотя часть проблемы может быть в среде. В Codex похожая проблема выглядит иначе: ответ хороший, но контекст быстрее заполняется, и нужно дисциплинированнее начинать новые сессии.

Из донорских каналов в тот же период видно похожее направление: обсуждали обновления Codex, goal-режимы, computer-use сценарии и деградации Claude-моделей. Это не доказательство, что Codex лучше. Это доказательство, что рынок живет короткими циклами, а сравнения нужно обновлять как changelog, а не как вечный мануал.

Мой текущий вывод

Если вы выбираете “Claude Code или Codex”, не выбирайте по чужому фанатству. Сделайте маленький benchmark на своем проекте:

  1. Один и тот же issue или рефакторинг.
  2. Один и тот же контекст: README, relevant files, constraints.
  3. Один и тот же критерий готовности: тесты, diff size, читаемость, риск.
  4. Отдельный раунд ревью: “что ты мог сломать?”.
  5. Замер не только качества ответа, но и того, сколько раз вы вмешивались.

И уже потом решайте, где жить каждый день. Для меня на момент поста Codex стал способом не зависеть от просадки Claude Code, но не снял проблему контекста. Он просто поменял ее форму.

Связанные материалы