11 плагинов, один маркетплейс: как я собрал AI-тулкит с нуля

Проблема

Инструменты для AI-агентов разбросаны. Сниппет в CLAUDE.md тут, bash-скрипт там, команда скопирована из чужого репо без версии, без тестов, без возможности проверить, что она делает то, что заявлено. Каждый инструмент живёт изолированно. Нет жизненного цикла: создать, протестировать, опубликовать, найти, установить. Нет доверия: вставляешь skill из интернета и надеешься, что он не нагаллюцинирует свой путь через кодовую базу.

Я раз за разом упирался в одну и ту же стену: создавал полезную команду для Claude Code, потом нуждался в ней в другом проекте. Копипаст. Дрифт. Через два месяца — три несовместимые копии. Корневая проблема не в каком-то конкретном инструменте, а в отсутствии инфраструктуры вокруг них.

Контекст

У Claude Code есть система плагинов. Манифест plugin.json, структура каталогов .claude-plugin/, регистрация в маркетплейсе через marketplace.json. Примитивы на месте: skills, commands, hooks, agents, MCP-серверы. Anthropic построил рантайм. Не хватает инструментального слоя поверх.

Этот разрыв знаком из каждой экосистемы: npm существовал до create-react-app. PyPI существовал до cookiecutter. Пакетный менеджер появляется первым, developer experience — позже. Claude Code сейчас в этой фазе «позже».

heurema — попытка заполнить этот разрыв. Философия: «Craft, not conjuring» — ремесло, а не колдовство. Стандартная библиотека вместо зависимостей, quality gates перед публикацией, никакой магии. Каждый плагин проходит ruff + mypy --strict + pytest перед выпуском. Если его нельзя протестировать — он не выходит.

Решение — Экосистема

Маркетплейс: emporium

emporium — единая точка входа. Одна команда для добавления маркетплейса, одна команда на плагин:

# Добавить маркетплейс (один раз)
claude plugin marketplace add heurema/emporium

# Установить любой плагин
claude plugin install signum@emporium
claude plugin install herald@emporium
claude plugin install arbiter@emporium

Под капотом — marketplace.json, маппящий имена плагинов на их GitHub-репо. Никакого сервера реестра, никакой аутентификации, никакого билд-степа. Git-репо от начала до конца.

Сейчас 11 плагинов в четырёх категориях: pipeline разработки, продуктивность, торговые сигналы и креативные инструменты.

Pipeline разработки

Четыре плагина покрывают полный цикл от «у меня есть задача» до «отревьюено, протестировано, отправлено».

signum — Evidence-driven pipeline разработки. Берёт описание задачи и прогоняет через четыре фазы: CONTRACT (фиксация скоупа) -> EXECUTE (реализация с repair loop) -> AUDIT (параллельный мульти-модельный ревью) -> PACK (генерация артефактов). Самая интересная часть — фаза аудита: Claude Opus, Codex и Gemini ревьюят diff независимо. Критические находки от любой модели блокируют мерж. Важные находки требуют согласия 2+ моделей. Каждая AI-находка валидируется против реального diff — если модель ссылается на строку, которой не существует, находка отбрасывается как галлюцинация.

/signum"Добавить rate limiting к API-эндпоинту"

arbiter — Мульти-AI оркестратор. Маршрутизирует задачи в Codex CLI и Gemini CLI изнутри Claude Code. Режим panel запускает оба параллельно и форматирует сравнение бок о бок. Режим quorum проводит формальное двухраундовое голосование (APPROVE/BLOCK/NEEDS_INFO) с детерминированной политикой и adversarial tiebreaker. Режим diverge — самый необычный: три независимые реализации в изолированных git worktrees с разными стратегическими подсказками (minimal, refactor, redesign), представленные как анонимизированная матрица решений.

/arbiter panel "WebSockets или SSE для real-time обновлений?"
/arbiter quorum "Безопасно ли запускать эту миграцию в продакшене?"
/arbiter diverge "Реализовать слой кэширования"

anvil — Dev/test-тулкит для плагинов. Скаффолдит новые плагины из шаблонов, запускает 6-уровневую валидацию (schema, structure, hooks, conventions, consistency, install docs), тестирует хуки с фикстурами. Включает AI-агента для код-ревью, который проверяет по чеклисту из 21 пункта и возвращает APPROVE или REQUEST CHANGES.

/anvil:new my-plugin
/anvil:check ./my-plugin
/anvil:test ./my-plugin

forge — Менеджер жизненного цикла плагинов. Где anvil фокусируется на dev/test, forge управляет полным циклом: скаффолдинг из Jinja2-шаблонов, верификация quality gates, регистрация и в workspace registry, и в маркетплейсе emporium. Пять команд, покрывающих путь от forge-new до forge-register.

/forge-new awesome-plugin
/forge-verify
/forge-register

Продуктивность

herald — Ежедневный новостной дайджест. Ноль API-ключей, полностью локальный. Настраивает RSS-фиды по теме (ai-engineering, rust, devops, security и т.д.), забирает из RSS + Hacker News, прогоняет 3-уровневую дедупликацию (хеш URL, нормализация, схожесть заголовков), скорит по релевантности ключевых слов и доставляет топ-10 историй прямо в Claude Code. SessionStart-хук уведомляет, когда свежий дайджест готов.

/news init ai-engineering
/news digest

reporter — Репортер багов и фич. Автоматически определяет, с каким heurema-продуктом вы работаете (через git remote, plugin.json или pyproject.toml), проводит через сфокусированный шаблон issue, молча прикрепляет контекст окружения (OS, shell, версия Claude Code) и отправляет через gh CLI. Если gh недоступен — копирует тело issue в буфер обмена и выводит GitHub URL.

/report bug
/report feature

Торговые сигналы

oracle — Сигналы волатильности опционов. Забирает данные с Deribit (API-ключи не нужны для публичных данных) и вычисляет: risk reversal (перекос IV), put/call ratio, DVOL-модификатор, соотношение срочной структуры. На выходе — взвешенный direction score с формулой уверенности, которая деградирует при высокой волатильности или backwardation. Кэширует снапшоты с затуханием свежести.

/deribit --asset BTC

sentinel — Агрегатор сентимента. Четыре независимых источника в унифицированном формате сигнала: индекс Fear & Greed (с z-score за 30 дней и перцентилем за 90 дней), сканер новостей CryptoPanic + RSS, предсказательные рынки Polymarket и social intelligence LunarCrush. Первые три работают без API-ключей; LunarCrush — опциональный premium-апгрейд.

/feargreed
/polymarket
/news-scanner

Креативные инструменты

genesis — Меметический алгоритм для стартап-идей. Три AI-персоны (генератор, критик, арбитр) проводят эволюционные раунды: GENERATE -> CRITIQUE -> SELECT -> REFINE. Восемь измерений скоринга с четырьмя стратегиями (bootstrapper, growth, moat, uniform). Жёсткие ограничения (бюджет, сроки, навыки, solo-mode) отсекают нежизнеспособные идеи до затратного этапа refinement. Свежие variate-инъекции на раунде 2+ предотвращают конвергенцию.

/genesis "Инструменты продуктивности для разработчиков" --rounds 3 --strategy bootstrapper

glyph — Генератор демо-GIF для терминала. Описываешь, что хочешь показать в демо, и он генерирует синтетическую asciicast-запись с реалистичным таймингом набора — никакие реальные команды не выполняются. Встроенный PII-аудит блокирует вывод, содержащий домашние пути, email, API-ключи или секреты. Seeded RNG для воспроизводимости. Темы: Monokai по умолчанию и amber retro CRT.

/glyph "Показать установку плагина и запуск первой команды"

Справочник

teams-field-guide — Полевое руководство по мульти-агентным системам Claude Code. Семь паттернов оркестрации, конфигурация кастомных агентов, оптимизация стоимости через распределение моделей, известные баги с воркараундами и покрытие 26+ проектов экосистемы. Не плагин в традиционном смысле — это документация, распространяемая как плагин ради дискавери.

Quality Gates

Каждый плагин в экосистеме проходит одни и те же гейты:

ruff — линтинг и форматирование
mypy —strict — полная типизация
pytest — покрытие тестами
forge verify — pre-publish quality gate (структура, манифест, конвенции)
anvil check — 6-уровневая валидация с JSON-отчётом
signum audit — adversarial мульти-модельный ревью для нетривиальных изменений

Pipeline forge -> anvil -> signum означает, что плагин валидируется на трёх уровнях до попадания в маркетплейс: соответствие жизненному циклу, структурная корректность и качество кода под adversarial ревью.

Инсайт

Экосистемы плагинов дают compound-эффект. herald доставляет новости, которые информируют торговые решения с сигналами oracle и sentinel. reporter фиксирует баги, найденные в ходе ревью signum. forge скаффолдит новые плагины, которые anvil валидирует. Каждый инструмент делает остальные полезнее.

Настоящий moat — не в отдельном плагине. Он в жизненном цикле: forge-new -> разработка -> anvil:check -> forge-verify -> forge-register -> доступен в emporium. Любой отдельный инструмент можно повторить. Pipeline, связывающий их, скопировать сложнее, потому что он кодирует решения о качестве, доверии и дистрибуции.

У open source AI-тулинга проблема с доверием. Любой может опубликовать skill, который заявляет «оптимизирует вашу кодовую базу». Правда ли? Тестировался ли он? Проходит ли проверку типов? Ревью автоматизировано или «на вайбах»? Ответ для большинства инструментов сегодня: неизвестно. Ставка за heurema в том, что инфраструктура доверия — quality gates, adversarial review, верифицированные манифесты — важнее любого отдельного умного промпта.

Одиннадцать плагинов, один маркетплейс, ноль API-ключей для основных инструментов. Это точка старта, а не финиша.