11 плагинов, один маркетплейс: как я собрал AI-тулкит с нуля
Как я построил экосистему плагинов для Claude Code — от разрозненных скриптов до полного жизненного цикла со скаффолдингом, quality gates, мульти-AI ревью и установкой одной командой.
Проблема
Инструменты для AI-агентов разбросаны. Сниппет в CLAUDE.md тут, bash-скрипт там, команда скопирована из чужого репо без версии, без тестов, без возможности проверить, что она делает то, что заявлено. Каждый инструмент живёт изолированно. Нет жизненного цикла: создать, протестировать, опубликовать, найти, установить. Нет доверия: вставляешь skill из интернета и надеешься, что он не нагаллюцинирует свой путь через кодовую базу.
Я раз за разом упирался в одну и ту же стену: создавал полезную команду для Claude Code, потом нуждался в ней в другом проекте. Копипаст. Дрифт. Через два месяца — три несовместимые копии. Корневая проблема не в каком-то конкретном инструменте, а в отсутствии инфраструктуры вокруг них.
Контекст
У Claude Code есть система плагинов. Манифест plugin.json, структура каталогов .claude-plugin/, регистрация в маркетплейсе через marketplace.json. Примитивы на месте: skills, commands, hooks, agents, MCP-серверы. Anthropic построил рантайм. Не хватает инструментального слоя поверх.
Этот разрыв знаком из каждой экосистемы: npm существовал до create-react-app. PyPI существовал до cookiecutter. Пакетный менеджер появляется первым, developer experience — позже. Claude Code сейчас в этой фазе «позже».
heurema — попытка заполнить этот разрыв. Философия: «Craft, not conjuring» — ремесло, а не колдовство. Стандартная библиотека вместо зависимостей, quality gates перед публикацией, никакой магии. Каждый плагин проходит ruff + mypy --strict + pytest перед выпуском. Если его нельзя протестировать — он не выходит.
Решение — Экосистема
Маркетплейс: emporium
emporium — единая точка входа. Одна команда для добавления маркетплейса, одна команда на плагин:
# Добавить маркетплейс (один раз)
claude plugin marketplace add heurema/emporium
# Установить любой плагин
claude plugin install signum@emporium
claude plugin install herald@emporium
claude plugin install arbiter@emporium
Под капотом — marketplace.json, маппящий имена плагинов на их GitHub-репо. Никакого сервера реестра, никакой аутентификации, никакого билд-степа. Git-репо от начала до конца.
Сейчас 11 плагинов в четырёх категориях: pipeline разработки, продуктивность, торговые сигналы и креативные инструменты.
Pipeline разработки
Четыре плагина покрывают полный цикл от «у меня есть задача» до «отревьюено, протестировано, отправлено».
signum — Evidence-driven pipeline разработки. Берёт описание задачи и прогоняет через четыре фазы: CONTRACT (фиксация скоупа) -> EXECUTE (реализация с repair loop) -> AUDIT (параллельный мульти-модельный ревью) -> PACK (генерация артефактов). Самая интересная часть — фаза аудита: Claude Opus, Codex и Gemini ревьюят diff независимо. Критические находки от любой модели блокируют мерж. Важные находки требуют согласия 2+ моделей. Каждая AI-находка валидируется против реального diff — если модель ссылается на строку, которой не существует, находка отбрасывается как галлюцинация.
/signum"Добавить rate limiting к API-эндпоинту"
arbiter — Мульти-AI оркестратор. Маршрутизирует задачи в Codex CLI и Gemini CLI изнутри Claude Code. Режим panel запускает оба параллельно и форматирует сравнение бок о бок. Режим quorum проводит формальное двухраундовое голосование (APPROVE/BLOCK/NEEDS_INFO) с детерминированной политикой и adversarial tiebreaker. Режим diverge — самый необычный: три независимые реализации в изолированных git worktrees с разными стратегическими подсказками (minimal, refactor, redesign), представленные как анонимизированная матрица решений.
/arbiter panel "WebSockets или SSE для real-time обновлений?"
/arbiter quorum "Безопасно ли запускать эту миграцию в продакшене?"
/arbiter diverge "Реализовать слой кэширования"
anvil — Dev/test-тулкит для плагинов. Скаффолдит новые плагины из шаблонов, запускает 6-уровневую валидацию (schema, structure, hooks, conventions, consistency, install docs), тестирует хуки с фикстурами. Включает AI-агента для код-ревью, который проверяет по чеклисту из 21 пункта и возвращает APPROVE или REQUEST CHANGES.
/anvil:new my-plugin
/anvil:check ./my-plugin
/anvil:test ./my-plugin
forge — Менеджер жизненного цикла плагинов. Где anvil фокусируется на dev/test, forge управляет полным циклом: скаффолдинг из Jinja2-шаблонов, верификация quality gates, регистрация и в workspace registry, и в маркетплейсе emporium. Пять команд, покрывающих путь от forge-new до forge-register.
/forge-new awesome-plugin
/forge-verify
/forge-register
Продуктивность
herald — Ежедневный новостной дайджест. Ноль API-ключей, полностью локальный. Настраивает RSS-фиды по теме (ai-engineering, rust, devops, security и т.д.), забирает из RSS + Hacker News, прогоняет 3-уровневую дедупликацию (хеш URL, нормализация, схожесть заголовков), скорит по релевантности ключевых слов и доставляет топ-10 историй прямо в Claude Code. SessionStart-хук уведомляет, когда свежий дайджест готов.
/news init ai-engineering
/news digest
reporter — Репортер багов и фич. Автоматически определяет, с каким heurema-продуктом вы работаете (через git remote, plugin.json или pyproject.toml), проводит через сфокусированный шаблон issue, молча прикрепляет контекст окружения (OS, shell, версия Claude Code) и отправляет через gh CLI. Если gh недоступен — копирует тело issue в буфер обмена и выводит GitHub URL.
/report bug
/report feature
Торговые сигналы
oracle — Сигналы волатильности опционов. Забирает данные с Deribit (API-ключи не нужны для публичных данных) и вычисляет: risk reversal (перекос IV), put/call ratio, DVOL-модификатор, соотношение срочной структуры. На выходе — взвешенный direction score с формулой уверенности, которая деградирует при высокой волатильности или backwardation. Кэширует снапшоты с затуханием свежести.
/deribit --asset BTC
sentinel — Агрегатор сентимента. Четыре независимых источника в унифицированном формате сигнала: индекс Fear & Greed (с z-score за 30 дней и перцентилем за 90 дней), сканер новостей CryptoPanic + RSS, предсказательные рынки Polymarket и social intelligence LunarCrush. Первые три работают без API-ключей; LunarCrush — опциональный premium-апгрейд.
/feargreed
/polymarket
/news-scanner
Креативные инструменты
genesis — Меметический алгоритм для стартап-идей. Три AI-персоны (генератор, критик, арбитр) проводят эволюционные раунды: GENERATE -> CRITIQUE -> SELECT -> REFINE. Восемь измерений скоринга с четырьмя стратегиями (bootstrapper, growth, moat, uniform). Жёсткие ограничения (бюджет, сроки, навыки, solo-mode) отсекают нежизнеспособные идеи до затратного этапа refinement. Свежие variate-инъекции на раунде 2+ предотвращают конвергенцию.
/genesis "Инструменты продуктивности для разработчиков" --rounds 3 --strategy bootstrapper
glyph — Генератор демо-GIF для терминала. Описываешь, что хочешь показать в демо, и он генерирует синтетическую asciicast-запись с реалистичным таймингом набора — никакие реальные команды не выполняются. Встроенный PII-аудит блокирует вывод, содержащий домашние пути, email, API-ключи или секреты. Seeded RNG для воспроизводимости. Темы: Monokai по умолчанию и amber retro CRT.
/glyph "Показать установку плагина и запуск первой команды"
Справочник
teams-field-guide — Полевое руководство по мульти-агентным системам Claude Code. Семь паттернов оркестрации, конфигурация кастомных агентов, оптимизация стоимости через распределение моделей, известные баги с воркараундами и покрытие 26+ проектов экосистемы. Не плагин в традиционном смысле — это документация, распространяемая как плагин ради дискавери.
Quality Gates
Каждый плагин в экосистеме проходит одни и те же гейты:
- ruff — линтинг и форматирование
- mypy —strict — полная типизация
- pytest — покрытие тестами
- forge verify — pre-publish quality gate (структура, манифест, конвенции)
- anvil check — 6-уровневая валидация с JSON-отчётом
- signum audit — adversarial мульти-модельный ревью для нетривиальных изменений
Pipeline forge -> anvil -> signum означает, что плагин валидируется на трёх уровнях до попадания в маркетплейс: соответствие жизненному циклу, структурная корректность и качество кода под adversarial ревью.
Инсайт
Экосистемы плагинов дают compound-эффект. herald доставляет новости, которые информируют торговые решения с сигналами oracle и sentinel. reporter фиксирует баги, найденные в ходе ревью signum. forge скаффолдит новые плагины, которые anvil валидирует. Каждый инструмент делает остальные полезнее.
Настоящий moat — не в отдельном плагине. Он в жизненном цикле: forge-new -> разработка -> anvil:check -> forge-verify -> forge-register -> доступен в emporium. Любой отдельный инструмент можно повторить. Pipeline, связывающий их, скопировать сложнее, потому что он кодирует решения о качестве, доверии и дистрибуции.
У open source AI-тулинга проблема с доверием. Любой может опубликовать skill, который заявляет «оптимизирует вашу кодовую базу». Правда ли? Тестировался ли он? Проходит ли проверку типов? Ревью автоматизировано или «на вайбах»? Ответ для большинства инструментов сегодня: неизвестно. Ставка за heurema в том, что инфраструктура доверия — quality gates, adversarial review, верифицированные манифесты — важнее любого отдельного умного промпта.
Одиннадцать плагинов, один маркетплейс, ноль API-ключей для основных инструментов. Это точка старта, а не финиша.
Источники
- emporium — Маркетплейс плагинов
- signum — Pipeline разработки
- arbiter — Мульти-AI оркестратор
- anvil — Dev-тулкит для плагинов
- forge — Менеджер жизненного цикла
- herald — Новостной дайджест
- reporter — Репортер багов/фич
- oracle — Сигналы волатильности опционов
- sentinel — Стек сентимента
- genesis — Меметическая идеация
- glyph — Демо-GIF для терминала
- teams-field-guide — Гайд по мульти-агентам
- skill7.dev — Каталог плагинов