Назад к кейсам
2025Solo

MCP core for an LLM assistant

Backend core для LLM assistant с plugin execution, hot reload, tool chains и explicit context handoff.

Plugin model
Hot reload
Execution
Context handoff
Surface
CLI + API
Execution core

Plugins могут меняться без перезапуска всего assistant runtime.

Полезная часть - predictable execution, а не просто доступ к model.

1Plugin lifecycle отделен от core runtime
2Hot reload ускоряет iteration
3Tool chains передают context явно
Роль

AI Tooling Developer

Стек
PythonFastAPIMCPTool callingLLM APIs
Задача

Когда assistant вырастает за пределы demo, plugins и tool calls становится сложно развивать без поломки runtime.

Решение

Собрал FastAPI execution core с plugin lifecycle management, hot reload, cascading tool calls и CLI client с execution history.

Результат

Новые tools можно добавлять без переписывания assistant core, а tool execution проще inspect.

Что я сделал
  • Сделал plugin hot reload без restart core process.
  • Собрал explicit context handoff между chained tools.
  • Разделил runtime responsibilities и plugin responsibilities.
Что это показывает
  • AI tooling становится useful, когда execution behavior predictable.
  • Clean plugin boundary важнее количества подключенных models.
Другие кейсы

Ещё проекты

2025-2026

Каталог моделей nnzen

Solo

Живой LLM-каталог: собирает данные о моделях, нормализует их и помогает быстрее сравнивать варианты.

PythonFastAPILLM APIsRAGVector DB / pgvector
2024-2025

FastAPI backend performance cleanup

Solo / contract-style work

Оптимизация FastAPI API path: async I/O, connection reuse, Redis cache, request validation, metrics и удаление serial bottlenecks.

PythonFastAPIasyncioPydanticRedis