Назад к кейсам
2024-2025Solo / contract-style work

FastAPI backend performance cleanup

Оптимизация FastAPI API path: async I/O, connection reuse, Redis cache, request validation, metrics и удаление serial bottlenecks.

Throughput
~1.6k -> ~8.2k RPS
Latency
p95 about -70%
Scope
Benchmark profile
Measured backend work

Сначала baseline, потом один bottleneck за раз.

Цифры оформлены как repeatable benchmark, а не как расплывчатое production-обещание.

1Собрал baseline до изменения кода
2Убрал serial waits и repeated dependency calls
3Добавил cache strategy, connection reuse и более ясную validation
Роль

Python backend-разработчик

Стек
PythonFastAPIasyncioPydanticRedis
Задача

Hot API path тратил слишком много времени на serial waits и repeated dependency calls. Сначала нужно было измерить, а не угадывать.

Решение

Собрал benchmark profile, изолировал slow dependencies, изменил request path вокруг async I/O, connection pooling, caching и более ясной validation.

Результат

В repeatable benchmark throughput вырос примерно с 1,600 до 8,200 RPS, p95 latency снизилась примерно на 70%.

Что я сделал
  • Измерил текущий path до изменения implementation.
  • Поднял repeatable benchmark throughput примерно с 1,600 до 8,200 RPS.
  • Снизил p95 latency примерно на 70% в том же benchmark.
Что это показывает
  • Performance work вызывает больше доверия, когда baseline и test shape записаны.
  • Лучшая оптимизация часто в том, чтобы убрать avoidable waits, а не добавить clever code.
Другие кейсы

Ещё проекты

2025-2026

Каталог моделей nnzen

Solo

Живой LLM-каталог: собирает данные о моделях, нормализует их и помогает быстрее сравнивать варианты.

PythonFastAPILLM APIsRAGVector DB / pgvector
2025

MCP core for an LLM assistant

Solo

Backend core для LLM assistant с plugin execution, hot reload, tool chains и explicit context handoff.

PythonFastAPIMCPTool callingLLM APIs