О проекте
SilentRoom — профессиональная цифровая среда для авторов (сценаристов, писателей, учёных), построенная на философии «Silent AI»: инструмент не генерирует текст за автора, а работает как аналитик и ассистент с бесконечной памятью. Это «экзоскелет для автора», объединяющий структуру классических редакторов (Scrivener) с мощью Gemini 3.1 Pro. Приложение работает в 4 режимах — BUILD (сбор материалов), THINK (чат с данными / RAG), WRITE (текстовый редактор), CHECK (валидация). Стек: Next.js, Supabase, Tiptap, Google Vertex AI; три режима ИИ: Project (RAG с кэшированием контекста), Global (stateless), Search (веб-поиск с источниками).

Задача
Нужен специалист, который возьмёт на себя полную ответственность за все LLM-интеграции в SilentRoom по трём режимам:

  • Project (RAG) — stateful-контекст, послойная сборка payload (system prompt sandwich, vector DB, фоновая экстракция через дешёвую модель типа Gemini Flash), context caching.
  • Global — stateless, минимальный контекст, быстрый ответ через все основные модели.
  • Search — веб-поиск через Tavily / Google Search API + grounding, ответ с proof-ссылками.

Подключение и поддержка интеграций со всеми ведущими моделями:

  • Западные: Gemini (приоритет, context caching), OpenAI (GPT), Anthropic (Claude), Mistral, Llama.
  • Китайские: DeepSeek, Qwen (Alibaba), Kimi (Moonshot).

Формат работы

  • Проектная работа + последующая поддержка.
  • 100% удалёнка, локация — любая.
  • Язык общения — русский; технический английский на высоком уровне.
  • Оплата — любая форма и валюта, включая рубли.

Что важно

  • Топ-сеньор уровень, не middle.
  • Опыт работы с LLM API (Gemini, OpenAI, Anthropic) в продакшене.
  • Опыт с RAG, векторными БД (Pinecone, Weaviate, pgvector), embeddings.
  • Python или Node.js backend (FastAPI или Express).
  • Понимание prompt engineering, context management, async-архитектуры.
  • Опыт с context caching (Google Vertex AI — большой плюс).

Будет плюсом

  • Опыт с browser extensions.
  • Понимание архитектуры мультимодельных продуктов.
  • Опыт работы в AI-first стартапах.