Backlog

Идеи за пределами текущей phase. Перед включением в работу — гипотеза + approval.

Подтверждённые модули

Module M1: Niche-Evaluation-Module

Многоагентный конвейер оценки ниш (planned: after Week 3). 3 новых агента + переиспользование Scout/Researcher. Первая гипотеза H-0002-niche-evaluation-dubai-realestate — B2B tooling для Dubai real estate agencies.


Agents

IdeaDescriptionComplexity
Customer InterviewerАвтоматизация Customer-Discovery interviewsHigh
Pricing StrategistАнализ ценообразования, рекомендацииMedium
Contract ReviewerReview договоров (human approval каждый!)High
BookkeeperRead-only финансовая отчётностьMedium
Patent/IP ResearcherПоиск патентов и IP в нишеMedium
Legal Compliance ScoutJurisdiction-aware compliance checksHigh

Capabilities

IdeaDescription
Multi-modalАнализ изображений, видео-фреймов (product screenshots, ad creatives)
Voice TelegramГолосовые сообщения через Groq Whisper → text → agent
Email channelВходящие/исходящие email через agent (с approval)
CRM integrationHubSpot / Pipedrive — sync contacts, deals, activities
Calendar schedulingGoogle Calendar integration для встреч
Financial reportingRead-only dashboards, cash flow, P&L

Infrastructure

IdeaDescription
Multi-regionDeployment на нескольких серверах (latency, compliance)
Self-hosted LLMДля sensitive workloads (PII processing, financial)
Workflow versioningLangGraph-style если понадобится для сложных flows
A/B testing промптовSystematic prompt optimization with metrics
Agent evaluation harnessAutomated testing: scenarios → expected outcomes → score

Governance

IdeaDescription
Automated policy updatesPattern detection → policy suggestions on incidents
Quarterly agent auditIndependent review of agent behavior
Red-teamingAdversarial testing of agents (prompt injection, boundary testing)
Compliance frameworkGDPR, SOC2 — для enterprise sales

Productization (Phase 3+)

IdeaDescription
SaaSMulti-agent system as a service для других компаний
Agency-as-a-serviceRun operations for clients using our agents
White-labelVertical-specific: seeding, media, e-commerce

Research Questions

  • Заменить CEO Opus → Sonnet с multi-step reasoning?
  • RAG по vault vs system prompt — что даёт лучшие результаты?
  • Optimal retry count для revise (2? 3? 5?)
  • Как измерять quality creative tasks (not just factual)?
  • Cost optimization: batching requests, caching, model selection

Rules for Adding to Backlog

  1. Любой может предложить (PR к этому файлу)
  2. Измеримость обязательна — “интересно исследовать” не принимается
  3. В actionable — только через Template-Hypothesis
  4. Prioritization — по impact × confidence × effort
  5. Cleanup — quarterly review, удалять неактуальное

Связанные документы