Pular para o conteúdo principal

⚙️ Tecnologias

🗓 Informações Gerais

  • Nome do Projeto: Agente de IA Especializado em Contabilidade

  • Tech Lead:

  • Data de Entrada na Área:
  • Data Estimada de Conclusão da Área:

Checklist de Entrada e Saída da Área de Tecnologia

✅ Checklist de Entrada

  • Documento de Visão de Produto validado

📤 Checklist de Saída

  • Stack definida e aprovada
  • Diagrama de arquitetura completo
  • Plano de implantação claro
  • Documento validado com o time de Desenvolvimento

Stack Tecnológica

A solução é composta por dois repositórios principais: agent-structure (agente-contabil) e rag-agent-architecture (RAG API).

Agente Contábil (agent-structure)

CategoriaTecnologiaVersão / Observação
LinguagemPython3.11
Framework WebFastAPI≥ 0.128.0
Servidor ASGIUvicorn≥ 0.40.0
LLM / AgentLangChain + LangGraphlangchain 1.2.4, langgraph ≥ 0.2.0
LLM ProviderOpenAIgpt-4o-mini (ChatOpenAI)
Banco de dadosFirebase / Firestorefirebase-admin ≥ 6.6.0, google-cloud-firestore ≥ 2.18.0
Autenticação RAGGoogle Authgoogle-auth ≥ 2.35.0 (OIDC para Cloud Run)
Rate LimitingSlowAPI≥ 0.1.9
Variáveis de ambientepython-dotenv1.0.0

RAG API (rag-agent-architecture)

CategoriaTecnologiaUso
Framework WebFastAPIAPI REST de ingestão e busca
EmbeddingsOpenAI text-embedding-3-smallVetores de 1.536 dimensões
Busca vetorialVertex AI Vector SearchSTREAM_UPDATE, filtros por categoria/tag
ArmazenamentoFirestore (rag-db-v1)Conteúdo textual e metadados (collection knowledge_base)
Inferência de metadadosGPT-4o-miniTítulo, categoria, tags (structured output)
Web scrapingBeautifulSoup4, httpxConversão HTML → Markdown para ingestão via URL
CloudGoogle Cloud PlatformCloud Run, Cloud Storage, Vertex AI

Infraestrutura GCP

ServiçoProjetoRegião
Cloud Run (agente-contabil)ctbz-ia-assessoria-pocus-central1
Cloud Run (RAG API)ctbz-ia-assessoria-pocus-central1
Firestore (rag-db-v1)ctbz-ia-assessoria-poc
Vertex AI Vector Searchctbz-ia-assessoria-pocus-central1
Cloud Storagectbz-ia-assessoria-pocStaging de Markdown normalizados

Arquitetura da Solução

Visão Geral da Arquitetura

A solução foi arquitetada sobre o Google Cloud Platform (GCP) com foco em três pilares: precisão tributária, segurança de dados (LGPD) e eficiência de custo (FinOps).

A arquitetura compreende três grandes componentes:

  1. Pipeline de Ingestão em Lote (Batch ETL) — carga inicial de fontes históricas (780+ artigos, conversas, site institucional)
  2. Pipeline de Ingestão via API (On-Demand) — adição contínua de novos conhecimentos em tempo real
  3. Fluxo de Execução Cognitiva (Runtime) — orquestração do agente com RAG, ferramentas e histórico de conversa

A arquitetura técnica está detalhada em Arquitetura Geral Detalhada.

Componentes Principais

Serviços e Microsserviços

  • agente-contabil (agent-structure): API FastAPI que expõe /chat com SSE, orquestra o agente LangGraph, ferramentas (RAG, leads, transbordo) e integra com Firestore para histórico e leads
  • RAG API (rag-agent-architecture): API REST de ingestão (/knowledge/ingest/blog, /knowledge/ingest/qa) e busca (/chat — apenas retrieval, sem geração LLM)
  • Pipeline ETL (Batch): Cloud Run Jobs para processamento em lote de blogs, conversas e site

Ferramentas do Agente

  • buscar_conhecimento_contabil (RAG tool): Consulta a RAG API e retorna respostas fundamentadas na base de conhecimento
  • registrar_lead: Persiste potenciais leads no Firestore durante a conversa
  • transbordo: Marca transferência para atendimento humano (implementação futura)

Integrações Externas

  • RAG API: O agente chama https://rag-api-55837972640.us-central1.run.app/chat com autenticação OIDC
  • OpenAI: ChatOpenAI (gpt-4o-mini) para orquestração do agente e inferência de metadados
  • Firestore: Histórico de conversas, cache de RAG, leads
  • Vertex AI: Busca vetorial e armazenamento de embeddings

Estrutura de Implantação

Ambiente de Desenvolvimento

  • Como subir localmente (agente-contabil):
    cd agent-structure
    cp .env.example src/.env # configurar OPENAI_API_KEY, etc.
    docker build -t agente-contabil:test .
    docker run -d -p 8080:8080 --env-file src/.env agente-contabil:test
  • Docker: Imagem oficial Python 3.11-slim, porta 8080
  • Variáveis de ambiente principais:
    • OPENAI_API_KEY — obrigatória para o LLM
    • API_KEY_DEV / API_KEY_PROD_SITE — validação de API Key no header X-API-Key
    • ALLOWED_ORIGIN_1, ALLOWED_ORIGIN_2 — CORS
    • RATE_LIMIT — ex: 50/minute
    • RAG_CACHE_ENABLED, RAG_CACHE_TTL_DAYS — cache de respostas RAG no Firestore

Ambiente de Produção

Diagrama de Implantação (opcional)

Diagrama com servidores, buckets, serviços gerenciados, DNS, CDNs, etc.

Considerações de Segurança

  • Políticas de CORS: Configuradas em ALLOWED_ORIGINS; produção restringe origens autorizadas
  • Proteção de dados sensíveis: PII Masking (DLP) planejado no runtime; dados sensíveis substituídos por tokens antes de envio a LLMs (LGPD)
  • Gestão de segredos: Variáveis de ambiente no Cloud Run; API keys em .env local e gcloud run services update --set-env-vars
  • Autenticação e autorização:
    • Agente: header X-API-Key obrigatório (exceto /health, /docs, /redoc)
    • RAG API: token OIDC via service account (IAM roles/run.invoker para agente-contabil)
    • Rate limiting (SlowAPI) para mitigar abuso e DDoS