Framework

Ontologia Operacional FSTech

Pin/Spec Protocol v2. Como operar agentes de IA em produção com estado auditável, sem memória persistente no modelo.

Autor Felipe Silva
Versão 1.0
Data Abril 2026
Licença CC BY 4.0
Agentes baseados em LLM se tornam production-ready quando operam dentro de um envelope de controle explícito, não quando o modelo fica mais inteligente.
Loop operacional da Ontologia Operacional FSTech: três nós luminosos interconectados formando um ciclo contínuo

1. Contexto e Problema

Agentes baseados em LLM enfrentam três problemas estruturais quando saem do protótipo e entram em produção real.

Falta de auditabilidade. Não há registro estruturado do que o agente decidiu e por quê. Logs de execução mostram o quê, raramente o porquê. Quando o agente age errado, reconstruir a cadeia causal é forense, não engenharia.

Perda de estado entre execuções. Cada chamada começa do zero sem contexto das anteriores. A tentativa comum é persistir via bancos vetoriais ou embeddings, o que transfere o problema: o agente agora lembra de forma difusa, sem garantia de quais fatos sobreviveram.

Validação circular. O modelo valida a si mesmo. Pergunta ao LLM se a resposta está correta, e ele confirma. Sem camada externa de controle, a validação é ruído treinado para soar confiante.

O Framework de Ontologia Operacional FSTech resolve os três com uma estrutura documental mínima executada em ciclo. Sem infraestrutura adicional, sem memória persistente no modelo, sem dependência de stack específica.

2. Tese Central

Um agente de IA é production-ready quando opera dentro de um envelope de controle explícito, com estado auditável entre execuções, e quando a memória vive no documento, não no modelo.

O framework é agnóstico de modelo (roda com Claude, GPT, Gemini, modelos locais) e de infraestrutura (não requer banco vetorial, orquestrador específico ou pipeline customizado). A única dependência é um filesystem e disciplina documental.

Um corolário direto segue dessa premissa: porque a memória vive no filesystem e não no modelo, o agente é portável entre provedores sem perda de estado. Trocar de modelo amanhã não apaga o que ele aprendeu ontem.

3. Fundação: A Tríade D+L+A

A Ontologia Operacional se sustenta numa decomposição de primeiros princípios: todo sistema de gestão real tem três componentes atômicos, não mais.

DADOS (D). As entidades do negócio. Leads, clientes, projetos, contratos, faturas. Tudo que existe no mundo real e precisa ser representado no sistema. Extração e estruturação do conhecimento disperso em sistemas legados, documentos e memórias dos operadores.

LÓGICA (L). As regras de relação. Scoring, classificação, priorização, condições de ativação. A inteligência do negócio mapeada de forma que o sistema possa inferir. São as leis que governam o comportamento.

AÇÃO (A). O write-back acionável. Automações, notificações, atualizações de estado, mensagens enviadas. O estágio onde o insight se transforma em execução real no ambiente operacional.

A estrutura clássica é linear: D para L para A. A observação da prática mostra que o loop é contínuo: ações geram dados novos, que alimentam lógica refinada, que produz ações melhores. Projetar um sistema linear é projetar um sistema que morre no primeiro ciclo.

Diagrama da tríade Dados, Lógica e Ação: três nós luminosos conectados em loop contínuo, cada um representando uma das camadas da Ontologia Operacional
A tríade D+L+A como loop contínuo. Cada ação gera novos dados que alimentam lógica refinada.

Implicação operacional. Ao projetar qualquer automação, a pergunta canônica não é "o que acontece quando executarmos" mas "o que acontece depois da ação". Se a resposta é nada, o sistema é linear, e linear significa frágil.

Metáfora para clientes. O negócio tem substantivos (clientes, pedidos, contratos), verbos (cobrar, notificar, consultar) e gramática (regras de priorização, scoring, escalação). Um sistema operacional existe quando todas as frases do negócio estão escritas e o sistema sabe executá-las. Dados são substantivos. Lógica é gramática. Ação são verbos.

4. Componentes Executáveis

O framework implementa D+L+A como três artefatos documentais mínimos. Cada artefato é um arquivo de texto, versionado, legível por humano e por modelo.

Três artefatos documentais do framework: Pin como invariante ancorado, Spec como checklist vivo, Handoff como ponte de memória entre ciclos
Pin, Spec e Handoff. Três artefatos documentais mínimos que implementam D+L+A.

4.1 Pin (Invariante) — D + L

Arquivo imutável que descreve o que o projeto é. Propriedades verdadeiras independente do estado atual: regras, identidade, limites, restrições.

O Pin funciona como invariante de sistema. Complexidade cognitiva escala de forma quadrática com o tamanho do projeto, mas invariantes mudam raramente. Quando há dúvida sobre o projeto, o agente consulta o Pin, porque ele opera no espaço de menor complexidade. Fundamentação matemática vem de Lamport, provas por invariante em sistemas concorrentes.

O que vai no Pin:

O que não vai no Pin:

4.2 Spec (Comportamento) — L + A

Arquivo vivo que descreve o que fazer. Checklist sequencial de tarefas. A complexidade escala de forma exponencial com o número de tarefas e dependências, por isso a Spec é mais volátil que o Pin.

A Spec é o espaço comportamental. Cada tarefa concluída é marcada e gera aprendizado. Tarefa marcada como concluída é imutável, nunca desmarca. Se o resultado tem defeito, cria nova tarefa corretiva referenciando a original. Mesmo princípio do Git: commits são imutáveis, correções são novos commits.

Princípio da auto-contenção. Toda tarefa numa Spec precisa sobreviver ao handoff. Quem escreve a tarefa raramente é quem a executa, pode ser outro agente, outra sessão, outro dia. Uma tarefa que depende de contexto implícito para ser entendida morre no momento em que o contexto morre. Por isso, cada entrada da Spec carrega uma camada de metadados suficiente para que qualquer executor posterior saiba o que fazer, por que aquilo existe, de onde veio a demanda e qual o caminho mínimo de implementação. A FSTech padroniza esses metadados em uma convenção interna, refinada continuamente pela prática. A ausência desse padrão é o anti-pattern canônico da Spec: "fazer X" sem contexto adjacente é fratura silenciosa que só aparece no próximo ciclo, quando o executor seguinte não sabe mais o que aquilo significava.

4.3 Handoff (Memória) — A para D

Registro estruturado que alimenta o próximo ciclo. Não é log de execução (o quê), é registro de estado (onde estamos, por que paramos, o que precisa continuar).

Handoff contém:

O handoff é a memória. O modelo não precisa de persistência de estado próprio, porque o handoff da sessão N alimenta o boot da sessão N+1. Cada novo ciclo começa com contexto completo em minutos, sem banco vetorial, sem embeddings, sem memória stateful.

Uma distinção fina importa: isto não é "zero persistência". O filesystem persiste, a ontologia persiste, o handoff persiste. O que é zero é estado mantido dentro do modelo. A memória vive no documento, não no peso da rede neural.

5. Ciclo de Execução

O framework opera em quatro fases. Cada fase é explícita, cada fase gera artefato.

Ciclo de execução em quatro fases conectadas em loop: Boot com carregamento de documento, Executar, Write-back com verificação, e Handoff como ponte
Boot → Executar → Write-back → Handoff. Um ciclo que fecha sobre si mesmo a cada sessão.

Boot

Carregar Pin e Spec do projeto no início da sessão. Em sistemas com múltiplos agentes, o boot também carrega memória compartilhada (índice global) e a última entrada do handoff.

Executar

Resolver tarefas na mesma sessão. Quantas a sessão comportar com qualidade. O limite não é número de tarefas, é degradação perceptível de contexto.

Execução paralela (Wave). Quando a Spec tem três ou mais tarefas independentes, o agente principal dispara sub-agentes em paralelo com contexto isolado. O principal preserva contexto para orquestração e raciocínio. Dependências são respeitadas: tarefa B que depende de A espera A concluir.

Contexto isolado por tarefa pesada. Para tarefas que envolvem leitura extensiva (análise de codebase, pesquisa, auditoria), delegar a sub-agente mesmo que sejam sequenciais. O sub-agente opera em contexto fresco, sem acumular resíduo. Isso evita degradação de qualidade por acúmulo de contexto irrelevante.

Write-back (Commit Atômico)

A cada tarefa concluída:

Verificação pré-done (Gate programático). Antes de marcar qualquer tarefa como concluída, o agente executa uma verificação proporcional ao risco da ação. Tarefas de baixo impacto (documentação, configuração local, registro) passam por uma releitura de coerência. Tarefas de impacto médio (features, integrações, refatorações) exigem teste funcional com comportamento observado. Tarefas de alto impacto, qualquer coisa que toque segurança, infraestrutura compartilhada ou dados de clientes, exigem o grau mais rigoroso de verificação: teste adversarial, revisão manual, e disciplina explícita contra as classes de vulnerabilidade conhecidas. O rigor não é uniforme porque o custo do erro não é uniforme.

Anti-pattern canônico. Verificação não é "rodei e não deu erro". É "tentei quebrar e não consegui". Para qualquer tarefa de alto impacto, o teste deve incluir tentativas adversariais explícitas, não basta observar que o caminho feliz funciona.

Handoff

Encerrar a sessão quando:

Procedimento: sempre nova sessão, nunca compactação. Compactação é compressão lossy. Ela perde nuance, perde causalidade e paga um custo de contexto logo na abertura da sessão seguinte. Uma sessão nova com boot via Pin e Spec começa leve, recupera o estado completo a partir do que está documentado no filesystem e preserva a fidelidade dos fatos. Compactação é o patch que existe para quem não tem write-back estruturado. Com write-back, compactação é o caminho errado.

Por que Handoff não é apenas outra compactação. Uma objeção natural neste ponto é que o Handoff também é escrito pelo modelo, então ele também seria compressão lossy. A objeção é legítima e a resposta importa. Handoff e compactação são dois atos distintos, não dois nomes para o mesmo ato. Compactação é uma heurística automática aplicada ao histórico inteiro de uma sessão, sem objetivo explícito além de reduzir tokens. O modelo não sabe o que vai importar amanhã, então faz uma aposta conservadora e perde causalidade no processo. Handoff é escrito com intenção explícita de continuidade. O modelo sabe que está produzindo um artefato para reengajamento futuro, e por isso preserva seletivamente o que a próxima sessão precisará: decisões tomadas e suas justificativas, tarefas executadas e seus resultados, bloqueios encontrados, briefing de continuação. A assimetria não está no ato de escrever, está no propósito. Um é reação, o outro é protocolo. A perda de fidelidade existe nos dois, mas é qualitativamente diferente: compactação perde o que não parece importante no momento da compressão, Handoff preserva o que foi decidido que importa para o próximo ciclo.

6. Mapeamento D+L+A nos Componentes

CamadaOnde viveO que contém
Dados (D)Pin + contexto herdado do Handoff anteriorEntidades, regras, estado inicial
Lógica (L)Pin (rotas) + Spec (tarefas) + Gate pré-doneRegras de decisão e validação externa
Ação (A)Execução + HandoffWrite-back no sistema real, memória para o próximo ciclo

A validação externa (Gate pré-done) é o que elimina a circularidade. O agente não valida a si mesmo nas questões verificáveis externamente. Schema, permissões, estado de dependências, tudo é checado por código, não por opinião do modelo. A parte que é validação semântica (coerência com contrato, suficiência de dados) continua no modelo, mas com risco isolado: se falhar, gera bloqueio documentado, não tentativa cega.

7. Write-Back Obrigatório

If you think you know something but don't write it down, you only think you know it. — Leslie Lamport

Write-back não é apenas registro. É o próprio ato de pensar. Formular em texto revela lacunas, forçando precisão que o pensamento interno não exige. Quem sabe mas não escreve está no nível do conforto cognitivo, não do conhecimento validado.

Toda percepção, insight ou decisão gera write-back:

Métrica: ciclo insight para write-back menor que um dia.

Teste: se é difícil de escrever, a ideia ainda não está madura. A dificuldade de formulação revela imprecisão de pensamento, não do texto.

Insight sem alteração do sistema real é lixo computacional.

8. Case Real: FSTech em Produção

O framework não é especulação. A FSTech opera sua frota interna de agentes neste framework há seis meses em produção, cinco canais ativos, múltiplos clientes.

Frota operando sob o framework:

Todos compartilham a estrutura do framework. Cada um tem seu Pin (regras imutáveis do domínio), seu diretório de Specs (tarefas em execução), e seu histórico de handoffs. A mesma disciplina documental que governa a frota também governa os agentes entregues a clientes, por desenho.

Prova técnica de portabilidade. Ao longo dos seis meses de operação, a frota migrou entre modelos sem perder estado acumulado. Ares rodou com Claude em diferentes versões, Ontos opera parcialmente sobre modelos locais (Gemma), Finn mescla provedores comerciais conforme o custo por cliente. Em nenhuma dessas transições o conhecimento acumulado foi perdido, porque o conhecimento nunca esteve no modelo. Estava no Pin, no Spec e no Handoff, exatamente onde a disciplina mandava que estivesse.

Case externo validado. A Ontologia Operacional foi adotada organicamente por uma empresa cliente (VJ Turrini) após um mês de contato. A adoção não foi venda, foi osmose. A operadora começou a consultar o agente via WhatsApp para tarefas reais, confiança se formou, automação seguiu depois. Este é o caminho natural: consulta, confiança, automação. Não o inverso.

9. Posicionamento

O framework não compete com frameworks de orquestração de chamadas (LangChain, CrewAI, AutoGen). Complementa. Esses frameworks resolvem como o agente chama ferramentas. O Framework de Ontologia Operacional FSTech resolve como o agente mantém estado auditável entre chamadas e execuções.

AspectoOrquestração de chamadasFramework FSTech
CategoriaOrquestração de chamadasControle de estado e execução
DependênciaStack específicaAgnóstico de modelo e de infra
AuditabilidadeLogs de execuçãoHandoff estruturado em documento
MemóriaPersistente (banco vetorial, embeddings)Documental (filesystem)
RelaçãoPode rodar sobre qualquer umPode rodar sob qualquer um

Comparativo com referências internacionais:

9.1 Soberania de Memória

Há um debate recente no setor sobre quem controla a memória dos agentes de IA. A preocupação é legítima. Quando a memória vive dentro do modelo, dentro do provider, dentro de um harness proprietário, quem usa o agente não controla seu próprio estado. Trocar de provider significa começar do zero. Atualizar o modelo significa torcer para que o conhecimento acumulado ainda funcione. A memória vira ativo do fornecedor, não do operador. A resposta comum a esse problema tem sido defender harnesses abertos e runtimes independentes como camada de soberania.

O Framework de Ontologia Operacional FSTech resolve esse problema por construção, não por adesão a um padrão externo. Como a memória vive em artefatos de filesystem versionados (Pin, Spec, Handoff) e não no peso do modelo nem no cache do provider, a frota é portável por desenho. Um agente que rodou com Claude ontem pode rodar com Gemini amanhã, com GPT na semana seguinte, com um modelo local depois, e o estado acumulado continua válido. O Pin é o mesmo documento. O Handoff é o mesmo arquivo. O contexto sobrevive à troca de modelo porque o contexto nunca esteve no modelo em primeiro lugar.

Isso não é uma feature adicionada para atrair quem teme lock-in. É consequência direta do princípio inicial de que a memória vive no documento. O framework não foi desenhado para resolver soberania e acabou ficando portável, foi desenhado para ter estado auditável e ganhou portabilidade como corolário. Quando o debate do setor chegou, o framework já operava do lado correto dele por seis meses.

10. Validação N5

Todo componente do framework passa pelo N5, metodologia proprietária de validação analítica desenvolvida pela FSTech. O N5 aplica cinco critérios hierárquicos sobre qualquer solução ou sistema antes de considerá-lo production-ready. A hierarquia interna prioriza evidência empírica sobre elegância teórica.

O Framework de Ontologia Operacional FSTech foi validado pelos cinco critérios do N5 antes de ser publicado. O critério Empirical, tipicamente o mais difícil, é satisfeito pelos seis meses de operação da frota interna e pelo caso externo adotado organicamente. Detalhes completos da metodologia N5, incluindo os cinco critérios, a hierarquia de resolução e o algoritmo de aplicação, estão disponíveis sob acordo de parceria com a FSTech.

11. Limites e Quando Não Usar

Um framework honesto declara onde não se aplica. O Framework de Ontologia Operacional FSTech não é adequado para:

Se o sistema que você constrói cabe em alguma dessas categorias, o framework é overhead. Use algo mais leve.

11.1 Lacuna Empírica Declarada

Um framework publicado honestamente também declara onde a própria evidência é insuficiente. Este é esse parágrafo.

A prova apresentada nas seções anteriores (seis meses de operação, cinco agentes, caso VJ Turrini adotado organicamente) é evidência operacional, não métrica quantitativa. Não há neste documento: taxa de falha de boot, tempo médio de recuperação por handoff, número de ciclos executados por sessão, percentual de decisões preservadas entre transições de modelo, ou comparação controlada contra baseline sem write-back. A ausência é real. Um revisor técnico rigoroso vai apontar esta lacuna e a aponta corretamente.

Há duas respostas possíveis. A primeira é reconhecer que a disciplina de write-back que o próprio framework prescreve torna essas métricas produzíveis. Cada ciclo executado deixa rastro: Pin versionado, Spec com tarefas marcadas, Handoff escrito, git log. O material bruto existe, apenas não foi compilado em relatório público até esta versão.

A segunda é reconhecer o limite da afirmação que se faz sem essas métricas. Até que sejam publicadas, a tese empírica deste framework é: "operamos isso em produção há seis meses sem perda de estado entre transições de modelo". Isso é verdade e verificável por terceiros que quiserem conversar diretamente. Mas não é o mesmo que dizer "nossa taxa de falha de boot é X, comparada a Y do baseline sem write-back". Essa afirmação mais forte precisa ser publicada separadamente, com dados, e será.

Roadmap empírico (compromisso público):

Enquanto essas publicações não existem, leia este framework como descrição de mecanismo e convite à verificação, não como artigo científico com métricas arbitradas. A prática veio antes da publicação, a publicação veio antes das métricas formais, e as métricas formais virão antes da próxima versão.

12. Este Documento é um Snapshot

Uma observação final sobre a natureza deste texto. O framework aqui descrito não é um estado final. É o recorte de abril de 2026 de um sistema que continua em movimento, exatamente através do ciclo que descreve. Cada componente (Pin, Spec, Handoff) é refinado pelo próprio write-back que ele governa. Cada afirmação deste documento foi produzida dentro do framework e, portanto, é passível de ser revisada pelo próximo ciclo.

Isso tem uma implicação importante. Adotar o framework não é adotar uma especificação estática. É entrar em um loop de refinamento onde a estrutura se adapta ao domínio enquanto mantém a disciplina documental. A diferença entre um protocolo morto e um sistema vivo é que o primeiro para quando a especificação é publicada, e o segundo trata a publicação como mais um evento de write-back, não como linha de chegada.

Em termos da tríade, o framework é Dados (estrutura documental), Lógica (ciclo de execução) e Ação (write-back obrigatório), aplicado recursivamente a si mesmo. Publicar esta versão é o write-back da operação que a produziu. A próxima versão já está sendo escrita no próximo handoff.

13. Próximos Passos

Este documento é a versão pública do framework que a FSTech opera internamente. A versão interna inclui:

A versão pública é suficiente para adoção em projetos reais. Organizações que quiserem acelerar adoção, aplicar o framework a domínios específicos ou obter a metodologia N5 aplicada podem contatar a FSTech diretamente.

Sobre a FSTech

A FSTech é uma consultoria brasileira focada em operacionalizar negócios através de ontologias executáveis e agentes de IA em produção. O produto é a operação, não o documento. Clientes contratam a execução do framework, não licenciam o framework em si.

Fundador: Felipe Silva
Site: fstech.digital
Contato: fstech.digital/contato

Framework de Ontologia Operacional FSTech v1.0 • 2026-04-11 • Licenciado sob CC BY 4.0