I. Conclusão desta secção

Esta secção já não acrescenta novas linhas de julgamento ao nível dos objetos; acrescenta antes um conjunto de regras de escrutínio mais frias, mais duras e menos confortáveis. Enquanto a EFT quiser contar como «apoio» os resíduos de desvio para o vermelho, o fecho do mapa de base partilhado, a estratificação estrutural, as texturas finas perto do horizonte, os limiares dos dispositivos de fronteira e as salvaguardas quânticas tratados entre 8.4 e 8.11, terá primeiro de aceitar quatro salvaguardas unificadas: os conjuntos de reserva não permitem reajustar retroativamente o critério; o cegamento não permite espreitar a resposta; as verificações nulas não podem tornar-se significativas juntamente com o resultado principal; a replicação entre fluxos de análise não permite que uma única rota monopolize a verdade. Sem estas quatro portas, o Volume 8, por mais impressionante que seja, ainda pode não passar de uma narrativa de grande poder explicativo; depois de atravessá-las, começa a parecer uma teoria candidata disposta a submeter-se a auditoria.


II. Depois da camada dos objetos, é preciso acrescentar uma comporta metodológica geral

As secções anteriores, de 8.4 a 8.11, já puseram em cima da mesa todos os campos de batalha ao nível dos objetos em que a EFT mais quer ganhar e em que também mais facilmente pode sair ferida: o termo comum sem dispersão entre sondas, o eixo TPR e os resíduos PER, o mapa de base partilhado entre rotação, lente e fusão, a génese estrutural, a película de fundo e a tomografia ambiental, as assinaturas distintivas perto do horizonte e na fronteira, os dispositivos de fronteira e o vácuo em campo forte, bem como a propagação quântica e a salvaguarda de não comunicação. Mas não basta escrever «o que medir», «que resultado conta como apoio» e «que resultado causa dano estrutural». A própria linguagem da EFT tem grande poder explicativo, e uma teoria com grande poder explicativo não teme antes de tudo a falta de casos; teme que, havendo casos a mais, todos possam ser encaixados depois do facto.

O que faltava antes era uma comporta geral: qualquer resultado que queira pontuar tem primeiro de mostrar que venceu dentro da mesma disciplina metodológica. Só depois de esta comporta estar clara é que a conta final pode distinguir entre «apoio direto», «estreitamento» e «dano estrutural». Caso contrário, transforma-se demasiado facilmente num livro de méritos feito por seleção posterior de exemplos.


III. Esta secção não acrescenta famílias experimentais; acrescenta disciplina de julgamento

Esta secção não deve ser escrita como um manual de estatística. Isso arrefeceria de repente o Volume 8 e desviaria a atenção do que ele realmente tem de fazer. A 8.12 não vem ensinar ao leitor o que são conjuntos de treino, conjuntos de teste, significância, fatores de Bayes ou média de modelos; faz apenas uma coisa mais severa: pergunta como impedir que a EFT se engane a si própria.

Por isso, as quatro regras da 8.12 não são gestos técnicos isolados. Todas giram em torno de uma mesma disciplina geral: congelar o critério antes; depois dos resultados, só registar contas, não mudar o discurso. Como se escolhem as amostras, que objetos entram na amostra principal, que bandas de frequência ou camadas de desvio para o vermelho ficam apenas em reserva, que indicadores ambientais entram na análise principal, que cláusulas de exclusão são válidas e que regras de pontuação contam como acerto têm de estar escritos antes de se olhar para o resultado principal. Sem este passo, os conjuntos de reserva acabam por ser usados em segredo, o cegamento vira encenação, as verificações nulas são escolhidas pelas mais fracas, e a replicação entre fluxos de análise degrada-se em «correr duas vezes o mesmo viés».

Tão importante como isso é separar os papéis. Muitas experiências e observações do Volume 8 prestam-se naturalmente a uma arquitetura comum: o grupo de previsão antecipada só publica cartões de previsão com base no ambiente, na geometria e em proxies já congelados; o grupo de medição extrai as leituras sem conhecer o conteúdo desses cartões; e o grupo de arbitragem só no fim alinha previsão e resultado segundo uma tabela de pontuação pré-registada. Nem todas as linhas têm de copiar mecanicamente estes três grupos, mas esta arquitetura lembra o ponto mais importante da secção: a previsão tem de vir antes da imagem bonita, e a regra antes da história elegante.


IV. Primeira salvaguarda: conjuntos de reserva — não usar resultados para reajustar retroativamente o critério

Na 8.12, o conjunto de reserva não é uma verificação suave de «capacidade de generalização», mas uma lâmina feita especificamente para impedir reajustes retroativos. O erro que a EFT corre mais risco de cometer não é não ver sinal nenhum; é ver uma direção ténue e, a partir daí, continuar a ajustar amostras, estratos ambientais, limiares, critérios de fundo e famílias de ajuste até aquela direção se transformar numa figura bonita. A função do conjunto de reserva é fechar essa rota de fuga: pode-se definir o critério na parte de treino, mas não se pode trazer de volta a parte reservada para reparar aquilo que já foi afirmado.

Na cosmologia, o conjunto de reserva pode ser uma janela de desvio para o vermelho, uma classe de fontes, uma região do céu, uma versão de levantamento, ou até uma cadeia independente inteira de distâncias; no universo extremo, pode reservar vários objetos, várias épocas, vários sectores azimutais, vários enxames em fusão ou vários níveis ambientais; nos blocos laboratoriais e quânticos, pode reservar uma janela de parâmetros, uma classe de materiais, um equipamento, ou um conjunto de níveis de varrimento perto do limiar cujos rótulos ainda não foram abertos. As formas podem diferir, mas a disciplina é uma só: a reserva valida; não afina parâmetros em sentido inverso.

O resultado de reserva que realmente acrescenta pontos à EFT não é uma tendência já vista no treino que, na reserva, ainda «se parece um pouco». É direção que não se inverte, ordenação que não se desagrega e critério que não muda. Por exemplo, se o termo comum da 8.4 for realmente uma cor de base comum sem dispersão, então, ao mudar para bandas, janelas de eventos ou estações reservadas, deve pelo menos preservar o mesmo sentido e a mesma janela; se o eixo TPR da 8.5 realmente conseguir absorver a cor de base, então, ao mudar para classes de fonte ou regiões do céu reservadas, o α universal não deve mudar logo de discurso; se o mapa de base partilhado da 8.6 não for uma colagem de casos, então, quando o mapa congelado for aplicado a objetos reservados, não deve exigir de imediato um novo conjunto de remendos. Pelo contrário, assim que uma tendência entra na reserva e muda de sentido, perde a ordem ou precisa de nova seleção de amostras, deixa de ser conclusão principal e volta a ser apenas uma pista.

É preciso acrescentar mais uma frase: os conjuntos de reserva não podem reservar apenas «a parte mais fácil de passar». Se a teoria deixar para o fim as amostras mais limpas, mais familiares e mais agradáveis, enquanto usa repetidamente no treino as regiões de alto risco, as bandas difíceis de calibrar, os objetos complexos e as janelas de parâmetros próximas do limiar, então a chamada reserva já está contaminada. Uma reserva verdadeira deve incluir de propósito as unidades mais capazes de desmentir a teoria, porque o objetivo do Volume 8 não é elevar a probabilidade de vitória; é tornar duras as condições de vitória e derrota.


V. Segunda salvaguarda: cegamento — deixar a previsão falar antes da figura bonita

O valor do cegamento não está em parecer, formalmente, «mais científico»; está em obrigar a teoria a dizer antecipadamente onde realmente arrisca. Há demasiados pontos em que a EFT poderia, depois de ver a figura, acrescentar uma explicação: o termo comum parece reforçado pelo ambiente, logo se diz que esse reforço já era esperado; certo viés parece mais forte no ambiente de nós, logo se diz que a ossatura devia comportar-se assim; uma plataforma aparece depois do limiar num dado sistema, logo se diz que isso corresponde à discreção de limiar. Se estas frases não foram escritas antes dos resultados, não são previsões; são retórica retrospectiva.

Por isso, o cegamento exigido pela 8.12 não se limita a tapar nomes de ficheiros ou a baralhar rótulos de amostras. O que mais importa para a EFT é um cegamento estruturado em previsão antecipada, medição e arbitragem. Na fase de previsão antecipada, a teoria só pode usar indicadores ambientais, informação geométrica, parâmetros materiais ou livros de contas históricos já congelados para escrever cartões de previsão: que nível deve ser mais forte, que nível deve ser mais fraco, se o sentido esperado é o mesmo ou o oposto, se o resultado deve manter-se sem dispersão, se deve aparecer dentro da mesma janela. Na fase de medição, quem extrai o sinal não pode saber o que está escrito no cartão. Na fase de arbitragem, um terceiro contabiliza acertos, sentidos errados e disparos vazios segundo regras congeladas. Só assim a EFT está realmente a pôr o próprio pescoço em risco.

O cegamento pode assumir formas muito diferentes em blocos diferentes. As secções 8.4 e 8.5 podem cegar a estratificação ambiental e os rótulos de classe de fonte; de 8.6 a 8.9 podem cegar o campo de direção da ossatura, a fase da fusão, o nível da mancha fria, o modelo azimutal perto do horizonte ou a classificação dos objetos; em 8.10 e 8.11, faz mais sentido cegar lotes de material, níveis de limiar, ordem de acionamento, graus de limpeza da ligação e até se determinado caso pertence ou não a uma janela de parâmetros reservada. O essencial não é uniformizar a forma, mas a disciplina: dizer primeiro o que deve acontecer e só depois verificar se aconteceu, em vez de ver primeiro o que apareceu e depois dizer que já se sabia.

O cegamento tem ainda um valor que se esquece facilmente: obriga a EFT a distinguir o que é previsível por antecipação do que é explicável depois do facto. No papel, ambas as coisas parecem «acertar», mas o seu estatuto científico é completamente diferente. A primeira arrisca antes do resultado; a segunda procura, depois do resultado, uma sintaxe que o acomode. É a primeira que a 8.12 quer proteger, porque só ela consegue alterar de facto a probabilidade de vitória da teoria.


VI. Terceira salvaguarda: verificações nulas — não confundir artefactos com nova física

Muitas linhas de julgamento da EFT gostam de ler estruturas «fracas mas disciplinadas»: termo comum sem dispersão, monotonia ambiental, escalamento co-localizado, plataformas pós-limiar, acertos por previsão antecipada, mapa de base partilhado entre sondas. Precisamente porque esses sinais muitas vezes não são grandezas totais esmagadoras, mas antes ordenações, sinais, janelas comuns, resíduos e estratos, podem também ser forjados em silêncio por sistemáticas, funções de seleção, deriva de calibração, vieses de modelo e hábitos da cadeia de análise. A função das verificações nulas é construir um tribunal para esses artefactos.

As verificações nulas suficientemente duras têm de incluir pelo menos duas classes.

As verificações nulas não são figurantes, nem devem aparecer apenas como uma formalidade em anexo. Para a 8.4, se a inversão temporal, a permutação de bandas e os controlos dispersivos também produzem um «termo comum de atraso nulo», o resultado principal não se sustenta; para a 8.6 e a 8.7, se a rotação aleatória da ossatura ou a perturbação do mapa de base mantêm a suposta co-linearidade e o fecho de mapa, o resultado parece mais viés algorítmico; para a 8.9, se as texturas finas perto do horizonte se tornam igualmente significativas ao trocar a abertura de imagem e a direção do modelo, a assinatura distintiva está a alimentar-se da cadeia de processamento; para a 8.10 e a 8.11, se configurações substitutas, cargas falsas, cavidades vazias, contas clássicas desligadas ou controlos de pseudolimiar também produzem «sinais novos», a chamada nova física está apenas a dar voltas dentro do instrumento. Se o resultado principal não preserva especificidade diante das verificações nulas, não tem direito a subir ao estatuto de apoio.

Além disso, para lá das verificações nulas, é preciso haver controlos positivos. O fluxo deve falhar corretamente quando «não há estrutura EFT», mas também deve ter sucesso corretamente quando uma estrutura conhecida é injetada ou quando uma física conhecida deve aparecer. Se uma cadeia de análise não consegue quebrar artefactos, nem recuperar sinais conhecidos, o seu resultado principal não tem qualquer direito a pontuar. No Volume 8, as verificações nulas não servem apenas para desmontar; servem para bloquear em conjunto a exigência de «ter sucesso quando deve ter sucesso, falhar quando deve falhar».


VII. Quarta salvaguarda: replicação entre fluxos de análise — não deixar uma única rota monopolizar a verdade

Uma das vitórias mais perigosas no Volume 8 é aquela que deixa de existir assim que muda o percurso de tratamento de dados. Muitas grandezas que interessam à EFT dependem, por natureza, de cadeias complexas de extração: como se subtrai o fundo, como se extrai a ossatura, como se inverte a lente, como se reconstrói a imagem anular, como se identifica um limiar, como se sincroniza o fluxo bruto, como se separam ruído e pós-seleção. Se qualquer destes passos depender fortemente dos hábitos por defeito de uma equipa, um resultado bonito numa única cadeia nunca pode ser promovido automaticamente a conclusão física.

Por isso, a replicação entre fluxos de análise da 8.12 não é correr duas vezes o mesmo código com uma semente aleatória diferente. O que ela exige é independência real: cadeia de pré-processamento independente, modelo de fundo independente, método independente de extração da ossatura ou reconstrução de imagem, família de ajuste independente, rota de calibração independente e, idealmente, também equipa, instituição e versão de hardware independentes. Para dados astronómicos, isso significa que produtos de levantamento diferentes, canais de imagem ou inversão diferentes e coleções de macromodelos diferentes têm de apontar no mesmo sentido; para dados laboratoriais, significa que equipamentos, software de controlo, cadeias de aquisição e tratamento posterior diferentes não podem inverter o resultado à vontade.

A EFT não precisa aqui que todos os fluxos de análise entreguem respostas numericamente idênticas. O que ela realmente precisa é mais simples e mais difícil de falsificar: sinal principal consistente, ordenação principal consistente, estrutura principal consistente. Se um sinal só se mantém com uma subtração de fundo específica, uma regularização de reconstrução específica, uma base de modelos específica ou uma janela de pós-seleção específica, e se se desagrega quando entra outro fluxo razoável, então o Volume 8 deve escrever honestamente não «controverso mas muito promissor», mas «por enquanto, apenas uma indicação dependente da cadeia de tratamento».

A replicação entre fluxos de análise tem ainda de acabar em livros de contas abertos e recalculáveis. Nem todas as equipas têm de publicar, de uma só vez, todos os ficheiros intermédios sem reserva, mas os avaliadores externos devem pelo menos conseguir ver os pontos de decisão essenciais: que amostras foram excluídas, que parâmetros foram congelados, que unidades de reserva não foram tocadas, que verificações nulas falharam, que fluxos independentes discordaram. Se estes livros de contas ficarem apenas nas mãos da equipa original, o mundo exterior dificilmente distinguirá «isto é um fenómeno complexo» de «isto é um processo complexo».


VIII. Por que as quatro salvaguardas têm de funcionar em paralelo, e não como rituais separados

Fazer apenas conjuntos de reserva sem cegamento permite que alguém veja primeiro a tendência e escolha depois uma reserva «razoável»; fazer cegamento sem verificações nulas permite que ninguém tenha espreitado a resposta e, ainda assim, confunda um artefacto sistemático com uma surpresa; fazer verificações nulas sem replicação entre fluxos de análise permite que uma rota carregue o mesmo viés tanto no resultado principal como nos controlos; fazer replicação entre fluxos de análise sem conjuntos de reserva permite perfeitamente que várias equipas, juntas, sobreajustem o treino até quase parecer profecia. As quatro salvaguardas não são quatro ornamentos; são uma cadeia.

Por isso, a 8.12 tem de rejeitar explicitamente uma lógica compensatória muito comum: «não fizemos reserva, mas cegámos»; «as verificações nulas são medianas, mas a consistência entre fluxos é boa»; «a replicação independente ainda não existe, mas o treino é lindíssimo». Esse modo de pontuar talvez funcione em divulgação; numa auditoria, é irregular. O Volume 8 não está a lutar por uma «impressão geral»; está a perguntar se a teoria fica de pé sob as regras mais desfavoráveis. Se uma porta crítica não foi atravessada, não se pode compensá-la com o brilho de outra.


IX. Como estas quatro salvaguardas descem de 8.4 a 8.11

Em 8.4 e 8.5, a tarefa central das quatro salvaguardas é impedir que o «termo comum» e a partilha de contas TPR / PER sejam costurados depois do facto. Aqui, os conjuntos de reserva devem idealmente reservar classes de fonte, regiões do céu, bandas de frequência e janelas de eventos; o cegamento exige que se congelem antes os cartões de previsão ambiental e as regras de partilha entre grandeza principal e resíduos; as verificações nulas devem privilegiar substitutos de leis dispersivas, inversão temporal, permutação de rótulos e permutação de estações; a replicação entre fluxos de análise deve cobrir, no mínimo, a cadeia de tratamento do desvio para o vermelho, a cadeia de tratamento de atrasos temporais, cadeias independentes de distância e cadeias de modelação de lente. Sem estas salvaguardas completas, 8.4 e 8.5 regressam facilmente a «esta figura também se parece, aquela também se consegue contar».

Em 8.6 a 8.9, a missão das quatro salvaguardas é impedir que o mapa de base partilhado, a direção da ossatura, as texturas finas perto do horizonte e as assinaturas distintivas de fronteira se degradem em hermenêutica de imagem. Aqui, os conjuntos de reserva devem usar mais objetos reservados, épocas reservadas, camadas de desvio para o vermelho reservadas, fases de fusão reservadas e unidades de linha de visada reservadas; o cegamento pode incidir sobre campos de direção da ossatura, níveis ambientais, modelos azimutais, classificação de objetos e cartões de previsão de marca; as verificações nulas devem insistir sobretudo na rotação de modelos, ossaturas aleatórias, máscaras aleatórias, controlos fora do eixo, falsos pontos quentes / falsos pontos frios, deslocação e reamostragem; a replicação entre fluxos de análise exige que algoritmos diferentes de ossatura, reconstruções de massa diferentes, esquemas de imagem diferentes e cadeias diferentes de extração de atrasos temporais deem conclusões no mesmo sentido.

Em 8.10 e 8.11, as quatro salvaguardas não podem afrouxar. O bloco laboratorial é precisamente o mais propenso a pseudo-vitórias do tipo «o sinal é bonito, mas só existe neste equipamento e neste script de tratamento». Aqui, o conjunto de reserva pode ser uma janela inteira de parâmetros, uma classe inteira de materiais, uma máquina inteira ou um lote inteiro de chips; o cegamento pode recair sobre níveis de limiar, rótulos de material, ordem de acionamento e graus de limpeza da ligação; as verificações nulas têm de incluir configurações substitutas, cavidades vazias, cargas falsas, polaridade inversa, controlos de ligação interrompida, desalinhamento temporal e injeção-recuperação; a replicação entre fluxos deve avançar, de preferência, para instituições, hardware e software de controlo independentes, com especial cuidado para tornar públicos, por duas vias, o livro de contas bruto e o livro de contas da pós-seleção. Só assim o Volume 8 evita transformar contingência de engenharia em nova credencial da EFT.


X. Que tipo de resultado metodológico apoia realmente a EFT

Do ponto de vista da 8.12, o que apoia realmente a EFT não é uma classe de objetos que «parece mais EFT», mas o facto de a EFT aceitar as regras menos favoráveis e, mesmo assim, ganhar acertos estruturais em várias linhas de julgamento. Em termos concretos, devem aparecer pelo menos várias coisas em conjunto:

Se estas condições não se verificarem apenas numa linha fina e isolada, mas em várias famílias entre 8.4 e 8.11 ao mesmo tempo, então a EFT escapa, pela primeira vez, ao seu rótulo mais perigoso: «uma teoria que sabe contar histórias». Isso significaria que ela não só consegue explicar objetos, mas aceita que a sua autoridade explicativa seja comprimida pela metodologia — e, mais importante, que ainda sobra alguma coisa depois dessa compressão.

Há ainda um ponto que tem de ficar escrito com dureza: o apoio metodológico também tem níveis. O nível mais fraco é simplesmente uma linha de resultado não cair diante das salvaguardas; o nível mais forte é ela não só não cair, mas mostrar ativamente um fecho quádruplo: acerto por previsão antecipada, robustez em reserva, separação nas verificações nulas e concordância entre equipas. O Volume 8 precisa verdadeiramente do segundo nível, não do primeiro. O primeiro apenas mostra que a EFT ainda não foi apanhada num erro de processo; o segundo mostra que ela começa a ganhar crédito procedimental.


XI. Que resultados contam apenas como estreitamento, e não como saída imediata

Nem todas as dificuldades metodológicas mandam imediatamente a EFT de volta para a zona de reescrita. Alguns resultados parecem mais estreitamento do que reprovação.


XII. Que resultados causam dano estrutural direto

Há ainda uma forma de dano metodológico que costuma ser subestimada: as regras serem sempre atualizadas depois de os resultados aparecerem. Hoje diz-se que conta o mesmo sentido; amanhã, que conta a ordenação; depois de amanhã, que só conta a subamostra de ambiente forte. Hoje dizem que duas cadeias bastam; amanhã, por haver discordância, passa-se a confiar só numa delas. Hoje fala-se em reservar regiões do céu; amanhã, por haver inversão, passa-se a reservar bandas de frequência. Se este fenómeno de «regras a correr atrás dos resultados» persistir, a 8.12 tem de o classificar como ferimento grave, porque significa que a EFT ainda não aprendeu a entregar-se a regras fixas.


XIII. Em que situações ainda não se pode julgar hoje

Há ainda uma forma legítima, mas perigosa, de «ainda não julgado»: objetos demasiado raros, plataformas demasiado caras ou ciclos de reprodução demasiado longos. Certas texturas finas perto do horizonte, fusões extremas ou ligações quânticas de custo elevado realmente não podem completar rapidamente uma replicação multi-institucional como experiências correntes. Neste caso, a 8.12 pode permitir provisoriamente «densidade de evidência insuficiente», mas nunca permite transformar isso em «portanto, conta já como apoio». Na gramática do Volume 8, custo e raridade só podem atrasar o julgamento; não podem elevar a probabilidade de vitória.


XIV. Não confundir «consegue explicar» com «resiste ao julgamento»: a viragem mais importante desta secção

O que esta secção acrescenta não são alguns requisitos técnicos adicionais; é a mudança de postura de todo o volume, da hermenêutica para a auditoria. A hermenêutica é excelente a encontrar, para cada novo objeto, uma frase onde ele possa caber. A auditoria faz o contrário: ata primeiro a teoria, e só depois pergunta o que ainda sobra. Para uma teoria que tenta reescrever o mapa de base, como a EFT, esta viragem é especialmente importante. Quanto melhor ela fala, mais tem de aprender primeiro a calar-se; quanto mais consegue tornar as coisas inteligíveis, mais tem de aceitar as regras menos favoráveis.

Esta é também a camada que mais deve ficar na memória: o aspeto realmente assustador do falseamento não é a força dos adversários, mas a disposição da própria teoria para se julgar pelas regras que lhe são menos favoráveis. Se a EFT não estiver disposta a fazê-lo, então, mesmo que por algum tempo ninguém consiga refutá-la, continuará a ser apenas uma teoria que sabe contar histórias. Pelo contrário, ainda que ganhe apenas algumas janelas sob as regras mais desfavoráveis, essas vitórias pesarão mais do que um volume inteiro de explicações bonitas sem salvaguardas.


XV. Síntese desta secção

A possibilidade de o Volume 8 se sustentar não depende apenas do que ele vê; depende ainda mais de a EFT aceitar perder vantagem antes de passar pelas quatro portas: conjuntos de reserva, cegamento, verificações nulas e replicação entre fluxos de análise. Só quando a EFT aceita primeiro regras que a deixam desconfortável é que qualquer apoio obtido depois deixa de ser apenas eco da sua própria narrativa.