Arcabouço de gravidade média da Teoria do filamento de energia (Energy Filament Theory, EFT), em comparação com a linha de base mínima NFW para matéria escura fria (DM)

Autor: Guanglin Tu
E-mail: riniky@energyfilament.org | ORCID: 0009-0003-7659-6138
Instituição: Grupo de Trabalho EFT, Shenzhen Energy Filament Science Research Co., Ltd. (China)
Versão: v1.1 | Data: 2026-02-14

Pré-print (não revisado por pares) | Esta versão é destinada à divulgação pública e à verificação reprodutível; não representa a versão final publicada em periódico.

Licença: relatório (CC BY-NC-ND 4.0); pacote completo de reprodução (CC BY 4.0).

Relatório em nível de publicação (Concept DOI): https://doi.org/10.5281/zenodo.18526334
Pacote completo de reprodução (Concept DOI): https://doi.org/10.5281/zenodo.18526286

0 Resumo executivo (Executive Summary)

Este relatório é uma edição completa em nível de publicação arquivada no Zenodo (edição de arquivo). Ele oferece uma cadeia integrada e auditável que vai dos dados, do registro de modelos, da comparação justa e do teste de fechamento até os materiais de reprodução. O apêndice B (P1A) funciona como complemento de robustez: concentra um teste de pressão com uma linha de base DM mais padrão e uma sistemática-chave de lenteamento, para verificar a sensibilidade das conclusões principais a uma modelagem DM mais realista e ao tratamento de erros sistemáticos de lenteamento.

Conclusões centrais (quatro frases diretamente citáveis; ver a seção 2.4):

(1) No ajuste das curvas de rotação (RC), a família EFT supera de modo significativo o DM_RAZOR em todas as combinações de núcleos e priors; o ganho típico é Δlog𝓛_RC ≈ 10^3 (ver tabela S1a).
(2) No teste de fechamento RC→GGL, a EFT apresenta maior transferibilidade preditiva entre sondas: a intensidade de fechamento Δlog𝓛_closure (True−Perm) é significativamente superior à do DM_RAZOR, e a diferença é robusta aos varrimentos de shrinkage da covariância, R_min e σ_int (ver figura S3 e tabela S1b).
(3) No ajuste conjunto (RC+GGL), a EFT mantém uma vantagem estável e, sob o controle negativo que destrói o mapeamento compartilhado, essa vantagem colapsa; isso apoia que o “efeito de gravidade média” vem de um mapeamento compartilhado, não de uma coincidência de ajuste (ver figura S4).
(4) O apêndice B (P1A), sem aumentar de modo significativo a dimensionalidade, submete o lado DM a um teste de pressão com módulos de linha de base mais padrão e um parâmetro nuisance que representa uma sistemática-chave de lenteamento; essas melhorias não eliminam a vantagem de fechamento da EFT (ver tabela B1 e figura B1).

Disponibilidade de dados e código: relatório Concept DOI 10.5281/zenodo.18526334; pacote completo de reprodução Concept DOI 10.5281/zenodo.18526286. As etiquetas correspondentes ao apêndice B (P1A) são run_tag=20260213_151233, closure_tag=20260213_161731 e joint_tag=20260213_195428.

1 Resumo

Comparamos quantitativamente, de forma reprodutível, dois arcabouços teóricos sob os mesmos dados e o mesmo protocolo estatístico: o modelo de “correção de gravidade média” proposto pela Teoria do filamento de energia (Energy Filament Theory, EFT; diferente do uso comum da sigla Effective Field Theory) e o modelo de linha de base de halo NFW de matéria escura fria (DM_RAZOR). O DM_RAZOR é escolhido deliberadamente como uma “linha de base DM mínima”: halo NFW + relação c–M fixa, sem dispersão halo a halo, para oferecer uma comparação auditável e verificável. Também é importante enfatizar que este artigo trata a EFT como uma parametrização fenomenológica, do tipo MOND, de um Campo efetivo ou de uma resposta efetiva, a ser testada sob um protocolo estatístico unificado, e não como uma derivação de primeiros princípios microfísicos dentro deste manuscrito.

Os dados incluem: curvas de rotação SPARC (RC), pré-processadas e binadas de modo uniforme, com 2.295 pontos de velocidade (104 galáxias, 20 RC-bin), e a densidade superficial equivalente ΔΣ(R) do lenteamento fraco galáxia-galáxia KiDS-1000 (GGL), com 4 bins de massa estelar × 15 pontos R por bin, totalizando 60 pontos, usando a covariância completa.

Executamos sucessivamente a inferência RC-only, o teste de fechamento RC→GGL (closure), a inferência GGL-only e a inferência conjunta RC+GGL, com auditorias de consistência para garantir que todos os valores citados sejam rastreáveis. Sob um livro-caixa estrito de parâmetros e uma restrição de mapeamento compartilhado (DM: 20 parâmetros log M200_bin; EFT: 20 parâmetros log V0_bin + 1 parâmetro global log ℓ), a família EFT supera de forma clara o DM_RAZOR no ajuste conjunto: ΔlogL_total = 1155–1337 em relação ao DM_RAZOR. Mais importante, o teste de fechamento mostra que o posterior RC tem poder preditivo não trivial sobre o GGL: a intensidade de fechamento da EFT, ΔlogL_closure = 172–281, supera o valor 127 do DM_RAZOR; quando o mapeamento RC-bin→GGL-bin é embaralhado aleatoriamente por grupos, o sinal de fechamento colapsa para 6–23, verificando que não se trata de acaso estatístico nem de viés de implementação. Nos varrimentos sistemáticos de σ_int, R_min e shrinkage da covariância, a vantagem relativa da EFT permanece positiva e de escala estável. Para responder a objeções frequentes como “a linha de base DM é fraca demais” ou “sistemáticas estão sendo lidas como física”, o apêndice B (P1A) oferece um teste de pressão DM mais padrão, ainda de baixa dimensão e auditável, com dispersão hierárquica c–M + prior, um proxy de core de um parâmetro, um m de lenteamento e o modelo combinado DM_STD; sob o mesmo protocolo de fechamento, essas melhorias não eliminam a vantagem de fechamento da EFT (ver tabela B1/figura B1).

Palavras-chave: curvas de rotação; lenteamento fraco galáxia-galáxia; teste de fechamento; EFT; matéria escura fria; inferência bayesiana

2 Introdução e panorama dos resultados

As curvas de rotação (RC) e o lenteamento fraco galáxia-galáxia (GGL) são duas sondas gravitacionais complementares: as RC restringem o potencial dinâmico no plano do disco e a relação de aceleração radial (RAR), enquanto o GGL mede a distribuição de massa projetada e a resposta gravitacional em escala de halo. Para qualquer teoria candidata, o ponto decisivo não é se ela consegue ajustar separadamente os dois conjuntos de dados, mas se consegue explicá-los de modo coerente sob o mesmo mapeamento entre dados e as mesmas restrições compartilhadas.

Por isso, este artigo toma o “teste de fechamento” (closure test) como protocolo estatístico central: primeiro usamos o posterior RC-only para prever o GGL para a frente; em seguida comparamos com um controle negativo no qual o mapeamento RC-bin→GGL-bin é permutado (permutation / shuffle). Assim avaliamos a transferibilidade preditiva entre dados (predictive transferability) e excluímos sinais espúrios causados por vieses de implementação ou por ajustes fortuitos.

Posicionamento teórico e escopo: este manuscrito não pretende fornecer uma derivação microfísica de primeiros princípios da EFT (Teoria do filamento de energia), nem uma formulação relativística completa. Ao contrário, tratamos a EFT como uma parametrização efetiva de baixa dimensão, do tipo MOND, de um campo ou de uma resposta efetiva, descrita por uma função núcleo f(x) e por uma escala global ℓ; então, sob um livro-caixa estrito de parâmetros, usamos o teste de fechamento RC→GGL para testar sua consistência entre dados e sua transferibilidade preditiva.

Plano de pesquisa e declaração de escopo: este trabalho faz parte de um programa observacional P-series em andamento. Nos dados disponíveis em escala galáctica, buscamos duas possíveis contribuições efetivas de fundo: (i) uma “base de gravidade média” (mean gravity floor), descrevível por uma resposta gravitacional média após coarse-graining; e (ii) uma “base de ruído” (stochastic/noise floor) associada a flutuações de processos microscópicos. Neste artigo (P1), concentramo-nos apenas na primeira: sem introduzir hipóteses sobre qualquer mecanismo microfísico de produção, buscamos indícios observacionais de uma base de gravidade média por meio do teste de fechamento RC→GGL, e os comparamos com uma linha de base DM auditável sob um protocolo unificado. Como imagem física heurística, se existirem graus de liberdade de vida curta, seu decaimento ou aniquilação pode converter massa de repouso em energia-momento transportada por outros graus de liberdade; na camada efetiva, isso corresponde naturalmente a uma decomposição em “contribuição média + contribuição flutuante”. Este artigo, porém, não modela quantitativamente essa imagem microfísica.

Para evitar interpretações excessivas, delimitamos o escopo do artigo da seguinte forma:
• O que este artigo faz: mede a transferibilidade preditiva entre dados por meio de um teste de fechamento, sob um livro-caixa estrito de parâmetros e um mapeamento compartilhado, e compara de forma reprodutível a resposta de gravidade média da EFT com uma linha de base DM.
• O que este artigo não faz: não discute mecanismos microfísicos de produção, abundâncias, vidas médias nem restrições cosmológicas; tampouco modela o termo aleatório correspondente à “base de ruído”.
• O que este artigo não afirma: não tem como objetivo refutar a matéria escura; o P1 não emite um veredicto final sobre se a “base” existe, mas relata evidência de etapa: no domínio de medição robusto escolhido aqui, os dados favorecem modelos que incluem uma resposta de gravidade média.

Ao mesmo tempo, deixamos claro que o DM_RAZOR representa apenas uma linha de base NFW minimalista e auditável (c–M fixa e sem scatter; sem Adiabatic Contraction, core de feedback, não esfericidade ou termos ambientais). Portanto, a conclusão principal do texto é estritamente limitada: sob essa linha de base mínima e sob as restrições estritas de livro-caixa de parâmetros/mapeamento, a EFT apresenta maior consistência entre dados. Para responder a uma pergunta frequente — se uma linha de base ΛCDM mais padrão e a modelagem de sistemáticas-chave de lenteamento alterariam significativamente a conclusão — organizamos no apêndice B (P1A: teste de pressão padronizado da linha de base DM) os aprimoramentos DM mais padrão, ainda de baixa dimensão e auditáveis, junto com o nuisance do lado do lenteamento, mantendo exatamente o mesmo mapeamento compartilhado e o mesmo protocolo de fechamento do texto principal (ver tabela B1/figura B1).

2.1 Tab S1a–S1b: resumo dos indicadores-chave (Strict)

A tabela S1a apresenta os principais indicadores de comparação do ajuste conjunto (RC+GGL): logL, ΔlogL, AICc e BIC. A tabela S1b apresenta os indicadores do teste de fechamento e dos varrimentos de robustez: closure, controle negativo shuffle e faixas dos varrimentos de σ_int / R_min / cov-shrink. Todos os valores vêm da tabela mestra de resumo estrito Tab_Z1_master_summary e podem ser rastreados item a item no pacote arquivado de publicação.

Tabela S1a | Indicadores principais do ajuste conjunto (RC+GGL, Strict).

Modelo (workspace)	Núcleo W	k	logL_total conjunto (best)	ΔlogL_total vs DM	AICc	BIC
DM_RAZOR	none	20	-16927.763	0.0	33895.885	34010.811
EFT_BIN	none	21	-15590.552	1337.21	31223.501	31344.155
EFT_WEXP	exponential	21	-15668.83	1258.932	31380.057	31500.711
EFT_WYUK	yukawa	21	-15772.936	1154.827	31588.268	31708.922
EFT_WPOW	powerlaw_tail	21	-15633.321	1294.442	31309.038	31429.692

Tabela S1b | Indicadores de fechamento e robustez (Strict).

Modelo (workspace)	Fechamento ΔlogL (true-perm)	ΔlogL após shuffle do controle negativo	Faixa ΔlogL do varrimento σ_int	Faixa ΔlogL do varrimento R_min	Faixa ΔlogL do varrimento cov-shrink
DM_RAZOR	126.678	22.725	—	—	—
EFT_BIN	231.611	14.984	459–1548	1243–1289	1337–1351
EFT_WEXP	171.977	6.04	408–1471	1169–1207	1259–1277
EFT_WYUK	179.808	14.688	380–1341	1065–1099	1155–1166
EFT_WPOW	280.513	6.672	457–1500	1203–1247	1294–1308

2.2 Fig S3: intensidade de fechamento (RC-only → previsão de GGL)

A intensidade de fechamento é definida como ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩: nos amostras posteriores RC-only, prevê-se o GGL para a frente e compara-se com o controle negativo no qual o mapeamento RC-bin→GGL-bin é permutado.

Figura S3 | Intensidade de fechamento (maior é melhor): vantagem média de log-verossimilhança na previsão RC-only → GGL.

2.3 Fig S4: comparação principal do ajuste conjunto (RC+GGL)

A vantagem do ajuste conjunto é definida como ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR). Sob os mesmos dados, o mesmo mapeamento e escala de parâmetros aproximadamente igual, a família EFT obtém log-verossimilhança conjunta significativamente mais alta.

Figura S4 | Vantagem do ajuste conjunto (maior é melhor): best logL_total de RC+GGL em relação ao DM_RAZOR.

2.4 Quatro conclusões (diretamente citáveis)

(1) Na análise conjunta unificada das curvas de rotação SPARC + lenteamento fraco KiDS-1000, o modelo do arcabouço de gravidade média da EFT supera sistematicamente o DM_RAZOR sob o protocolo de comparação estrito: ΔlogL_total = 1155–1337 em relação ao DM_RAZOR.

(2) O teste de fechamento RC→GGL mostra que a consistência preditiva da EFT é mais forte: ΔlogL_closure = 172–281, enquanto o DM_RAZOR fica em 127; além disso, quando o agrupamento RC-bin→GGL-bin é embaralhado aleatoriamente, o sinal de fechamento colapsa para 6–23, mostrando que o sinal depende do mapeamento correto entre dados, não de ajuste casual.

(3) Os varrimentos sistemáticos de σ_int, R_min e shrinkage da covariância não mudam nem o sinal nem a escala da afirmação “EFT supera DM_RAZOR”, indicando que a conclusão é robusta a perturbações sistemáticas comuns.

(4) O apêndice B (P1A) padroniza e audita o reforço da linha de base DM sob o mesmo protocolo de fechamento: preserva três aprimoramentos de um parâmetro (SCAT/AC/FB) e acrescenta dispersão hierárquica c–M + prior, proxy de core de um parâmetro e calibração de shear no lado do lenteamento, m (bem como o modelo combinado DM_STD). Os resultados mostram que apenas o ramo feedback/core traz uma pequena melhora líquida da intensidade de fechamento (122.21→129.45, ΔΔlogL_closure≈+7.25); os demais aprimoramentos contribuem de modo insignificante ou negativo para a intensidade de fechamento. Assim, a conclusão principal do texto não depende de o DM_RAZOR ser uma linha de base fraca demais.

3 Dados e pré-processamento

Este estudo usa dois conjuntos de dados públicos e, dentro da engenharia do projeto, conclui download, verificação (sha256) e pré-processamento por scripts rastreáveis. Para garantir uma comparação justa entre modelos, todos os workspaces (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) compartilham exatamente os mesmos produtos de dados e o mesmo mapeamento de bins.

3.1 Curvas de rotação (RC, SPARC)

Os dados RC vêm do banco SPARC Rotmod_LTG (175 arquivos rotmod). Após o pré-processamento, a amostra incluída na modelagem deste projeto contém 104 galáxias, totalizando 2.295 pontos de dados (r, V_obs), e é dividida em 20 RC-bin segundo regras como massa estelar. Cada ponto de dados contém o raio r (kpc), a velocidade observada V_obs (km/s) e o erro σ_obs, além das velocidades dos componentes de gás, disco e bojo (V_gas, V_disk, V_bul).

3.2 Lenteamento fraco (GGL, KiDS-1000 / Brouwer+2021)

Os dados GGL usam a densidade superficial equivalente ΔΣ(R) apresentada por Brouwer et al. (2021) na Fig. 3 para o KiDS-1000 (4 bins de massa estelar, 15 pontos R por bin) e a covariância completa fornecida. Na engenharia do projeto, a covariância original em formato long-form é reconstruída como uma matriz 15×15 para cada bin, e sua dimensão e razoabilidade numérica são verificadas na auditoria Stage-B.

3.3 Mapeamento RC-bin → GGL-bin e tamanho total da amostra

Os 4 bins de massa do GGL são conectados aos 20 bins do RC por um mapeamento fixo: cada GGL-bin corresponde a 5 RC-bin, e as contribuições dos RC-bin são ponderadas pelo número de galáxias. Esse mapeamento permanece igual em todos os modelos e é a restrição central para a comparação justa no teste de fechamento e no ajuste conjunto. O número final de pontos de dados conjuntos é n_total = 2355 (RC=2295, GGL=60).

4 Modelos e métodos estatísticos

4.1 Especificação matemática mínima da EFT e do DM (auditável/testável)

Esta seção apresenta uma especificação matemática mínima que corresponde diretamente à implementação.

(a) Modelo das curvas de rotação (RC)

Para cada ponto de dados RC (r, V_obs, σ_obs), usamos a sobreposição de componentes: V_mod²(r) = V_bar²(r) + V_extra²(r). Aqui, V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r). Nos resultados principais deste manuscrito, adotamos Υ_d = Υ_b = 0.5 (em concordância com a recomendação empírica do SPARC e também para reduzir graus de liberdade desnecessários).

(b) Correção de gravidade média da EFT (EFT)

O termo extra da EFT é parametrizado na forma de “quadrado médio de velocidade”: V_extra²(r) = V0_bin² · f(r/ℓ). Aqui, V0_bin é o parâmetro de amplitude de cada RC-bin (20 parâmetros), ℓ é a escala global (1 parâmetro), e f(x) é uma função de forma de núcleo sem dimensão. As formas de núcleo comparadas neste artigo (todas sem introduzir graus de liberdade contínuos adicionais) são:

none: f(x)=x/(1+x)
exponential: f(x)=1−exp(−x)
yukawa: f(x)=1−exp(−x)·(1+0.5x)
powerlaw_tail: f(x)=1−(1+x)^(−1/2)
(controle opcional) gaussian: f(x)=erf(x/√2) (não incluído no conjunto de conclusões principais)

Motivação física (ampliada): a EFT entende a resposta gravitacional extra em escala galáctica como uma resposta efetiva após coarse-graining ou média de escala de interações mais microscópicas em extensão finita. Neste artigo, não pressupomos um mecanismo microfísico específico; adotamos uma parametrização mínima e auditável para realizar uma comparação e um teste controlados sob um protocolo estatístico unificado.

Para facilitar a intuição, o termo extra pode ser escrito em forma de aceleração: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). Quando r≫ℓ, f→1 e V_extra→V0_bin, fornecendo uma contribuição de velocidade extra aproximadamente plana na região externa. Quando r≪ℓ e f(x)≈x, pode-se introduzir uma escala característica de aceleração a0,bin≈V0_bin²/ℓ (com um fator O(1) dependente do núcleo), oferecendo uma intuição de transição entre região interna e externa semelhante à MOND.

A família discreta de núcleos usada neste artigo (none/exponential/yukawa/powerlaw_tail) pode ser vista como um proxy de baixa dimensão para diferentes “inclinações iniciais / velocidades de transição / caudas de longo alcance” (por exemplo, blindagem do tipo Yukawa versus uma resposta de cauda mais longa), usado para teste de pressão de robustez, não para esgotar o espaço de modelos. Na parte de lenteamento fraco, construímos a massa de envelope e a densidade equivalentes a partir de V_avg(r) e as projetamos para obter ΔΣ(R). Essa densidade equivalente deve ser entendida como uma descrição efetiva do potencial de lente sob as hipóteses de simetria esférica e mapeamento em campo fraco (os detalhes completos foram movidos para o apêndice A).

Todas as formas de núcleo acima satisfazem f(x)→1 quando x→∞ (isto é, V_extra²→V0² satura), enquanto para x≪1 produzem crescimento linear ou sublinear: por exemplo, exponential: f≈x; yukawa: f≈0.5x; powerlaw_tail: f≈0.5x. Portanto, diferentes formas de núcleo apresentam diferenças observáveis na “inclinação inicial”, na velocidade de transição e na cauda externa em pequenos raios, que podem ser distinguidas pelo ajuste conjunto e pelo teste de fechamento RC+GGL.

A previsão da EFT para o lenteamento fraco ΔΣ(R) é obtida a partir de V_avg(r), que fornece a massa e a densidade de envelope, e então pela integral de projeção: M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr, ΔΣ(R)=Σ̄(<R)−Σ(R). A implementação numérica usa uma malha logarítmica e refina adaptativamente em casos anômalos, garantindo estabilidade e repetibilidade.

(c) DM_RAZOR: linha de base de halo NFW de matéria escura fria

Ao mesmo tempo, deixamos claro que o DM_RAZOR representa apenas uma linha de base NFW minimalista e auditável (c–M fixa e sem scatter; sem Adiabatic Contraction, core de feedback, não esfericidade ou termos ambientais). Para reduzir o risco de “strawman baseline”, este artigo não afirma que esses efeitos inexistem; ao contrário, eles são incorporados de modo auditável e de baixa dimensão no apêndice B (P1A) como teste de pressão, incluindo tratamento hierárquico do scatter c–M, proxy de core e nuisance de calibração de shear do lado do lenteamento.

4.2 Livro-caixa de modelos e comparação justa (parâmetros compartilhados = definição de fechamento)

O número de parâmetros no conjunto principal de comparação é: DM_RAZOR k=20; família EFT k=21 (o 1 parâmetro adicional é o log ℓ global). Todos os modelos compartilham: os mesmos dados RC, os mesmos dados GGL e a mesma covariância, o mesmo mapeamento RC-bin→GGL-bin, os mesmos termos bariônicos e as mesmas conversões de unidades. Além disso, a forma do núcleo (none / exponential / yukawa / powerlaw_tail) é uma escolha discreta, sem introduzir parâmetros contínuos adicionais, evitando assim obter vantagem simplesmente por “ter um grau de liberdade a mais”.

4.3 Likelihood, priors e amostrador

A likelihood RC usa uma gaussiana diagonal: σ_eff² = σ_obs² + σ_int²; nos resultados principais, σ_int é fixado em 5 km/s, e é varrido no Run-5. A likelihood GGL usa a covariância gaussiana completa por bin: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). O alvo conjunto é logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ). Os priors refletem principalmente fronteiras de viabilidade física (restrições de intervalo para log ℓ, log V0 e log M200); quando Υ e σ_int livres são habilitados, usamos priors fracamente informativos (ver a implementação e a configuração do release package).

O amostrador usa random walk Metropolis adaptativo em blocos: a cada passo, apenas um sub-bloco aleatório do espaço de parâmetros é atualizado para aumentar a taxa de aceitação em alta dimensão, com uma adaptação leve do tamanho do passo pela taxa de aceitação em janela (taxa-alvo de aceitação em torno de 0,25). Os resultados principais usam o modo quick (n_steps=800 e configurações relacionadas), e cada workspace exporta trace, resíduos e gráficos PPC para auditoria manual e por script.

4.4 Teste de fechamento e controle negativo (definição)

O teste de fechamento (Run-2) verifica, sem reajustar o GGL, se o posterior RC-only consegue prever o GGL. O procedimento específico é: gerar para a frente, a partir das amostras posteriores RC-only, ΔΣ(R) para os 4 GGL-bin e calcular logL_true com a covariância completa; em seguida, aplicar uma permutação aleatória (permutation) ao mapeamento de grupos RC-bin→GGL-bin para obter logL_perm. A intensidade de fechamento é definida como ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩. Além disso, o Run-10 reagrupa aleatoriamente os 20 RC-bin em 4×5 (shuffle) e recalcula o fechamento, para testar a dependência do sinal de fechamento em relação ao mapeamento correto.

5 Resultados principais e interpretação

5.1 Resultado principal do ajuste conjunto (RC+GGL)

O best logL_total do ajuste conjunto e a vantagem relativa ΔlogL_total (em relação ao DM_RAZOR) aparecem na tabela S1a e na figura S4. No conjunto principal de comparação, o EFT_BIN apresenta a maior vantagem conjunta (ΔlogL_total=1337.210), e as demais formas de núcleo da EFT também mantêm vantagens significativas (1154.827–1294.442). Nos critérios de informação (AICc/BIC), a família EFT também supera claramente o DM_RAZOR, mostrando que a vantagem não vem de viés no número de parâmetros.

Nota: a principal contribuição para ΔlogL_total≈1337 vem do termo RC (na decomposição joint, ΔlogL_RC≈1065, cerca de 80%); isso pode ser entendido como uma melhoria moderada de Δχ²≈0,90 por ponto em N=2295 pontos de dados RC, que se acumula naturalmente, sob likelihood gaussiana diagonal, em uma vantagem da ordem de 10^3. Ao mesmo tempo, o GGL e o teste de fechamento fornecem restrições independentes entre conjuntos de dados, e a ordenação permanece estável nos testes de pressão de σ_int, R_min e cov-shrink (ver seção 6 e tabela S1b).

5.2 Resultado do teste de fechamento (RC-only → GGL)

A quantidade-chave do teste de fechamento, ΔlogL_closure, aparece na tabela S1b e na figura S3. A intensidade de fechamento da família EFT é 171.977–280.513, acima dos 126.678 do DM_RAZOR. Isso significa que, sem permitir nenhum grau de liberdade extra entre os conjuntos de dados, as amostras posteriores obtidas pela EFT nos dados RC têm maior capacidade preditiva transferível para os dados GGL.

O controle negativo reforça a relevância física do sinal de fechamento: quando o agrupamento RC-bin→GGL-bin é embaralhado aleatoriamente, a intensidade de fechamento da EFT cai para 6–15 (com pequenas diferenças entre núcleos), enquanto a intensidade de fechamento de base chega a 172–281. Esse “colapso do sinal” exclui uma vantagem espúria causada por implementação numérica, erro de unidades ou tratamento inadequado da covariância.

Figura R1 | Controle negativo: após o shuffle dos grupos, o sinal de fechamento cai de forma significativa (gerado com base nos indicadores Tab_Z1).

5.3 Significado e limitações dos resultados

A conclusão deste estudo é: “neste conjunto de dados e sob este protocolo, a correção de gravidade média da EFT supera a linha de base DM_RAZOR testada”. É preciso enfatizar que o lado DM usa apenas uma linha de base NFW mínima com relação c(M) fixa, sem introduzir core, não esfericidade, termos ambientais ou modelos mais complexos de conexão galáxia-halo. Portanto, este manuscrito não afirma excluir todas as famílias de modelos DM; ele oferece uma linha de base comparativa reprodutível, centrada em teste de fechamento, para avaliar se RC e GGL podem ser explicados de modo consistente pelo mesmo conjunto de parâmetros e pelo mesmo mapeamento entre dados.

Para responder a essa dúvida comum, concluímos uma engenharia de extensão independente, P1A (ver apêndice B), que fortalece a linha de base DM de forma “padronizada e auditável” sem alterar o mapeamento compartilhado RC-bin→GGL-bin nem o arcabouço de auditoria: além dos três aprimoramentos de um parâmetro (SCAT/AC/FB), acrescentamos (i) dispersão hierárquica c–M + prior massa-concentração (DM_HIER_CMSCAT), (ii) um proxy de core baryonic-feedback de um parâmetro (DM_CORE1P) e (iii) um nuisance m de calibração de shear no lado do lenteamento fraco (DM_RAZOR_M), além do modelo combinado DM_STD; o EFT_BIN é preservado como referência de comparação.

• DM_RAZOR_SCAT (c–M scatter) — introduz o parâmetro de dispersão de concentração halo-to-halo σ_logc, para testar se a fixação de c(M) subestima sistematicamente a capacidade explicativa do DM;
• DM_RAZOR_AC (Adiabatic Contraction) — usa um único parâmetro α_AC para interpolar continuamente entre “sem contração ↔ contração padrão”, capturando ao menor custo a tendência de contração interna induzida pelos bárions;
• DM_RAZOR_FB (Feedback / core) — usa uma escala de core (por exemplo, log r_core) para descrever o efeito de supressão da coreficação interna sobre as curvas de rotação, mantendo a aproximação NFW na escala de lenteamento fraco.

O scoreboard quantitativo do P1A aparece na tabela B1 / figura B1 do apêndice B, gerado automaticamente por Tab_S1_P1A_scoreboard. No indicador de fechamento, o DM_RAZOR_FB oferece uma pequena melhora líquida (122.21→129.45, +7.25); os demais aprimoramentos contribuem de forma insignificante ou negativa para a intensidade de fechamento. No lado do ajuste conjunto, a inclusão do prior hierárquico de c–M scatter (DM_HIER_CMSCAT) ou do modelo combinado (DM_STD) pode melhorar significativamente o joint logL, mas não aumenta a intensidade de fechamento; isso sugere que o ganho vem sobretudo de flexibilidade no ajuste conjunto, não de transferibilidade preditiva entre sondas. Assim, a conclusão central do texto deve ser entendida desta forma: sob mapeamento compartilhado estrito e teste de fechamento, a vantagem de consistência entre dados da EFT não decorre da escolha de uma linha de base DM “fraca demais”. O pacote de publicação P1A correspondente ao apêndice B (tabelas e figuras suplementares e full_fit_runpack) será incorporado como arquivo adicional ao mesmo Zenodo Concept DOI do full_fit_runpack deste artigo: https://doi.org/10.5281/zenodo.18526286.

6 Robustez e experimentos de controle

6.1 Varrimento de σ_int (Run-5)

Fizemos um varrimento sistemático da dispersão intrínseca σ_int do RC e repetimos a inferência conjunta para cada valor de σ_int, calculando ΔlogL_total em relação ao DM_RAZOR. Os valores mínimo e máximo de ΔlogL_total de cada modelo ao longo do varrimento aparecem na tabela S1b.

Figura R2 | Faixa de ΔlogL_total no varrimento de σ_int (maior é melhor).

6.2 Varrimento de R_min (Run-6)

Para testar o impacto de erros sistemáticos nos dados da região central, como movimento não circular, resolução e modelagem bariônica insuficiente, aplicamos ao RC um corte por limiar R_min e repetimos a inferência conjunta. A vantagem da família EFT permanece positiva e de escala estável ao longo do varrimento de R_min.

Figura R3 | Faixa de ΔlogL_total no varrimento de R_min (maior é melhor).

6.3 Varrimento cov-shrink (Run-7)

Para testar a incerteza da covariância do GGL, aplicamos shrinkage à matriz de covariância de cada bin de massa: C_α=(1−α)C+α·diag(C), e varremos α. Os resultados mostram que a vantagem da família EFT é insensível a esse tratamento.

Figura R4 | Faixa de ΔlogL_total no varrimento cov-shrink (maior é melhor).

6.4 Escada de ablação (Run-8)

Dentro do EFT_BIN, realizamos uma ablação aninhada: do modelo mínimo (sem parâmetros livres) a versões com poucos graus de liberdade e, finalmente, ao modelo completo com amplitudes em 20 bins + escala global. AICc/BIC mostram que o EFT_BIN completo é claramente necessário para explicar os dados.

Figura R5 | Escada de ablação do EFT_BIN (AICc, menor é melhor).

6.5 Previsão por leave-one-bin-out (Run-9)

Executamos ainda um teste leave-one-bin-out (LOO): nos 4 bins de massa do GGL, deixamos de fora 1 bin por vez, re-inferimos com os demais bins (e todo o RC) e avaliamos a log-verossimilhança de teste no bin deixado de fora. Os indicadores resumidos aparecem na tabela suplementar Tab_R3_leave_one_bin_out (produto do Run-9; o padrão de caminho do arquivo é fornecido na lista de produtos-chave da seção 8.2). A família EFT continua claramente superior ao DM_RAZOR mesmo no pior caso de bin deixado de fora.

Figura R6 | LOO: distribuição da log-verossimilhança no bin deixado de fora (proveniente dos produtos do Run-9).

6.6 Controle negativo: shuffle de RC-bin (Run-10)

O Run-10 reagrupa aleatoriamente os 20 RC-bin em 4×5 e recalcula o fechamento mantendo inalterado o posterior RC-only. Os resultados mostram que, em comparação com o mapeamento original, o shuffle reduz significativamente o mean logL_true e o ΔlogL_closure do fechamento (ver tabela S1b e figura R1), reforçando a interpretabilidade do sinal de fechamento.

Figura R7 | Controle negativo: o shuffle do mapeamento reduz claramente o mean logL_true do fechamento (proveniente dos produtos do Run-10).

7 Rastreabilidade e auditoria de consistência (Provenance)

Todos os valores citados neste artigo podem ser rastreados item a item nas tabelas de resumo estrito e nos registros de auditoria arquivados para publicação. Para tornar a leitura do texto principal mais fluida, a cadeia completa de rastreabilidade (lista de tags, tabelas de auditoria, lista de checksums e método de verificação) foi movida para o apêndice A.

8 Reprodutibilidade e arquivamento no Zenodo (Reproducibility & Archive)

Declaração de disponibilidade de dados e código: as curvas de rotação SPARC e os dados de lenteamento fraco KiDS-1000 usados neste artigo são dados públicos. O relatório em nível de publicação foi arquivado no Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526334), e o pacote completo de reprodução foi arquivado no Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526286). As etapas detalhadas de execução, o ambiente de dependências, a lista de arquivamento e as informações de verificação por hash aparecem no apêndice A; o desenho, as tags de execução e as saídas do teste de pressão padronizado da linha de base DM (P1A) aparecem no apêndice B.

Sob o mesmo pacote completo de reprodução Concept DOI (https://doi.org/10.5281/zenodo.18526286), oferecemos duas entradas reprodutíveis por finalidade:
• P1 (texto principal) full_fit_runpack: reproduz RC-only / closure / joint e os varrimentos de robustez de EFT vs DM_RAZOR, e gera ativos como as tabelas S1a/S1b e as figuras S3/S4 do texto principal;
• P1A (apêndice B) full_fit_runpack: reproduz o teste de pressão padronizado da linha de base DM (SCAT/AC/FB + prior hierárquico de c–M scatter + core1p + lensing m + DM_STD; com EFT_BIN como controle) e gera a tabela B1 e a figura B1 do apêndice.
As tabelas e figuras suplementares do P1A, juntamente com o full_fit_runpack, serão incorporadas como arquivos adicionais ao mesmo Concept DOI, para manter uma única entrada de arquivamento.

9 Agradecimentos e declarações

9.1 Agradecimentos

Agradecemos às equipes SPARC e KiDS-1000 pelos dados e documentos públicos; e aos participantes do fluxo de reconstrução e auditoria deste projeto.

9.2 Contribuições do autor

Guanglin Tu foi responsável pela concepção do estudo, desenho do protocolo, implementação de engenharia, organização dos dados, análise formal, implementação do fluxo de reprodução e auditoria, bem como pela redação do artigo.

9.3 Fontes de financiamento

Financiamento pessoal do autor Guanglin Tu (sem financiamento externo / sem número de projeto).

9.4 Interesses concorrentes

O autor Guanglin Tu tem vínculo com o “Grupo de Trabalho EFT, Shenzhen Energy Filament Science Research Co., Ltd. (China)”; não há outros interesses concorrentes.

9.5 Assistência por IA

OpenAI GPT-5.2 Pro e Gemini 3 Pro foram usados para polimento linguístico, edição estruturada e organização do fluxo de reprodução; não foram usados para gerar ou modificar dados, resultados, figuras, tabelas ou código; não foram usados para gerar referências; o autor assume total responsabilidade pelo conteúdo integral e pela exatidão das citações.

10 Referências

Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.
Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.
Wright, C. O., & Brainerd, T. G. (2000). Gravitational Lensing by Navarro–Frenk–White Halos. The Astrophysical Journal, 534, 34–40.
Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493. DOI: https://doi.org/10.1086/304888
Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374. DOI: https://doi.org/10.1093/mnras/stu742
Blumenthal, G. R., Faber, S. M., Flores, R., & Primack, J. R. (1986). Contraction of dark matter galactic halos due to baryonic infall. Astrophysical Journal, 301, 27. DOI: https://doi.org/10.1086/163867
Di Cintio, A., Brook, C. B., Dutton, A. A., et al. (2014). A mass-dependent density profile for dark matter haloes including the influence of galaxy formation. Monthly Notices of the Royal Astronomical Society, 441, 2986–2995. DOI: https://doi.org/10.1093/mnras/stu729
Read, J. I., Agertz, O., & Collins, M. L. M. (2016). Dark matter cores all the way down. Monthly Notices of the Royal Astronomical Society, 459, 2573–2590. DOI: https://doi.org/10.1093/mnras/stw713
Teoria do filamento de energia. Zenodo (repositório de ciência aberta) DOI: https://doi.org/10.5281/zenodo.18517411

Apêndice A: detalhes de rastreabilidade e reprodutibilidade

Este apêndice reúne informações de rastreabilidade e reprodutibilidade para arquivamento de longo prazo (tags de execução, resultados de auditoria, lista de arquivamento e pontos de verificação), facilitando a verificação e a reprodução conforme a necessidade do leitor.

A.1 Detalhes de rastreabilidade e auditoria

Para garantir rastreabilidade de longo prazo, este projeto atribui tags com carimbo temporal a cada execução e saída, preservando produtos históricos sem sobrescrevê-los. Os valores centrais citados neste manuscrito vêm do resumo estrito (compile_tag=20260205_035929) e passaram pelas seguintes auditorias de consistência:

• Todas as tabelas intermediárias incluem run_tag e tag de etapa; o script de resumo estrito seleciona, em report/tables, fontes de tabela canonical “completas e consistentes”.

• Os valores de Tab_Z1_master_summary e Tab_Z2_conclusion_highlights foram comparados item a item com as tabelas canonical selecionadas.

• Ao gerar o PDF, realizou-se uma auditoria das tags das tabelas/figuras citadas, garantindo que produtos antigos não fossem misturados.

Tags-chave (para localizar todos os produtos intermediários): run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442.

Resultado da auditoria de consistência: Tab_AUDIT_checks_strict mostra pass=9, fail=0, skip=0 (ver o release package para detalhes).

A.2 Etapas de execução da reprodutibilidade e lista de arquivamento

Este estudo adota um sistema de reprodução composto por “relatório em nível de publicação + materiais suplementares de tabelas e figuras + pacote completo de execução reexecutável”. O leitor pode consultar diretamente o Tables & Figures Supplement para verificar todos os ativos de tabelas/figuras citados neste artigo; se precisar reproduzir os valores e a cadeia de auditoria a partir do zero, pode usar o full_fit_runpack para baixar os dados e reexecutar todo o fluxo. Ao final da execução, as tabelas podem ser validadas pelo script de comparação com as tabelas reference incluído no pacote.

A.2.1 Quickstart de reprodução (RUN_FULL, Windows PowerShell)

Esta seção fornece uma rota de reprodução mais curta (Windows PowerShell). Para uma verificação rápida, recomenda-se consultar diretamente o Tables & Figures Supplement e conferir item a item as tabelas e figuras citadas. Para uma reprodução de ponta a ponta que gere todas as tabelas, figuras e produtos de auditoria, use o full_fit_runpack: siga o README/ONE_PAGE_REPRO_CHECKLIST do pacote e execute verify_checksums.ps1 e RUN_FULL.ps1 (recomenda-se Mode=full).

Entrada de arquivamento Zenodo (Concept DOI): https://doi.org/10.5281/zenodo.18526286.
Tags da cadeia principal deste artigo: run_tag=20260204_122515, strict compile_tag=20260205_035929, release_tag: 20260205_112442.

A.2.2 Materiais arquivados e pontos-chave de verificação (Packages & checks)

O arquivo Zenodo fornece 3 tipos de materiais complementares: (1) relatório em nível de publicação (este artigo, v1.1; com apêndice B: teste de pressão padronizado da linha de base DM P1A); (2) Tables & Figures Supplement (suplemento de tabelas e figuras: cobre todos os ativos de tabelas e figuras citados neste artigo, separadamente para P1 e P1A); (3) full_fit_runpack (pacote completo de reprodução: baixa os dados do zero e reexecuta todo o fluxo, separadamente para P1 e P1A). Os materiais (1)–(2) apoiam leitura rápida e verificação independente; o material (3) oferece reprodução completa de ponta a ponta.

Categoria de material	Nome do arquivo (exemplo)	Uso e posicionamento (ordem recomendada)
Relatório em nível de publicação (chinês e inglês)	P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf P1_RC_GGL_report_CN_PUBLICATION_V1_1.pdf	Relatório completo arquivado no Zenodo; o texto principal apresenta as conclusões e auditorias de robustez, e o apêndice B apresenta o P1A (teste de pressão padronizado da linha de base DM).
Tables & Figures Supplement (P1)	P1_RC_GGL_supplement_figs_tables_V1_1.zip	Todas as tabelas (CSV) e figuras (PNG) citadas no texto principal, incluindo scripts de geração e arquivos de etiquetas.
Tables & Figures Supplement (P1A)	P1A_supplement_figs_tables_v1.zip	Todas as tabelas e figuras citadas no apêndice B (P1A), incluindo Tab_S1_P1A_scoreboard e Fig_S1_P1A_scoreboard.
full_fit_runpack (P1)	P1_RC_GGL_full_fit_runpack_v1_1.zip	Reprodução completa de ponta a ponta: baixar os dados do zero e reexecutar RC-only/closure/joint e os varrimentos de robustez.
full_fit_runpack (P1A)	P1A_RC_GGL_full_fit_runpack_v1.zip	Reprodução completa de ponta a ponta (apêndice B): reexecutar DM 7+1 + DM_STD (com controle EFT_BIN) e gerar os ativos do apêndice; o pacote inclui script de comparação com tabelas reference para verificar a consistência numérica das tabelas.

Sugestão de citação: ao citar este artigo ou os materiais de reprodução associados, indique o Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334).

Após a reprodução, os principais produtos que devem aparecer e podem ser comparados incluem:

report/tables/Tab_D_closure_summary__20260204_122515__*.csv (resumo de fechamento)
report/tables/Tab_F_joint_summary__20260204_122515__*.csv (resumo do ajuste conjunto)
report/tables/Tab_G_joint_sigma_sweep__20260204_122515__*.csv (varrimento σ_int)
report/tables/Tab_H_joint_rmin_sweep__20260204_122515__*.csv (varrimento R_min)
report/tables/Tab_I_joint_covshrink_sweep__20260204_122515__*.csv (varrimento cov-shrink)
report/tables/Tab_R2_ablation_ladder__20260204_122515__*.csv (ablação)
report/tables/Tab_R3_leave_one_bin_out__20260204_122515__*.csv (LOO)
report/tables/Tab_R4_negctrl_rcbin_shuffle__20260204_122515__*.csv (controle negativo)
report/final/Tab_Z1_master_summary__20260204_122515__20260205_035929.csv (tabela mestra Strict; corresponde aos valores da tabela S1a/S1b e do texto)
report/final/P1_RC_GGL_final_bundle__20260204_122515__20260205_035929.pdf (PDF de resumo em nível de publicação; pode ser usado para leitura rápida e citação)

Apêndice B: P1A — teste de pressão padronizado da linha de base DM (DM 7+1 + DM_STD; com controle EFT)

Este apêndice registra uma engenharia de extensão (P1A) consistente com o protocolo de fechamento do texto principal: o “teste de pressão padronizado da linha de base DM”. Seu posicionamento é: sem introduzir muitos graus de liberdade e sem alterar o mapeamento compartilhado RC-bin→GGL-bin nem o arcabouço de auditoria, elevar o DM_RAZOR mínimo usado no texto principal (NFW + c–M fixa, sem scatter/sem contração/sem core) a um conjunto de linhas de base DM mais próximo da prática astrofísica e mais resistente a objeções comuns. O P1A cobre e supera os três ramos anteriores de teste de pressão: preserva SCAT/AC/FB, acrescenta dispersão hierárquica c–M + prior, proxy de core de um parâmetro e nuisance m de calibração de shear do lado do lenteamento, e oferece o modelo combinado DM_STD; mantém também o EFT_BIN como referência de comparação.

Observação complementar: as intensidades de fechamento e outros valores no apêndice B (P1A) usam um orçamento de Monte Carlo mais alto (por exemplo, ndraw=400, nperm=24), diferente do orçamento quick do texto principal usado para cobrir toda a família de núcleos EFT (por exemplo, ndraw=60, nperm=12). Portanto, os valores absolutos podem ter deriva de amostragem da ordem de O(10); mas as comparações entre modelos dentro do mesmo orçamento e da mesma tabela são justas, e o sinal e a escala da vantagem permanecem estáveis sob orçamentos diferentes.

B.1 Objetivo e posicionamento (Why P1A, and why as an Appendix)

O P1A não tenta esgotar todas as possibilidades de modelagem de halos ΛCDM, como não esfericidade, dependência ambiental, conexões galáxia-halo complexas ou física bariônica de alta dimensão. Ao contrário, o P1A segue o princípio “baixa dimensão, auditabilidade e reprodutibilidade”: cada módulo de aprimoramento introduz no máximo um parâmetro efetivo-chave e continua submetido às três restrições rígidas deste artigo:
(i) livro-caixa de parâmetros: todo novo parâmetro deve ser contabilizado explicitamente e relatado junto com os critérios de informação (AICc/BIC);
(ii) mapeamento compartilhado: mantém-se o mesmo agrupamento RC-bin→GGL-bin, sem permitir “ajustar o mapeamento” para um único conjunto de dados;
(iii) teste de fechamento: todo aprimoramento deve produzir ganho real na previsão transferida RC→GGL, não apenas melhorar o ajuste RC-only.

B.2 DM 7+1 + DM_STD: definição dos módulos, parâmetros e entrada no posterior conjunto

Como runpack independente, o P1A fornece 8 workspaces DM (DM 7+1) e 1 controle EFT: toma o DM_RAZOR como baseline, constrói três aprimoramentos legacy de um parâmetro (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB), acrescenta três módulos defensivos mais padrão (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M) e, por fim, oferece o modelo combinado DM_STD. Esses módulos compartilham um objetivo: cobrir, com o menor aumento dimensional possível, as três classes de objeções mais comuns: (a) como a dispersão e o prior da relação c–M entram em um modelo hierárquico; (b) se o efeito principal do baryonic feedback pode ser aproximado por um proxy de core de um parâmetro; (c) se uma sistemática-chave do lado do lenteamento poderia ser confundida com um sinal físico.

Workspace	dm_model	Novo parâmetro (≤1)	Motivação física (núcleo)	Princípio de implementação (auditável)
DM_RAZOR	NFW (fixed c–M, no scatter)	—	Linha de base de halo ΛCDM mínima e auditável; comparação estrita com a EFT	Mapeamento compartilhado fixo; livro-caixa de parâmetros estrito; baseline apenas para comparação relativa
DM_RAZOR_SCAT	NFW + c–M scatter (legacy)	σ_logc	A relação c–M tem dispersão; aproximada por scatter log-normal de um parâmetro	≤1 novo parâmetro; mapeamento compartilhado preservado; ganho de fechamento como critério
DM_RAZOR_AC	NFW + Adiabatic Contraction (legacy)	α_AC	A queda bariônica pode induzir contração adiabática do halo; aproximada por uma intensidade	≤1 novo parâmetro; mapeamento inalterado; relatar AICc/BIC e fechamento
DM_RAZOR_FB	NFW + feedback core (legacy)	log r_core	O feedback pode formar um core interno; aproximado por uma escala de core	≤1 novo parâmetro; mesmo fechamento/controle; RC-only não é o único objetivo
DM_HIER_CMSCAT	Hierarchical c–M scatter + prior	σ_logc (hier)	Modelo hierárquico c_i∼logN(c(M_i),σ_logc), afetando o posterior conjunto RC+GGL	Prior explícito; c_i latente marginalizado; baixa dimensão e auditabilidade
DM_CORE1P	Proxy de core 1P (inspirado em coreNFW/DC14)	log r_core	Proxy de core para o efeito principal do baryonic feedback; evita detalhes de formação estelar de alta dimensão	Citações padrão; ≤1 novo parâmetro; vinculado ao fechamento
DM_RAZOR_M	NFW + nuisance de calibração de shear do lenteamento	m_shear (GGL)	Absorver sistemática-chave do lenteamento fraco por parâmetro efetivo	Nuisance contabilizado; sem efeito reverso sobre RC; prioriza robustez
DM_STD	Baseline DM padronizada (HIER_CMSCAT + CORE1P + m)	σ_logc + log r_core (+ m_shear)	Integra as três objeções mais comuns em uma baseline ainda de baixa dimensão	Livro-caixa + critérios de informação; fechamento como indicador principal

Nota: a nomenclatura dos parâmetros segue a implementação de engenharia (por exemplo, σ_logc, α_AC, log r_core, m_shear). O desenho do P1A visa “fortalecer um pouco a linha de base DM, mas mantê-la auditável”, não transformar o lado DM em um ajustador de alta dimensão incontrolável. Em particular, o DM_HIER_CMSCAT introduz c–M scatter de modo hierárquico: a concentração c_i de cada halo é definida como uma dispersão log-normal em torno de c(M_i), restringida pelo σ_logc global e pelo prior c(M); essa estrutura hierárquica afeta simultaneamente o posterior conjunto RC e GGL.

B.3 Protocolo estatístico e produtos consistentes com o texto principal

O P1A reutiliza todos os produtos de dados, o mapeamento compartilhado e o arcabouço de auditoria do texto principal, mantendo a mesma sequência de execução e a mesma terminologia dos produtos:
(1) Run‑1: inferência RC-only (saídas posterior_samples.npz e metrics.json);
(2) Run‑2: teste de fechamento RC→GGL (saídas closure_summary.json e baseline permutada);
(3) Run‑3: ajuste conjunto RC+GGL (saída joint_summary.json).
Todos os números citados vêm da tabela de resumo automática Tab_S1_P1A_scoreboard e podem ser verificados, após a reexecução do fluxo completo, pelo full_fit_runpack P1A e por seu script interno de comparação com a tabela reference.

B.4 Resultados principais, entrada de tabelas/figuras e plano de arquivamento (mesmo DOI)

Esta seção apresenta as principais conclusões quantitativas do P1A. A tabela B1 resume os indicadores-chave de RC-only, fechamento RC→GGL e ajuste conjunto RC+GGL; os valores entre parênteses são relativos à baseline DM_RAZOR. A intensidade de fechamento é definida como ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ (maior é melhor). A figura B1 visualiza o mesmo scoreboard. Os pontos principais são:
• entre os três ramos legacy, apenas DM_RAZOR_FB (feedback/core) traz uma pequena melhora líquida da intensidade de fechamento: 122.21→129.45 (+7.25); SCAT e AC não trazem ganho líquido;
• os novos DM_HIER_CMSCAT e DM_RAZOR_M têm impacto muito pequeno (~0) sobre a intensidade de fechamento, e o DM_CORE1P tampouco mostra ganho líquido significativo;
• o modelo combinado DM_STD pode melhorar significativamente o joint logL, aproximando-se mais do ótimo do ajuste conjunto, mas sua intensidade de fechamento cai; isso indica que a melhora vem sobretudo de flexibilidade no ajuste conjunto, não de transferibilidade preditiva entre sondas;
• o EFT_BIN, como controle de comparação, mantém vantagem clara tanto em intensidade de fechamento quanto em ajuste conjunto; portanto, a conclusão principal do texto é robusta à introdução de uma linha de base DM mais forte e de um nuisance de lenteamento.

Para facilitar a comparação direta com a análise principal, as tabelas S1a–S1b do texto resumem os resultados estritos da família EFT frente ao DM_RAZOR: os modelos EFT melhoram o ajuste conjunto em ΔlogL_total≈1155–1337 em relação ao DM_RAZOR e atingem ΔlogL_closure=172–281 no teste de fechamento. O P1A apenas torna o lado DM um adversário mais exigente; sua função é reduzir objeções do tipo “strawman baseline / systematics-as-physics”, não substituir a comparação principal.

Tabela B1 | Scoreboard P1A (maior é melhor; os parênteses indicam a diferença em relação à baseline DM_RAZOR).

Ramo do modelo (workspace)	Δk	best logL_RC RC-only (Δ)	Intensidade de fechamento ΔlogL_closure (Δ)	best logL_total conjunto (Δ)
DM_RAZOR	0	-15702.654 (+0.000)	122.205 (+0.000)	-27347.068 (+0.000)
DM_RAZOR_SCAT	1	-15702.294 (+0.361)	121.236 (-0.969)	-23153.311 (+4193.758)
DM_RAZOR_AC	1	-15703.689 (-1.035)	121.531 (-0.674)	-23982.557 (+3364.511)
DM_RAZOR_FB	1	-15496.046 (+206.609)	129.454 (+7.249)	-27478.531 (-131.463)
DM_HIER_CMSCAT	1	-15702.644 (+0.010)	121.978 (-0.227)	-23153.160 (+4193.908)
DM_CORE1P	1	-15723.158 (-20.504)	122.056 (-0.149)	-27336.258 (+10.810)
DM_RAZOR_M	0 (+m)	-15702.654 (+0.000)	122.205 (+0.000)	-27340.451 (+6.617)
DM_STD	2 (+m)	-15832.203 (-129.549)	105.690 (-16.515)	-22984.445 (+4362.623)
EFT_BIN	1	-14631.537 (+1071.117)	204.620 (+82.415)	-19001.142 (+8345.926)

Figura B1 | Scoreboard P1A: ΔlogL de fechamento e conjunto em relação à baseline (maior é melhor).

As tags de uma série de execuções já concluída deste apêndice são as seguintes (para localizar produtos intermediários, tabelas e figuras do P1A):
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.

B.5 Forma de citação recomendada (Appendix citation note)

Quando o leitor precisar citar o “teste de pressão padronizado da linha de base DM” além das conclusões principais do texto, recomenda-se acrescentar à citação principal: ‘See Appendix B (P1A) for standardized DM baseline stress tests (legacy SCAT/AC/FB + hierarchical c–M scatter prior + core proxy + lensing shear-calibration nuisance), under the same closure protocol.’