Теория энергетических филаментов (Energy Filament Theory, EFT): рамка средней гравитации в сравнении с минимальной NFW-базовой моделью холодной тёмной материи (DM)

Автор: Guanglin Tu
Email: riniky@energyfilament.org | ORCID: 0009-0003-7659-6138
Аффилиация: рабочая группа EFT, Shenzhen Energy Filament Science Research Co., Ltd. (Китай)
Версия: v1.1 | дата: 2026-02-14

Препринт (без рецензирования) | Настоящая версия предназначена для публичного распространения и воспроизводимой проверки; она не является окончательной журнальной публикацией.

Лицензия: отчёт (CC BY-NC-ND 4.0); полный пакет воспроизведения (CC BY 4.0).

Публикуемая версия отчёта (Concept DOI): https://doi.org/10.5281/zenodo.18526334
Полный пакет воспроизведения (Concept DOI): https://doi.org/10.5281/zenodo.18526286

0 Исполнительное резюме (Executive Summary)

Этот отчёт представляет собой полную архивную версию (архивная редакция), размещённую в Zenodo. Он даёт единую проверяемую цепочку: от данных, модельного журнала, честного сравнения и теста замыкания до материалов воспроизведения. Приложение B (P1A) служит дополнением по устойчивости: в нём сосредоточен стресс-тест «более стандартная DM-базовая модель + ключевая систематическая ошибка линзирования», предназначенный для проверки чувствительности основных выводов текста к более реалистичному моделированию DM и к обработке систематик линзирования.

Ключевые выводы (четыре фразы, пригодные для прямого цитирования; см. раздел 2.4):

(1) В подгонке кривых вращения (RC) семейство EFT существенно превосходит DM_RAZOR при всех сочетаниях ядер и априорных настроек; типичное улучшение составляет Δlog𝓛_RC ≈ 10^3 (см. таблицу S1a).
(2) В тесте замыкания RC→GGL EFT демонстрирует более сильную переносимость между зондами: сила замыкания Δlog𝓛_closure (True−Perm) значительно выше, чем у DM_RAZOR, а различие устойчиво к сканированию shrinkage ковариации, R_min и σ_int (см. рис. S3 и таблицу S1b).
(3) В совместной подгонке (RC+GGL) EFT сохраняет стабильное преимущество; при отрицательном контроле, где разрушается общая карта соответствия, это преимущество схлопывается. Это поддерживает интерпретацию, что «эффект средней гравитации» возникает из общей карты, а не из случайности подгонки (см. рис. S4).
(4) Приложение B (P1A) без существенного увеличения размерности усиливает сторону DM более стандартными модулями базовой модели и одним ключевым nuisance-параметром систематики линзирования; эти усиления не устраняют преимущество EFT в замыкании (см. таблицу B1 и рис. B1).

Доступность данных и кода: отчёт Concept DOI 10.5281/zenodo.18526334; полный пакет воспроизведения Concept DOI 10.5281/zenodo.18526286. Метки, соответствующие приложению B (P1A): run_tag=20260213_151233, closure_tag=20260213_161731, joint_tag=20260213_195428.

1 Аннотация

Мы проводим воспроизводимое количественное сравнение двух теоретических рамок на одних и тех же данных и в одном статистическом протоколе: модели «модификации средней гравитации», предложенной Теорией энергетических филаментов (Energy Filament Theory, EFT; не совпадает по смыслу с распространённым сокращением Effective Field Theory), и базовой модели гало NFW для холодной тёмной материи (DM_RAZOR). DM_RAZOR намеренно выбран как «минимальная DM-базовая модель»: гало NFW + фиксированное соотношение c–M, без halo-to-halo разброса, чтобы обеспечить проверяемый и воспроизводимый контроль. Важно подчеркнуть: в этой работе EFT рассматривается как феноменологическая, MOND-подобная параметризация Эффективное поле / эффективного отклика для проверки в едином статистическом протоколе, а не как вывод её микроскопических первых принципов.

Данные включают: 2295 точек скоростей кривых вращения SPARC после унифицированной предобработки и бинирования (104 галактики, 20 RC-bin), а также эквивалентную поверхностную плотность ΔΣ(R) для слабого линзирования галактика–галактика (GGL) из KiDS-1000 (4 бина по звёздной массе × 15 точек R в каждом бине, всего 60 точек, с использованием полной ковариации).

Мы последовательно выполняем вывод RC-only, тест замыкания RC→GGL (closure), вывод GGL-only и совместный вывод RC+GGL; аудит согласованности гарантирует трассируемость всех цитируемых чисел. При строгом параметрическом журнале и ограничении общей карты соответствия (DM: 20 log M200_bin; EFT: 20 log V0_bin + 1 глобальный log ℓ) семейство EFT заметно превосходит DM_RAZOR в совместной подгонке: ΔlogL_total = 1155–1337 относительно DM_RAZOR. Ещё важнее, тест замыкания показывает, что постериорное распределение RC обладает нетривиальной предсказательной силой для GGL: сила замыкания EFT ΔlogL_closure = 172–281 выше, чем 127 у DM_RAZOR. После случайного перемешивания групп RC-bin→GGL-bin сигнал замыкания падает до 6–23, что исключает статистическую случайность или смещение реализации. При систематическом сканировании σ_int, R_min и covariance shrinkage относительное преимущество EFT остаётся положительным и устойчивым по порядку величины. Чтобы ответить на распространённые возражения вида «DM-базовая модель слишком слабая» или «систематика принята за физику», в приложении B (P1A) мы даём более стандартный, но всё ещё низкоразмерный и проверяемый стресс-тест DM-базовой модели, включающий иерархический c–M разброса + prior, одно-параметрический core-прокси, lensing m и комбинированную модель DM_STD. В том же протоколе замыкания эти усиления не устраняют преимущество EFT (см. таблицу B1 / рис. B1).

Ключевые слова: кривые вращения; слабое линзирование галактика–галактика; тест замыкания; EFT; холодная тёмная материя; байесовский вывод

2 Введение и обзор результатов

Кривые вращения (RC) и слабое линзирование галактика–галактика (GGL) являются двумя взаимодополняющими гравитационными зондами: RC ограничивают динамический потенциал в плоскости диска и связь радиального ускорения (RAR), а GGL измеряет проецированное распределение массы и гравитационный отклик на масштабе гало. Для любой кандидатной теории решающим является не то, способна ли она по отдельности подогнать оба набора данных, а то, способна ли она дать согласованное объяснение при одной и той же межданной карте соответствия и общих ограничениях.

Поэтому центральным статистическим протоколом работы является «тест замыкания (closure test)»: сначала постериорное распределение RC-only используется для прямого предсказания GGL, затем результат сравнивается с отрицательным контролем, в котором карта RC-bin→GGL-bin переставляется (permutation / shuffle). Так оценивается предсказательная переносимость между наборами данных (predictive transferability) и исключается ложный сигнал, вызванный смещением реализации или случайной подгонкой.

Теоретическое позиционирование и область действия: эта статья не пытается дать микроскопический вывод EFT (Теории энергетических филаментов) из первых принципов или её полную релятивистскую форму. Напротив, мы рассматриваем EFT как низкоразмерную, MOND-подобную параметризацию эффективного поля / эффективного отклика, описанную ядром f(x) и глобальным масштабом ℓ, и в рамках строгого параметрического журнала проверяем её межданную согласованность и предсказательную переносимость через тест замыкания RC→GGL.

План исследования и заявление об области действия: настоящая работа относится к продолжающейся P-серии наблюдательных поисков. В существующих данных галактического масштаба мы ищем два возможных эффективных фоновых вклада: (i) «гравитационную подложку» (mean gravity floor), описываемую грубо осреднённым средним гравитационным откликом, и (ii) «шумовую подложку» (stochastic/noise floor), связанную с флуктуациями микропроцессов. В данной статье (P1) мы сосредоточены только на первом: без введения предположений о конкретном микроскопическом механизме через тест замыкания RC→GGL ищутся наблюдательные признаки средней гравитационной подложки, а затем они сравниваются с проверяемой DM-базовой моделью в едином контрольном протоколе. В качестве эвристической физической картины: если существуют короткоживущие степени свободы, их распад / аннигиляция может превращать массу покоя в энергию-импульс, переносимый другими степенями свободы; на эффективном уровне это естественно соответствует разложению «средний вклад + флуктуационный вклад». Однако в этой статье такая микроскопическая картина количественно не моделируется.

Чтобы избежать чрезмерной интерпретации, границы статьи заданы так:
• Что делает статья: при строгом параметрическом журнале и общей карте соответствия она с помощью теста замыкания измеряет предсказательную переносимость между наборами данных и воспроизводимо сравнивает средний гравитационный отклик EFT с DM-базовой моделью.
• Чего статья не делает: она не обсуждает микроскопические механизмы возникновения, обилия / времена жизни или космологические ограничения; не моделирует случайный член, соответствующий «шумовой подложке».
• Чего статья не утверждает: её цель не состоит в опровержении тёмной материи; P1 не выносит окончательный вердикт о том, существует ли «подложка», а сообщает промежуточное свидетельство: в выбранной здесь устойчивой измерительной области данные предпочитают модель, содержащую средний гравитационный отклик.

Одновременно мы явно указываем, что DM_RAZOR представляет только минимальную и проверяемую NFW-базовую модель: фиксированное c–M без разброса; без Adiabatic Contraction, ядра обратной связи, несферичности и средовых членов. Поэтому главный вывод текста строго ограничен следующим: при этой минимальной базовой модели и строгих ограничениях параметрического журнала / карты соответствия межданная согласованность EFT сильнее. Чтобы ответить на распространённый вопрос, может ли более стандартная ΛCDM-базовая модель вместе с моделированием ключевой систематики линзирования существенно изменить вывод, мы выносим более стандартные, но всё ещё низкоразмерные и проверяемые усиления DM, а также lensing-side nuisance, в приложение B (P1A: стандартизованный стресс-тест DM-базовой модели), сохраняя полностью тот же протокол общей карты соответствия и замыкания, что и в основном тексте (см. таблицу B1 / рис. B1).

2.1 Tab S1a–S1b: сводка ключевых показателей (Strict)

В таблице S1a приведены основные показатели совместной подгонки (RC+GGL: logL, ΔlogL, AICc, BIC); в таблице S1b — показатели теста замыкания и сканирования устойчивости (closure, shuffle-отрицательный контроль, диапазоны сканирования σ_int / R_min / cov-shrink). Все числа взяты из строгой сводной главной таблицы Tab_Z1_master_summary и могут быть поэлементно прослежены в опубликованном архивном пакете.

Таблица S1a | Основные показатели сравнения совместной подгонки (RC+GGL, Strict).

Модель (workspace)	W-ядро	k	Совместный logL_total (best)	ΔlogL_total vs DM	AICc	BIC
DM_RAZOR	none	20	-16927.763	0.0	33895.885	34010.811
EFT_BIN	none	21	-15590.552	1337.21	31223.501	31344.155
EFT_WEXP	exponential	21	-15668.83	1258.932	31380.057	31500.711
EFT_WYUK	yukawa	21	-15772.936	1154.827	31588.268	31708.922
EFT_WPOW	powerlaw_tail	21	-15633.321	1294.442	31309.038	31429.692

Таблица S1b | Показатели замыкания и устойчивости (Strict).

Модель (workspace)	Замыкание ΔlogL (true-perm)	ΔlogL после shuffle отрицательного контроля	Диапазон ΔlogL при сканировании σ_int	Диапазон ΔlogL при сканировании R_min	Диапазон ΔlogL при сканировании cov-shrink
DM_RAZOR	126.678	22.725	—	—	—
EFT_BIN	231.611	14.984	459–1548	1243–1289	1337–1351
EFT_WEXP	171.977	6.04	408–1471	1169–1207	1259–1277
EFT_WYUK	179.808	14.688	380–1341	1065–1099	1155–1166
EFT_WPOW	280.513	6.672	457–1500	1203–1247	1294–1308

2.2 Fig S3: сила замыкания (RC-only → предсказание GGL)

Сила замыкания определяется как ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩: на постериорных выборках RC-only выполняется прямое предсказание GGL и сравнение с отрицательным контролем, где карта RC-bin→GGL-bin переставлена.

Рис. S3 | Сила замыкания (чем больше, тем лучше): среднее преимущество лог-правдоподобия в предсказании GGL из RC-only.

2.3 Fig S4: основное сравнение совместной подгонки (RC+GGL)

Преимущество совместной подгонки определяется как ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR). При одних и тех же данных, одной и той же карте соответствия и почти одинаковом масштабе параметров семейство EFT получает значительно более высокое совместное лог-правдоподобие.

Рис. S4 | Преимущество совместной подгонки (чем больше, тем лучше): best logL_total для RC+GGL относительно DM_RAZOR.

2.4 Четыре вывода (пригодны для прямого цитирования)

(1) В едином совместном анализе кривых вращения SPARC и слабого линзирования KiDS-1000 модель средней гравитации EFT систематически превосходит DM_RAZOR в строгом контрольном протоколе: ΔlogL_total = 1155–1337 относительно DM_RAZOR.

(2) Тест замыкания RC→GGL показывает более сильную предсказательную согласованность EFT: ΔlogL_closure = 172–281, тогда как у DM_RAZOR — 127; после случайного перемешивания групп RC-bin→GGL-bin сигнал замыкания падает до 6–23, что показывает зависимость сигнала от правильной межданной карты, а не от случайной подгонки.

(3) Систематические сканирования σ_int, R_min и covariance shrinkage не меняют ни знак, ни порядок величины вывода «EFT лучше DM_RAZOR», что указывает на устойчивость результата к распространённым систематическим возмущениям.

(4) Приложение B (P1A) в том же протоколе замыкания усиливает DM-базовую модель «стандартизованным и проверяемым» образом: сохраняет три одно-параметрических усиления (SCAT/AC/FB), добавляет иерархический c–M разброса + prior, одно-параметрический core-прокси и shear-калибровку m на стороне линзирования, а также их комбинацию DM_STD. Результат показывает: только ветвь feedback/core даёт небольшое чистое улучшение силы замыкания (122.21→129.45, ΔΔlogL_closure≈+7.25); остальные усиления либо незначимы, либо отрицательны. Поэтому главный вывод текста не зависит от предположения, что DM_RAZOR является слишком слабой базовой моделью.

3 Данные и предобработка

В исследовании используются два типа открытых данных. Внутри инженерного контура загрузка, проверка (sha256) и предобработка выполняются трассируемыми скриптами. Чтобы обеспечить честное межмодельное сравнение, все рабочие пространства (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) используют полностью одинаковые продукты данных и одну и ту же карту бинирования.

3.1 Кривые вращения (RC, SPARC)

Данные RC взяты из Rotmod_LTG базы SPARC (175 rotmod-файлов). После предобработки в моделирование включены 104 галактики, всего 2295 точек (r, V_obs), распределённых по 20 RC-bin согласно правилам, включая звёздную массу. Каждая точка содержит радиус r (кпк), наблюдаемую скорость V_obs (км/с), ошибку σ_obs, а также скорости газовой, дисковой и балджевой компонент (V_gas, V_disk, V_bul).

3.2 Слабое линзирование (GGL, KiDS-1000 / Brouwer+2021)

Для GGL используются данные Brouwer et al. (2021) по эквивалентной поверхностной плотности ΔΣ(R) из Fig. 3 для KiDS-1000: 4 бина по звёздной массе, по 15 точек R в каждом бине, с полной предоставленной ковариацией. В инженерной реализации исходная long-form ковариация восстановлена в матрицу 15×15 для каждого бина; в аудите Stage-B проверены размерность и численная разумность.

3.3 Карта RC-bin → GGL-bin и общий объём выборки

Четыре массовых бина GGL связаны с 20 бинами RC фиксированной картой: каждому GGL-bin соответствуют 5 RC-bin, а вклад RC-bin усредняется с весами по числу галактик. Эта карта не меняется ни в одной модели и является центральным ограничением честного сравнения в тесте замыкания и совместной подгонке. Итоговое число совместных точек данных n_total = 2355 (RC=2295, GGL=60).

4 Модели и статистический метод

4.1 Минимальная математическая спецификация EFT и DM (проверяемая / тестируемая)

В этом разделе даётся минимальная математическая спецификация, напрямую сопоставимая с реализацией.

(a) Модель кривых вращения (RC)

Для каждой точки RC (r, V_obs, σ_obs) мы используем сложение компонент: V_mod²(r) = V_bar²(r) + V_extra²(r). Здесь V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r). В основных результатах этой статьи принято Υ_d = Υ_b = 0.5, что согласуется с эмпирической рекомендацией SPARC и одновременно сокращает ненужные степени свободы.

(b) Модификация средней гравитации EFT (EFT)

Дополнительный член EFT параметризуется в форме «среднего квадрата скорости»: V_extra²(r) = V0_bin² · f(r/ℓ). Здесь V0_bin — амплитудный параметр для каждого RC-bin (20 параметров), ℓ — глобальный масштаб (1 параметр), а f(x) — безразмерная функция формы ядра. В работе сравниваются следующие формы ядра, не вводящие дополнительных непрерывных степеней свободы:

none: f(x)=x/(1+x)
exponential: f(x)=1−exp(−x)
yukawa: f(x)=1−exp(−x)·(1+0.5x)
powerlaw_tail: f(x)=1−(1+x)^(−1/2)
(необязательный контроль) gaussian: f(x)=erf(x/√2) (не включается в набор основных выводов)

Физическая мотивация (расширение): EFT понимает дополнительный гравитационный отклик на галактических масштабах как эффективный отклик после грубого осреднения / масштабного усреднения более микроскопического действия на конечном масштабе. В этой статье мы не предполагаем конкретный микроскопический механизм, а используем минимальную, проверяемую параметризацию для контролируемого сравнения и тестирования в едином статистическом протоколе.

Для интуитивного понимания дополнительный член можно записать в форме ускорения: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). Когда r≫ℓ, f→1 и V_extra→V0_bin, что даёт приблизительно плоский дополнительный скоростной вклад во внешней области. Когда r≪ℓ и f(x)≈x, возникает характерный масштаб ускорения a0,bin≈V0_bin²/ℓ, с точностью до O(1)-фактора ядра, что даёт MOND-подобную интуицию перехода между внутренней и внешней областями.

Используемое здесь дискретное семейство ядер (none/exponential/yukawa/powerlaw_tail) можно рассматривать как низкоразмерные proxy для разных «начальных наклонов / скоростей перехода / дальних хвостов» — например, Yukawa-like экранирование против более длиннохвостого отклика. Оно служит стресс-тестом устойчивости, а не исчерпанием пространства моделей. В слабом линзировании мы строим эквивалентную оболочечную массу и плотность из V_avg(r) и затем проецируем их в ΔΣ(R). Эту эффективную плотность следует понимать как описание потенциала линзирования при предположениях сферической симметрии и слабого поля; полные детали вынесены в приложение A.

Все указанные формы ядра при x→∞ удовлетворяют f(x)→1, то есть V_extra²→V0² насыщается, а при x≪1 дают линейный или суб-линейный рост: например, exponential: f≈x; yukawa: f≈0.5x; powerlaw_tail: f≈0.5x. Поэтому различные формы ядра дают наблюдаемые отличия по «начальному наклону», скорости перехода и внешнему хвосту на малых радиусах; их можно различать совместной подгонкой RC+GGL и тестом замыкания.

Предсказание EFT для слабого линзирования ΔΣ(R) выводится из V_avg(r) через оболочечную массу и плотность, затем через проекционный интеграл: M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr, ΔΣ(R)=Σ̄(<R)−Σ(R). Численная реализация использует логарифмическую сетку и адаптивное уплотнение при аномалиях, чтобы обеспечить устойчивость и воспроизводимость.

(c) DM_RAZOR: NFW-базовая модель гало холодной тёмной материи

Также мы явно указываем, что DM_RAZOR представляет только минимальную и проверяемую NFW-базовую модель: фиксированное c–M без разброса; без Adiabatic Contraction, ядра обратной связи, несферичности и средовых членов. Чтобы снизить риск «strawman baseline», статья не утверждает, что эти эффекты не существуют; наоборот, мы включаем их в приложение B (P1A) как низкоразмерные и проверяемые стресс-тесты, включая иерархическую обработку c–M разброса, core-прокси и nuisance shear-калибровки на стороне линзирования.

4.2 Журнал моделей и честное сравнение (общие параметры = определение замыкания)

Число параметров в основном наборе сравнения: DM_RAZOR k=20; семейство EFT k=21, где дополнительный параметр — глобальный log ℓ. Все модели используют одни и те же данные RC, данные GGL и ковариацию, одну и ту же карту RC-bin→GGL-bin, один и тот же барионный член и преобразования единиц. Кроме того, форма ядра (none / exponential / yukawa / powerlaw_tail) является дискретным выбором и не вводит дополнительных непрерывных параметров, что исключает преимущество за счёт «ещё одной степени свободы».

4.3 Likelihood, априорные распределения и сэмплер

Likelihood для RC задаётся диагональным гауссианом: σ_eff² = σ_obs² + σ_int²; в основных результатах фиксируется σ_int=5 км/с, а в Run-5 выполняется сканирование σ_int. Likelihood для GGL использует полную ковариационную гауссову модель по каждому бину: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). Совместная цель: logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ). Априорные ограничения в основном задают физически допустимые границы — интервалы для log ℓ, log V0 и log M200; при включении свободных Υ и σ_int используются слабо информативные априоры (см. конфигурации реализации и release-пакета).

Сэмплер — адаптивное блочное случайное блуждание Metropolis: на каждом шаге обновляется только случайный подблок параметрического пространства, чтобы повысить acceptance rate в высокой размерности; шаги слегка адаптируются по оконной доле принятия, целевая доля около 0.25. Основные результаты получены в quick-режиме (например, n_steps=800), а для каждого рабочего пространства выводятся trace, residual и PPC-графики для ручного и скриптового аудита.

4.4 Тест замыкания и отрицательный контроль (определение)

Тест замыкания (Run-2) проверяет, может ли постериорное распределение RC-only предсказывать GGL без повторной подгонки GGL. Процедура такова: на постериорных выборках RC-only генерируются ΔΣ(R) для 4 GGL-bin, затем с полной ковариацией вычисляется logL_true; далее группировка RC-bin→GGL-bin случайно переставляется (permutation), что даёт logL_perm. Сила замыкания определяется как ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩. Кроме того, Run-10 случайно перегруппировывает 20 RC-bin в 4×5 (shuffle) и пересчитывает замыкание, чтобы проверить зависимость сигнала от правильной карты соответствия.

5 Основные результаты и интерпретация

5.1 Основные результаты совместной подгонки (RC+GGL)

Best logL_total совместной подгонки и относительное преимущество ΔlogL_total относительно DM_RAZOR приведены в таблице S1a и на рис. S4. В основном наборе сравнения наибольшее совместное преимущество имеет EFT_BIN (ΔlogL_total=1337.210); остальные формы ядер EFT также сохраняют значительное преимущество (1154.827–1294.442). По информационным критериям (AICc/BIC) семейство EFT также существенно превосходит DM_RAZOR, что показывает: преимущество не является смещением от числа параметров.

Примечание: основной вклад в ΔlogL_total≈1337 приходит из члена RC: в joint-разложении ΔlogL_RC≈1065, около 80%. Это можно понимать как умеренное улучшение Δχ²≈0.90 на одну точку при N=2295 точках RC, которое в диагональном гауссовом likelihood естественно накапливается до преимущества порядка 10^3. В то же время GGL и тест замыкания дают независимые междатасетные ограничения, а ранжирование остаётся стабильным в стресс-тестах σ_int, R_min и cov‑shrink (см. раздел 6 и таблицу S1b).

5.2 Результаты теста замыкания (RC-only → GGL)

Ключевая величина теста замыкания ΔlogL_closure приведена в таблице S1b и на рис. S3. Сила замыкания семейства EFT составляет 171.977–280.513, что выше 126.678 у DM_RAZOR. Это означает, что при запрете любых дополнительных межданных степеней свободы постериорные выборки, полученные EFT на данных RC, обладают более сильной переносимой предсказательной способностью для данных GGL.

Отрицательный контроль дополнительно поддерживает физическую связность сигнала замыкания: после случайного перемешивания групп RC-bin→GGL-bin сила замыкания EFT падает до 6–15 в зависимости от ядра, тогда как исходная сила замыкания составляла 172–281. Это «схлопывание сигнала» исключает ложное преимущество, вызванное численной реализацией, ошибкой единиц или некорректной обработкой ковариации.

Рис. R1 | Отрицательный контроль: после shuffle-группировки сигнал замыкания существенно снижается (построено по метрикам Tab_Z1).

5.3 Смысл и ограничения результатов

Вывод исследования таков: «в данном наборе данных и данном протоколе модификация средней гравитации EFT превосходит протестированную базовую модель DM_RAZOR». Нужно подчеркнуть: сторона DM использует только минимальную NFW-базовую модель с фиксированным c(M), без введения, например, core-образования, несферичности, средовых членов или более сложных моделей связи галактика–гало. Поэтому статья не утверждает, что исключает все семейства DM-моделей; она предоставляет воспроизводимую контрольную базовую модель, центрированную на тесте замыкания, для оценки того, могут ли RC и GGL быть согласованно объяснены одним набором межданных параметров и одной картой.

Чтобы ответить на это распространённое сомнение, мы выполнили независимое расширение P1A (см. приложение B), которое усиливает DM-базовую модель «стандартизованным и проверяемым» образом, не меняя общей карты RC-bin→GGL-bin и рамки аудита. Помимо трёх одно-параметрических усилений (SCAT/AC/FB), добавлены: (i) иерархический c–M разброса + mass–concentration prior (DM_HIER_CMSCAT), (ii) одно-параметрический baryonic-ядра обратной связи-прокси (DM_CORE1P) и (iii) nuisance-параметр shear-калибровки слабого линзирования m (DM_RAZOR_M), а также комбинированная модель DM_STD. EFT_BIN сохраняется как контрольный ориентир.

• DM_RAZOR_SCAT (c–M разброса) — вводит параметр рассеяния концентрации halo-to-halo σ_logc, чтобы проверить, не занижает ли фиксированное c(M) систематически объяснительную способность DM;
• DM_RAZOR_AC (Adiabatic Contraction) — использует один параметр α_AC для непрерывной интерполяции между «нет сжатия» и «стандартное сжатие», чтобы минимальной ценой уловить тенденцию внутреннего сжатия, вызванного барионами;
• DM_RAZOR_FB (Feedback / core) — описывает подавляющее действие core-образования во внутренней области на кривые вращения с помощью масштаба ядра, например log r_core, сохраняя NFW-приближение на масштабах слабого линзирования.

Количественный scoreboard P1A приведён в приложении B, таблица B1 / рис. B1, и автоматически формируется из Tab_S1_P1A_scoreboard. По метрике замыкания DM_RAZOR_FB даёт небольшое чистое улучшение (122.21→129.45, +7.25), тогда как остальные усиления не дают значимого или дают отрицательный вклад в силу замыкания. В совместной подгонке включение иерархического c–M разброса prior (DM_HIER_CMSCAT) или комбинированной модели (DM_STD) может существенно улучшить joint logL, но не повышает силу замыкания; это указывает, что в основном растёт гибкость совместной подгонки, а не переносимость между зондами. Поэтому основной вывод текста следует понимать так: при строгой общей карте соответствия и ограничении тестом замыкания преимущество EFT в межданной согласованности не возникает из выбора «слишком слабой базовой модели» на стороне DM. Публикуемый пакет P1A для приложения B — дополнительные таблицы/рисунки и full_fit_runpack — будет добавлен в тот же Zenodo Concept DOI, что и full_fit_runpack этой статьи: https://doi.org/10.5281/zenodo.18526286.

6 Устойчивость и контрольные эксперименты

6.1 Сканирование σ_int (Run-5)

Мы систематически сканируем внутреннюю дисперсию RC σ_int и при каждом значении σ_int повторяем совместный вывод, вычисляя ΔlogL_total относительно DM_RAZOR. Минимальные / максимальные значения ΔlogL_total для каждой модели в диапазоне сканирования приведены в таблице S1b.

Рис. R2 | Диапазон ΔlogL_total при сканировании σ_int (чем больше, тем лучше).

6.2 Сканирование R_min (Run-6)

Чтобы проверить влияние систематических ошибок данных в центральной области — например, не-кругового движения, разрешения и недостаточного моделирования барионов, — мы применяем к RC отсечение порогом R_min и повторяем совместный вывод. Преимущество семейства EFT при сканировании R_min остаётся положительным и устойчивым по порядку величины.

Рис. R3 | Диапазон ΔlogL_total при сканировании R_min (чем больше, тем лучше).

6.3 Сканирование cov-shrink (Run-7)

Чтобы проверить неопределённость ковариации GGL, мы применяем shrinkage к ковариационной матрице каждого массового бина: C_α=(1−α)C+α·diag(C), и сканируем α. Результат показывает, что преимущество семейства EFT нечувствительно к этой обработке.

Рис. R4 | Диапазон ΔlogL_total при сканировании cov-shrink (чем больше, тем лучше).

6.4 Лестница абляций (Run-8)

Внутри EFT_BIN выполняется вложенная абляция: от минимальной модели без свободных параметров к модели с небольшим числом свободных степеней, а затем к полной модели с 20-bin амплитудами и глобальным масштабом. AICc/BIC показывают, что полный EFT_BIN существенно необходим для объяснения данных.

Рис. R5 | Лестница абляций EFT_BIN (AICc; чем меньше, тем лучше).

6.5 Leave-one-bin-out прогнозирование (Run-9)

Мы дополнительно выполняем тест leave-one-bin-out (LOO): из 4 массовых бинов GGL каждый раз исключается один bin, по оставшимся bin и всем RC заново выполняется вывод, а затем на исключённом bin оценивается тестовое лог-правдоподобие. Сводные показатели приведены в дополнительной таблице Tab_R3_leave_one_bin_out (продукт Run-9; шаблон пути к файлу дан в списке ключевых продуктов раздела 8.2). Даже в худшем исключённом случае семейство EFT заметно превосходит DM_RAZOR.

Рис. R6 | LOO: распределение лог-правдоподобия на исключённом bin (из продуктов Run-9).

6.6 Отрицательный контроль: RC-bin shuffle (Run-10)

Run-10 случайно перегруппировывает 20 RC-bin в 4×5 и, сохраняя постериорное распределение RC-only неизменным, пересчитывает замыкание. Результат показывает: по сравнению с исходной картой shuffle существенно снижает mean logL_true и ΔlogL_closure (см. таблицу S1b и рис. R1), что дополнительно поддерживает интерпретируемость сигнала замыкания.

Рис. R7 | Отрицательный контроль: shuffle-карта заметно снижает mean logL_true замыкания (из продуктов Run-10).

7 Трассируемость и аудит согласованности (Provenance)

Все численные значения, цитируемые в статье, поэлементно трассируются в строгих сводных таблицах и аудиторских записях опубликованного архива. Чтобы основной текст читался плавнее, полная цепочка трассируемости — список tag, аудиторские таблицы, перечень checksum и способ проверки — перенесена в приложение A.

8 Воспроизводимость и архив Zenodo (Reproducibility & Archive)

Заявление о доступности данных и кода: использованные в статье кривые вращения SPARC и данные слабого линзирования KiDS-1000 являются открытыми. Публикуемая версия отчёта архивирована в Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526334); полный пакет воспроизведения архивирован в Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526286). Подробные шаги выполнения, среда зависимостей, архивный список и сведения о проверке хэшей приведены в приложении A; дизайн, метки запусков и продукты стандартизованного стресс-теста DM-базовой модели (P1A) приведены в приложении B.

Под одним Concept DOI полного пакета воспроизведения (https://doi.org/10.5281/zenodo.18526286) мы предоставляем два воспроизводимых входа по назначению:
• P1 (основной текст) full_fit_runpack: воспроизводит RC-only / closure / joint и сканирования устойчивости для EFT vs DM_RAZOR, а также генерирует таблицы S1a/S1b и рисунки S3/S4 основного текста;
• P1A (приложение B) full_fit_runpack: воспроизводит стандартизованный стресс-тест DM-базовой модели (SCAT/AC/FB + иерархический c–M разброса prior + core1p + lensing m + DM_STD; включая контроль EFT_BIN) и генерирует таблицу B1 и рисунок B1 приложения.
Дополнительные таблицы/рисунки P1A и full_fit_runpack будут добавлены в тот же Concept DOI как дополнительные файлы, чтобы сохранить единый архивный вход.

9 Благодарности и заявления

9.1 Благодарности

Благодарим команды SPARC и KiDS-1000 за открытые данные и документацию; благодарим участников процесса реконструкции и аудита данного проекта.

9.2 Вклад автора

Guanglin Tu отвечал за концепцию исследования, дизайн протокола, инженерную реализацию, подготовку данных, формальный анализ, реализацию воспроизводимого процесса и аудита, а также написание статьи.

9.3 Источники финансирования

Автор Guanglin Tu финансировал работу самостоятельно; внешнего финансирования и номера гранта нет.

9.4 Конфликт интересов

Автор Guanglin Tu связан с «Рабочей группой EFT, Shenzhen Energy Filament Science Research Co., Ltd. (Китай)»; иных конкурирующих интересов не заявлено.

9.5 Помощь AI

OpenAI GPT-5.2 Pro и Gemini 3 Pro использовались для языковой вычитки, структурного редактирования и упорядочивания воспроизводимого процесса; они не использовались для генерации или изменения данных, результатов, рисунков и кода, а также для генерации ссылок. Автор несёт полную ответственность за содержание текста и точность цитирования.

10 Список литературы

Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.
Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.
Wright, C. O., & Brainerd, T. G. (2000). Gravitational Lensing by Navarro–Frenk–White Halos. The Astrophysical Journal, 534, 34–40.
Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493. DOI: https://doi.org/10.1086/304888
Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374. DOI: https://doi.org/10.1093/mnras/stu742
Blumenthal, G. R., Faber, S. M., Flores, R., & Primack, J. R. (1986). Contraction of dark matter galactic halos due to baryonic infall. Astrophysical Journal, 301, 27. DOI: https://doi.org/10.1086/163867
Di Cintio, A., Brook, C. B., Dutton, A. A., et al. (2014). A mass-dependent density profile for dark matter haloes including the influence of galaxy formation. Monthly Notices of the Royal Astronomical Society, 441, 2986–2995. DOI: https://doi.org/10.1093/mnras/stu729
Read, J. I., Agertz, O., & Collins, M. L. M. (2016). Dark matter cores all the way down. Monthly Notices of the Royal Astronomical Society, 459, 2573–2590. DOI: https://doi.org/10.1093/mnras/stw713
Теория энергетических филаментов. Zenodo (открытое научное хранилище). DOI: https://doi.org/10.5281/zenodo.18517411

Приложение A: детали трассируемости и воспроизводимости

В этом приложении собрана информация для долгосрочного архива: метки запусков, результаты аудита, архивный список и контрольные точки проверки, чтобы читатели могли при необходимости сверить и воспроизвести результаты.

A.1 Детали трассируемости и аудита

Чтобы обеспечить долгосрочную трассируемость, проект присваивает каждому запуску и выводу timestamp tag и сохраняет исторические продукты без перезаписи. Ключевые числа, цитируемые в этой статье, взяты из строгой сводки (compile_tag=20260205_035929) и прошли следующий аудит согласованности:

• Все промежуточные таблицы содержат run_tag и stage tag; строгий сводный скрипт выбирает из report/tables «полные и согласованные» canonical-источники таблиц.

• Числа в Tab_Z1_master_summary и Tab_Z2_conclusion_highlights поэлементно сопоставлены с выбранными canonical-таблицами.

• При генерации PDF выполнен аудит меток «цитируемых таблиц/рисунков», чтобы исключить смешение старых продуктов.

Ключевые метки для локализации всех промежуточных продуктов: run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442.

Результат аудита согласованности: Tab_AUDIT_checks_strict показывает pass=9, fail=0, skip=0 (подробности см. в release-пакете).

A.2 Шаги воспроизведения и архивный список

В работе используется система воспроизведения «публикуемый отчёт + дополнительные таблицы/рисунки + полный перезапускаемый runpack». Читатель может напрямую обратиться к Tables & Figures Supplement, чтобы сверить все табличные и графические активы, цитируемые в статье. Для воспроизведения чисел и аудиторской цепочки с нуля можно использовать full_fit_runpack: он загружает данные и повторно запускает полный процесс; после завершения встроенный reference-скрипт позволяет проверить согласованность табличных значений.

A.2.1 Quickstart воспроизведения (RUN_FULL, Windows PowerShell)

Этот раздел даёт более короткий путь воспроизведения (Windows PowerShell). Для быстрой проверки рекомендуется напрямую открыть Tables & Figures Supplement и поэлементно сверить таблицы и рисунки, цитируемые в статье. Если требуется end-to-end воспроизведение с генерацией всех таблиц, рисунков и аудиторских продуктов, используйте full_fit_runpack: выполните verify_checksums.ps1 и RUN_FULL.ps1 согласно README/ONE_PAGE_REPRO_CHECKLIST внутри пакета (рекомендуется Mode=full).

Архивный вход Zenodo (Concept DOI): https://doi.org/10.5281/zenodo.18526286.
Метки основной цепочки статьи: run_tag=20260204_122515, strict compile_tag=20260205_035929, release_tag=20260205_112442.

A.2.2 Архивные материалы и ключевые контрольные точки (Packages & checks)

Архив Zenodo предоставляет три взаимодополняющих типа материалов: (1) публикуемый отчёт (настоящая статья, v1.1; включает приложение B: стандартизованный стресс-тест DM-базовой модели P1A); (2) Tables & Figures Supplement (дополнительные таблицы и рисунки: охватывает все табличные и графические активы, цитируемые в статье; отдельно для P1 и P1A); (3) full_fit_runpack (полный пакет воспроизведения: загрузка данных с нуля и повторный запуск полного процесса; отдельно для P1 и P1A). Материалы (1)–(2) поддерживают быстрое чтение и независимую проверку, а (3) обеспечивает полноценное end-to-end воспроизведение.

Категория материалов	Имя файла (пример)	Назначение и позиционирование (рекомендуемый порядок использования)
Публикуемый отчёт (китайский и английский)	P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf P1_RC_GGL_report_CN_PUBLICATION_V1_1.pdf	Полный отчёт, архивированный в Zenodo; основной текст даёт главные выводы и аудит устойчивости, приложение B даёт P1A — стандартизованный стресс-тест DM-базовой модели.
Tables & Figures Supplement (P1)	P1_RC_GGL_supplement_figs_tables_V1_1.zip	Все таблицы (CSV) и рисунки (PNG), цитируемые в основном тексте, включая скрипты генерации и файлы меток.
Tables & Figures Supplement (P1A)	P1A_supplement_figs_tables_v1.zip	Все таблицы и рисунки, цитируемые в приложении B (P1A), включая Tab_S1_P1A_scoreboard и Fig_S1_P1A_scoreboard.
full_fit_runpack (P1)	P1_RC_GGL_full_fit_runpack_v1_1.zip	Полное end-to-end воспроизведение: загрузка данных с нуля и повторный запуск RC-only / closure / joint и сканирований устойчивости.
full_fit_runpack (P1A)	P1A_RC_GGL_full_fit_runpack_v1.zip	Полное end-to-end воспроизведение (приложение B): повторный запуск DM 7+1 + DM_STD, включая контроль EFT_BIN, и генерация активов приложения; внутри пакета есть reference-скрипт сравнения таблиц для проверки согласованности табличных чисел.

Рекомендация по цитированию: при цитировании этой статьи или сопутствующих материалов воспроизведения указывайте Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334).

После воспроизведения должны появиться и быть пригодны для сравнения следующие ключевые продукты:

report/tables/Tab_D_closure_summary__20260204_122515__*.csv (сводка замыкания)
report/tables/Tab_F_joint_summary__20260204_122515__*.csv (сводка совместной подгонки)
report/tables/Tab_G_joint_sigma_sweep__20260204_122515__*.csv (сканирование σ_int)
report/tables/Tab_H_joint_rmin_sweep__20260204_122515__*.csv (сканирование R_min)
report/tables/Tab_I_joint_covshrink_sweep__20260204_122515__*.csv (сканирование cov-shrink)
report/tables/Tab_R2_ablation_ladder__20260204_122515__*.csv (абляция)
report/tables/Tab_R3_leave_one_bin_out__20260204_122515__*.csv (LOO)
report/tables/Tab_R4_negctrl_rcbin_shuffle__20260204_122515__*.csv (отрицательный контроль)
report/final/Tab_Z1_master_summary__20260204_122515__20260205_035929.csv (главная таблица Strict; соответствует таблицам S1a/S1b и числам в тексте)
report/final/P1_RC_GGL_final_bundle__20260204_122515__20260205_035929.pdf (публикуемая PDF-сводка; пригодна для быстрого просмотра и цитирования)

Приложение B: P1A — стандартизованный стресс-тест DM-базовой модели (DM 7+1 + DM_STD; включая контроль EFT)

Это приложение фиксирует расширенный проект P1A — «стандартизованный стресс-тест DM-базовой модели», согласованный с протоколом замыкания основного текста. Его назначение: без введения большого числа степеней свободы и без изменения общей карты RC-bin→GGL-bin или рамки аудита поднять минимальную DM_RAZOR из основного текста (NFW + фиксированное c–M, без разброса / contraction / core) до набора DM-базовых моделей, более близкого к астрофизической практике и более устойчивого к распространённым возражениям. P1A покрывает и расширяет прежний трёхветвевой стресс-тест: сохраняя SCAT/AC/FB, он добавляет иерархический c–M разброса + prior, одно-параметрический core-прокси и nuisance-параметр shear-калибровки на стороне линзирования m, а также комбинированную модель DM_STD; EFT_BIN сохраняется как контрольный ориентир.

Дополнительное замечание: численные значения силы замыкания и других метрик в приложении B (P1A) получены с более высоким бюджетом Monte Carlo, например ndraw=400, nperm=24, тогда как в основном тексте для покрытия полного семейства ядер EFT используется quick-бюджет, например ndraw=60, nperm=12. Поэтому абсолютные значения могут иметь дрейф порядка O(10) из-за сэмплирования; однако сравнение моделей внутри одной таблицы при одном бюджете честно, а знак и порядок величины преимущества остаются стабильными при разных бюджетах.

B.1 Цель и позиционирование (Why P1A, and why as an Appendix)

P1A не пытается исчерпать все возможные варианты моделирования гало ΛCDM, например несферичность, зависимость от среды, сложные связи галактика–гало или высокоразмерную baryon physics. Напротив, P1A следует принципу «низкая размерность, проверяемость, воспроизводимость»: каждый модуль усиления вводит не более одного ключевого эффективного параметра и продолжает подчиняться трём жёстким ограничениям этой статьи:
(i) параметрический журнал: каждый новый параметр должен быть явно учтён и опубликован вместе с информационными критериями (AICc/BIC);
(ii) общая карта: используется та же группировка RC-bin→GGL-bin, и не допускается отдельная «подгонка карты» под один набор данных;
(iii) тест замыкания: любое усиление должно давать реальный выигрыш в переносимом предсказании RC→GGL, а не только улучшение RC-only подгонки.

B.2 DM 7+1 + DM_STD: определения модулей, параметры и способ входа в совместное постериорное распределение

P1A как независимый runpack предоставляет 8 DM-рабочих пространств (DM 7+1) и 1 EFT-контроль: от DM_RAZOR как базовой модели строятся три legacy одно-параметрических усиления (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB), добавляются три более стандартных защитных модуля (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M), а затем задаётся комбинированная модель DM_STD. Общая цель этих модулей — охватить три наиболее частые группы возражений при минимальном увеличении размерности: (a) как разброса и prior соотношения c–M входят в иерархическую модель; (b) можно ли главным эффектам baryonic feedback соответствовать одно-параметрическим core-прокси; (c) может ли ключевая систематическая ошибка на стороне линзирования быть ошибочно принята за физический сигнал.

Workspace	dm_model	Новый параметр (≤1)	Физическая мотивация (ядро)	Принцип реализации (дружелюбно к аудиту)
DM_RAZOR	NFW (fixed c–M, no разброса)	—	Минимальная, проверяемая базовая модель гало ΛCDM; строгий контроль для сравнения с EFT	Общая карта фиксирована; параметрический журнал строгий; baseline используется только для относительного сравнения
DM_RAZOR_SCAT	NFW + c–M разброса（legacy）	σ_logc	В соотношении c–M существует рассеяние; оно аппроксимируется одно-параметрическим log-normal разброса	≤1 новый параметр; та же общая карта; критерий приёмки — выигрыш в замыкании
DM_RAZOR_AC	NFW + Adiabatic Contraction（legacy）	α_AC	Падение барионов может вызывать адиабатическое сжатие гало; используется одно-параметрическая аппроксимация силы	≤1 новый параметр; карта не меняется; публикуются изменения AICc/BIC и выигрыш замыкания
DM_RAZOR_FB	NFW + ядра обратной связи（legacy）	log r_core	Feedback может формировать core во внутренней области; используется одно-параметрический масштаб core	≤1 новый параметр; тот же протокол closure / отрицательного контроля; улучшение RC-only не является единственной целью
DM_HIER_CMSCAT	Hierarchical c–M разброса + prior	σ_logc (hier)	Более стандартная иерархическая структура c_i∼logN(c(M_i),σ_logc); одновременно влияет на совместное постериорное распределение RC и GGL	Явный prior; маргинализация latent c_i; сохраняется низкая размерность и проверяемость
DM_CORE1P	1‑parameter core proxy (coreNFW/DC14‑inspired)	log r_core	Одно-параметрический core-прокси главного эффекта baryonic feedback, без высокоразмерных деталей звездообразования	Опора на стандартную литературу; ≤1 новый параметр; привязка к тесту замыкания
DM_RAZOR_M	NFW + lensing shear‑calibration nuisance	m_shear (GGL)	Ключевая систематика слабого линзирования поглощается эффективным параметром, снижая риск «принять систематику за физику»	nuisance явно учитывается; ему нельзя обратно влиять на RC; главный критерий — устойчивость замыкания
DM_STD	Standardized DM baseline (HIER_CMSCAT + CORE1P + m)	σ_logc + log r_core (+ m_shear)	Три наиболее распространённые группы возражений одновременно включаются в одну всё ещё низкоразмерную стандартную базовую модель	Параметрический журнал и информационные критерии публикуются вместе; closure — главный показатель; используется как самый сильный защитный контроль DM

Пояснение: имена параметров выше соответствуют инженерной реализации, например σ_logc, α_AC, log r_core, m_shear. Главный смысл дизайна P1A — «усилить DM-базовую модель, но сохранить её проверяемой», а не превращать DM-сторону в неконтролируемый высокоразмерный фиттер. В частности, DM_HIER_CMSCAT вводит c–M разброса иерархически: концентрация c_i каждого halo задаётся вокруг c(M_i) с log-normal рассеянием и ограничивается глобальным σ_logc вместе с c(M)-prior; такая иерархическая структура одновременно влияет на совместное постериорное распределение RC и GGL.

B.3 Статистический протокол и формат продуктов, согласованные с основным текстом

P1A повторно использует все продукты данных, общую карту и рамку аудита основного текста; порядок выполнения и формат продуктов сохраняются:
(1) Run‑1: вывод RC-only (выводит posterior_samples.npz и metrics.json);
(2) Run‑2: тест замыкания RC→GGL (выводит closure_summary.json и permuted baseline);
(3) Run‑3: совместная подгонка RC+GGL (выводит joint_summary.json).
Все цитируемые числа взяты из автоматической сводной таблицы (Tab_S1_P1A_scoreboard) и могут быть проверены после полного перезапуска P1A full_fit_runpack с помощью встроенного reference-скрипта сравнения таблиц.

B.4 Основные результаты, вход к таблицам/рисункам и план архивации (тот же DOI)

Этот раздел даёт ключевые количественные выводы P1A. Таблица B1 сводит основные показатели RC-only, замыкания RC→GGL и совместной подгонки RC+GGL; в скобках указана разница относительно baseline DM_RAZOR. Сила замыкания определяется как ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩, чем больше, тем лучше. Рис. B1 визуализирует тот же scoreboard. Основные пункты:
• среди трёх legacy-ветвей только DM_RAZOR_FB (feedback/core) даёт небольшое чистое улучшение силы замыкания: 122.21→129.45 (+7.25); SCAT и AC чистого улучшения не дают;
• новые DM_HIER_CMSCAT и DM_RAZOR_M почти не влияют на силу замыкания (~0), а DM_CORE1P также не показывает значимого чистого улучшения;
• комбинированная модель DM_STD может существенно улучшить joint logL, то есть приблизиться к оптимуму совместной подгонки, но сила замыкания у неё падает; это показывает, что основной выигрыш идёт от гибкости совместной подгонки, а не от переносимости между зондами;
• EFT_BIN как контроль по-прежнему сохраняет явное преимущество в силе замыкания и совместной подгонке, поэтому основной вывод текста устойчив к введению «более сильной DM-базовой модели + lensing nuisance».

Для прямого сопоставления с главным сравнением основного текста таблицы S1a–S1b суммируют строгий контроль EFT-семейства и DM_RAZOR: в совместной подгонке модели EFT улучшают ΔlogL_total примерно на 1155–1337 относительно DM_RAZOR и достигают ΔlogL_closure=172–281 в тесте замыкания. P1A лишь делает «более трудный контроль» на стороне DM; его роль — снизить уязвимости типа «strawman baseline / systematics-as-physics», а не заменить основное сравнение текста.

Таблица B1 | P1A scoreboard (чем больше, тем лучше; в скобках указана разница относительно baseline DM_RAZOR).

Ветвь модели (workspace)	Δk	RC-only best logL_RC (Δ)	Сила замыкания ΔlogL_closure (Δ)	Joint best logL_total (Δ)
DM_RAZOR	0	-15702.654 (+0.000)	122.205 (+0.000)	-27347.068 (+0.000)
DM_RAZOR_SCAT	1	-15702.294 (+0.361)	121.236 (-0.969)	-23153.311 (+4193.758)
DM_RAZOR_AC	1	-15703.689 (-1.035)	121.531 (-0.674)	-23982.557 (+3364.511)
DM_RAZOR_FB	1	-15496.046 (+206.609)	129.454 (+7.249)	-27478.531 (-131.463)
DM_HIER_CMSCAT	1	-15702.644 (+0.010)	121.978 (-0.227)	-23153.160 (+4193.908)
DM_CORE1P	1	-15723.158 (-20.504)	122.056 (-0.149)	-27336.258 (+10.810)
DM_RAZOR_M	0 (+m)	-15702.654 (+0.000)	122.205 (+0.000)	-27340.451 (+6.617)
DM_STD	2 (+m)	-15832.203 (-129.549)	105.690 (-16.515)	-22984.445 (+4362.623)
EFT_BIN	1	-14631.537 (+1071.117)	204.620 (+82.415)	-19001.142 (+8345.926)

Рис. B1 | P1A scoreboard: ΔlogL замыкания и совместной подгонки относительно baseline (чем больше, тем лучше).

Ниже приведены примерные метки одной уже выполненной серии запусков P1A, пригодные для локализации промежуточных продуктов, таблиц и рисунков:
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.

B.5 Рекомендуемый способ цитирования (Appendix citation note)

Если читателю нужно цитировать «стандартизованный стресс-тест DM-базовой модели» помимо главного вывода статьи, рекомендуется вместе с цитированием основного вывода указать: ‘See Appendix B (P1A) for standardized DM baseline stress tests (legacy SCAT/AC/FB + hierarchical c–M разброса prior + core proxy + lensing shear-calibration nuisance), under the same closure protocol.’