P1_RC_GGL: строгая проверка замыкания для динамики галактик и слабого линзирования (кривые вращения + GGL)
Рамочная EFT-модель средней гравитации против минимальной NFW-базовой модели холодной тёмной материи (DM)
Ознакомьтесь с исходным отчётом об оценке:
1. ChatGPT: https://chatgpt.com/share/6a00cd62-6e34-83eb-b165-6ec09e3519cc
2. Gemini: https://gemini.google.com/share/773ec96d75a0
3. Grok: https://grok.com/share/bGVnYWN5LWNvcHk_c0b4fa65-0e86-4adb-9b58-5617d616dc04
4. Qwen: https://chat.qwen.ai/s/22ab9336-671f-420a-a7fa-43e24774bb2a?fev=0.2.46
5. DeepSeek: https://chat.deepseek.com/share/tj6k7hb5owtoldg2bm
0 Резюме
Настоящий отчёт является архивным изданием публикационного уровня, размещённым на Zenodo. Он предоставляет единую проверяемую цепочку, охватывающую данные, реестр моделей, честное сравнение, проверку замыкания и материалы для воспроизводимости. Приложение B (P1A) служит дополнением по устойчивости: в нём сосредоточены стресс-тесты с «более стандартной DM-базой + одной ключевой систематикой линзирования», позволяющие оценить чувствительность основных выводов к более реалистичному моделированию DM и обработке систематик линзирования.
Ключевые выводы (четыре формулировки, пригодные для прямого цитирования; см. раздел 2.4):
(1) При подгонке кривых вращения (RC) семейство EFT значительно превосходит DM_RAZOR для всех комбинаций ядра и априорных условий; типичное улучшение составляет Δlog𝓛_RC ≈ 10^3 (см. таблицу S1a).
(2) В проверке замыкания RC→GGL EFT показывает более сильную переносимость между зондами: сила замыкания Δlog𝓛_closure (True−Perm) существенно выше, чем у DM_RAZOR, а различие устойчиво при covariance shrinkage, сканировании R_min и σ_int (см. рис. S3 и таблицу S1b).
(3) В совместной подгонке (RC+GGL) EFT сохраняет устойчивое преимущество; в отрицательном контроле, где нарушается общая карта соответствия, это преимущество схлопывается, что поддерживает интерпретацию, согласно которой «эффект средней гравитации» возникает из общей карты, а не из случайной подгонки (см. рис. S4).
(4) Без существенного увеличения размерности Приложение B (P1A) подвергает сторону DM стресс-тестам с более стандартными модулями DM-базовой модели и одним ключевым nuisance-параметром систематики линзирования. Эти усиления не устраняют преимущество EFT в замыкании (см. таблицу B1 и рис. B1).
Доступность данных и кода: отчёт Concept DOI 10.5281/zenodo.18526334; полный пакет воспроизведения Concept DOI 10.5281/zenodo.18526286. Теги, соответствующие Приложению B (P1A): run_tag=20260213_151233, closure_tag=20260213_161731 и joint_tag=20260213_195428.
1 Аннотация
Мы проводим воспроизводимое количественное сравнение двух теоретических рамок на одних и тех же данных и в рамках одного статистического протокола: модели «коррекции средней гравитации», предложенной Теорией энергетических филаментов (Energy Filament Theory, EFT; не путать с распространённой аббревиатурой effective field theory), и базовой модели гало холодной тёмной материи (DM) типа NFW (DM_RAZOR). DM_RAZOR намеренно выбран как «минимальная DM-база»: NFW-гало с фиксированной связью c–M (без разброса halo-to-halo), служащее проверяемым и воспроизводимым контролем. Также важно подчеркнуть, что в этой работе EFT рассматривается как феноменологическая, MOND-подобная параметризация эффективного поля/эффективного отклика для тестирования в едином статистическом протоколе, а не как вывод её микроскопических первых принципов.
Данные включают 2 295 точек скоростей из кривых вращения SPARC (RC), единообразно предобработанных и разбинованных (104 галактики, 20 RC-бинов), а также избыточную поверхностную плотность ΔΣ(R) для слабого линзирования галактика–галактика KiDS-1000 (GGL) (4 бина звёздной массы × 15 точек R в каждом бине, всего 60 точек, с использованием полной ковариации).
Мы последовательно выполняем RC-only inference, проверку замыкания RC→GGL, GGL-only inference и совместную RC+GGL inference, используя аудиты согласованности, чтобы гарантировать трассируемость каждого цитируемого численного значения. При строгом реестре параметров и ограничениях общей карты соответствия (DM: 20 параметров log M200_bin; EFT: 20 параметров log V0_bin + 1 глобальный log ℓ) семейство EFT значительно превосходит DM_RAZOR в совместной подгонке: ΔlogL_total = 1155–1337 относительно DM_RAZOR. Ещё важнее, проверка замыкания показывает, что RC-постериор обладает нетривиальной предсказательной силой для GGL: сила замыкания EFT равна ΔlogL_closure = 172–281, что выше значения 127 для DM_RAZOR. Когда группировка RC-bin→GGL-bin случайно перемешивается, сигнал замыкания падает до 6–23, подтверждая, что он не является статистической случайностью или артефактом реализации. В систематических сканированиях σ_int, R_min и covariance shrinkage относительное преимущество EFT остаётся положительным и стабильным по величине. Чтобы ответить на распространённые опасения о том, что «DM-база слишком слаба» или что «систематики ошибочно принимаются за физику», Приложение B (P1A) предоставляет более стандартный, но всё ещё низкоразмерный и проверяемый стресс-тест DM-базовой модели, включая иерархический разброс c–M + prior, одно-параметрический core proxy, lensing m и комбинированную модель DM_STD. В том же протоколе замыкания эти усиления не устраняют преимущество EFT в замыкании (см. таблицу B1/рис. B1).
Ключевые слова: кривые вращения; слабое линзирование галактика–галактика; проверка замыкания; EFT; холодная тёмная материя; байесовский вывод
2 Введение и обзор результатов
Кривые вращения (RC) и слабое линзирование галактика–галактика (GGL) являются двумя взаимодополняющими гравитационными зондами: RC ограничивает динамический потенциал и радиальную зависимость ускорения (RAR) в плоскости диска, тогда как GGL измеряет проецированное распределение массы и гравитационный отклик на масштабе гало. Для любой кандидатной теории ключевой вопрос состоит не в том, может ли она по отдельности подогнать два набора данных, а в том, может ли она объяснить их согласованно при одной и той же межданной карте соответствия и общих ограничениях.
Соответственно, эта статья принимает «проверку замыкания» в качестве центрального статистического протокола: сначала RC-only posterior используется для прямого предсказания GGL, затем сравнивается с отрицательным контролем, в котором карта RC-bin→GGL-bin переставляется/перемешивается. Это оценивает межданную переносимость предсказаний и исключает ложные сигналы, вызванные смещением реализации или случайной подгонкой.
Теоретическое позиционирование и область: данная работа не пытается представить микроскопический вывод EFT (Теории энергетических филаментов) из первых принципов или релятивистски полную формулировку. Вместо этого мы рассматриваем EFT как низкоразмерную MOND-подобную параметризацию эффективного поля/эффективного отклика (описанную ядром f(x) и глобальным масштабом ℓ) и проверяем её межданную согласованность и переносимую предсказательную силу через тест замыкания RC→GGL при строгом реестре параметров.
Исследовательская программа и заявление об области: эта статья является частью продолжающейся P-серии наблюдательной retrieval-программы. В существующих данных галактического масштаба мы ищем два возможных эффективных фоновых вклада: (i) «дно средней гравитации», описываемое крупнозернистым средним гравитационным откликом, и (ii) «стохастическое/шумовое дно», связанное с флуктуациями микроскопических процессов. В этой статье (P1) мы сосредоточены только на первом: не вводя гипотез о микроскопических механизмах происхождения, мы используем проверку замыкания RC→GGL для поиска наблюдательных признаков дна средней гравитации и сравниваем его с проверяемой DM-базой в едином контрольном протоколе. Как эвристическая физическая картина, если существуют короткоживущие степени свободы, их распад/аннигиляция может переводить массу покоя в энергию-импульс, переносимый другими степенями свободы, что на эффективном уровне естественно соответствует разложению «средний вклад + флуктуационный вклад»; однако в этой статье такая микроскопическая картина количественно не моделируется.
Чтобы избежать чрезмерной интерпретации, границы области этой статьи таковы:
• Что делает эта статья: при строгом реестре параметров и общей карте соответствия она использует проверку замыкания для измерения межданной переносимости предсказаний и выполняет воспроизводимое сравнение между среднегравитационным откликом EFT и DM-базой.
• Чего эта статья не делает: она не обсуждает микроскопические механизмы происхождения, распространённости/времена жизни или космологические ограничения; она не моделирует стохастический член, соответствующий «шумовому дну».
• Чего эта статья не утверждает: она не стремится опровергнуть тёмную материю; P1 не выносит окончательного вердикта о существовании «дна», а сообщает свидетельство на текущем этапе — в выбранной здесь устойчивой измерительной области данные предпочитают модели, включающие средний гравитационный отклик.
В то же время мы ясно указываем, что DM_RAZOR представляет только минимальную и проверяемую NFW-базу (фиксированная c–M и отсутствие scatter; без адиабатического сжатия, feedback core, несферичности и средовых членов). Поэтому главный вывод основного текста строго ограничен следующим утверждением: при минимальной базе и строгих ограничениях реестра параметров/карты соответствия EFT демонстрирует более сильную межданную согласованность. Чтобы ответить на распространённый вопрос о том, изменила бы более стандартная ΛCDM-база и моделирование ключевых систематик линзирования этот вывод, мы собираем более стандартные, но всё ещё низкоразмерные и проверяемые DM-усиления, а также nuisance со стороны линзирования в Приложении B (P1A: стресс-тест стандартизации DM-базы), сохраняя точно ту же общую карту соответствия и протокол проверки замыкания, что и в основном тексте (см. таблицу B1/рис. B1).
2.1 Табл. S1a–S1b: сводка ключевых метрик (Strict)
Таблица S1a сообщает основные сравнительные метрики для совместной подгонки (RC+GGL): logL, ΔlogL, AICc и BIC. Таблица S1b сообщает метрики проверки замыкания и сканирования устойчивости: closure, отрицательный контроль shuffle и диапазоны сканирования σ_int / R_min / cov-shrink. Все значения происходят из строгой мастер-таблицы Tab_Z1_master_summary и могут быть поэлементно прослежены в выпускном архивном пакете.
Таблица S1a | Основные метрики сравнения совместной подгонки (RC+GGL, Strict).
Модель (workspace) | W-ядро | k | Совместный logL_total (best) | ΔlogL_total vs DM | AICc | BIC |
DM_RAZOR | none | 20 | -16927.763 | 0.0 | 33895.885 | 34010.811 |
EFT_BIN | none | 21 | -15590.552 | 1337.21 | 31223.501 | 31344.155 |
EFT_WEXP | exponential | 21 | -15668.83 | 1258.932 | 31380.057 | 31500.711 |
EFT_WYUK | yukawa | 21 | -15772.936 | 1154.827 | 31588.268 | 31708.922 |
EFT_WPOW | powerlaw_tail | 21 | -15633.321 | 1294.442 | 31309.038 | 31429.692 |
Таблица S1b | Метрики замыкания и устойчивости (Strict).
Модель (workspace) | ΔlogL замыкания (true-perm) | ΔlogL отрицательного контроля после shuffle | Диапазон ΔlogL при сканировании σ_int | Диапазон ΔlogL при сканировании R_min | Диапазон ΔlogL при сканировании cov-shrink |
DM_RAZOR | 126.678 | 22.725 | — | — | — |
EFT_BIN | 231.611 | 14.984 | 459–1548 | 1243–1289 | 1337–1351 |
EFT_WEXP | 171.977 | 6.04 | 408–1471 | 1169–1207 | 1259–1277 |
EFT_WYUK | 179.808 | 14.688 | 380–1341 | 1065–1099 | 1155–1166 |
EFT_WPOW | 280.513 | 6.672 | 457–1500 | 1203–1247 | 1294–1308 |
2.2 Рис. S3: сила замыкания (RC-only → предсказанный GGL)
Сила замыкания определяется как ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩: на RC-only posterior samples GGL предсказывается вперёд и сравнивается с отрицательным контролем, в котором карта RC-bin→GGL-bin переставляется.

Рис. S3 | Сила замыкания (чем больше, тем лучше): среднее преимущество лог-правдоподобия предсказания RC-only → GGL.
2.3 Рис. S4: основное сравнение совместной подгонки (RC+GGL)
Преимущество совместной подгонки определяется как ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR). При одних и тех же данных, той же карте соответствия и почти одинаковой размерности параметров семейство EFT достигает существенно более высокого совместного лог-правдоподобия.

Рис. S4 | Преимущество совместной подгонки (чем больше, тем лучше): лучший logL_total для RC+GGL относительно DM_RAZOR.
2.4 Четыре вывода (пригодны для прямого цитирования)
(1) В едином совместном анализе кривых вращения SPARC и слабого линзирования KiDS-1000 рамочная модель средней гравитации EFT систематически превосходит DM_RAZOR при строгом контрольном протоколе: ΔlogL_total = 1155–1337 относительно DM_RAZOR.
(2) Проверка замыкания RC→GGL показывает более сильную предсказательную согласованность EFT: ΔlogL_closure = 172–281 против 127 у DM_RAZOR. Когда группировка RC-bin→GGL-bin случайно перемешивается, сигнал замыкания падает до 6–23, что указывает: сигнал зависит от правильной межданной карты, а не от случайной подгонки.
(3) Систематические сканирования σ_int, R_min и covariance shrinkage не меняют ни знак, ни масштаб утверждения «EFT превосходит DM_RAZOR», что показывает устойчивость вывода к распространённым систематическим возмущениям.
(4) При том же протоколе замыкания Приложение B (P1A) усиливает DM-базу «стандартизованным и проверяемым» способом: оно сохраняет три одно-параметрических усиления (SCAT/AC/FB) и добавляет иерархический c–M scatter + prior, одно-параметрический core proxy и shear-calibration m со стороны линзирования (а также их комбинированную модель DM_STD). Результаты показывают, что только ветвь feedback/core даёт небольшой чистый прирост силы замыкания (122.21→129.45, ΔΔlogL_closure≈+7.25); остальные усиления дают незначительный или отрицательный вклад в силу замыкания. Следовательно, главный вывод не зависит от того, что DM_RAZOR была чрезмерно слабой базовой моделью.
3 Данные и предобработка
В этом исследовании используются два публичных набора данных. В инженерном workflow загрузка, проверка контрольных сумм (sha256) и предобработка выполняются трассируемыми скриптами. Для обеспечения честного межмодельного сравнения все рабочие пространства (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) используют одни и те же продукты данных и карты бинов.
3.1 Кривые вращения (RC, SPARC)
Данные RC поступают из файлов Rotmod_LTG базы SPARC (175 rotmod-файлов). После предобработки модельная выборка включает 104 галактики и 2 295 точек (r, V_obs), разделённых на 20 RC-бинов по звёздной массе и связанным критериям. Каждая точка содержит радиус r (kpc), наблюдаемую скорость V_obs (km/s), наблюдательную ошибку σ_obs, а также компонентные скорости газа/диска/балджа (V_gas, V_disk, V_bul).
3.2 Слабое линзирование (GGL, KiDS-1000 / Brouwer+2021)
Данные GGL используют избыточную поверхностную плотность ΔΣ(R) из рис. 3 работы Brouwer et al. (2021) на основе KiDS-1000 (4 бина звёздной массы, 15 точек R на бин), вместе с предоставленной полной ковариацией. В инженерном workflow исходная long-form ковариация реконструируется в матрицу 15×15 для каждого бина, а Stage-B аудиты проверяют размерностную и численную разумность.
3.3 Карта RC-bin → GGL-bin и общий размер выборки
4 массовых GGL-бина и 20 RC-бинов соединены фиксированной картой: каждому GGL-бину соответствуют 5 RC-бинов, а вклады RC-бинов усредняются с весами по числу галактик. Эта карта фиксирована во всех моделях и является ключевым ограничением честного сравнения в проверке замыкания и совместной подгонке. Итоговый совместный набор данных содержит n_total = 2355 точек (RC=2295, GGL=60).
4 Модели и статистические методы
4.1 Минимальная математическая спецификация EFT и DM (проверяемая/тестируемая)
В этом разделе дана минимальная математическая спецификация, напрямую соответствующая реализации.
(a) Модель кривых вращения (RC)
Для каждой точки RC (r, V_obs, σ_obs) мы используем суперпозицию компонентов: V_mod²(r) = V_bar²(r) + V_extra²(r). Здесь V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r). Основные результаты этой статьи используют Υ_d = Υ_b = 0.5, что согласуется с эмпирическими рекомендациями SPARC и полезно для уменьшения ненужных степеней свободы.
(b) Коррекция средней гравитации EFT (EFT)
Дополнительный член EFT параметризуется в форме «квадрата средней скорости»: V_extra²(r) = V0_bin² · f(r/ℓ). Здесь V0_bin — амплитудный параметр для каждого RC-бина (20 параметров), ℓ — глобальный масштаб (1 параметр), а f(x) — безразмерная функция формы ядра. Сравниваемые в статье формы ядра (ни одна не вводит дополнительных непрерывных степеней свободы) таковы:
- none: f(x)=x/(1+x)
- exponential: f(x)=1−exp(−x)
- yukawa: f(x)=1−exp(−x)·(1+0.5x)
- powerlaw_tail: f(x)=1−(1+x)^(−1/2)
- (опциональный контроль) gaussian: f(x)=erf(x/√2) (не включён в основной набор выводов)
Физическая мотивация (расширенно): EFT интерпретирует дополнительный гравитационный отклик на галактических масштабах как эффективный отклик, полученный крупнозернистым усреднением/масштабным усреднением более микроскопических действий на конечных масштабах. В этой статье мы не предполагаем конкретного микроскопического механизма; вместо этого используем минимальную и проверяемую параметризацию для контролируемого сравнения и тестирования в едином статистическом протоколе.
Для интуиции дополнительный член можно записать в форме ускорения: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). Когда r≫ℓ, f→1 и V_extra→V0_bin, что даёт приблизительно плоский дополнительный вклад скорости во внешней области. Когда r≪ℓ и f(x)≈x, можно ввести характерный масштаб ускорения a0,bin≈V0_bin²/ℓ (с точностью до O(1) множителя ядра), что даёт MOND-подобную интуицию для масштаба перехода от внутренней к внешней области.
Используемое здесь дискретное семейство ядер (none/exponential/yukawa/powerlaw_tail) можно рассматривать как низкоразмерные proxy для разных «начальных наклонов / скоростей перехода / дальних хвостов» (например, Yukawa-like экранирование против более длиннохвостого отклика). Они используются для стресс-тестирования устойчивости, а не для исчерпания пространства моделей. В компоненте слабого линзирования мы строим эффективную массу и плотность оболочки из V_avg(r), а затем проецируем их для получения ΔΣ(R). Эту эффективную плотность следует понимать как эффективное описание потенциала линзирования при предположениях сферической симметрии и weak-field mapping (полные детали перенесены в Приложение A).
Все приведённые формы ядра удовлетворяют f(x)→1 при x→∞ (то есть насыщению V_extra²→V0²), тогда как при x≪1 дают линейный или сублейнейный рост: например, exponential: f≈x; yukawa: f≈0.5x; powerlaw_tail: f≈0.5x. Поэтому разные формы ядра обладают наблюдаемыми различиями в малорадиусном «начальном наклоне», скорости перехода и внешнем хвосте и могут различаться совместными RC+GGL и closure-тестами.
Предсказание EFT для weak-lensing ΔΣ(R) получается путём вывода массы и плотности оболочки из V_avg(r), после чего применяются проекционные интегралы: M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr и ΔΣ(R)=Σ̄(<R)−Σ(R). Численная реализация использует логарифмическую сетку и в исключительных случаях адаптивно её уточняет для обеспечения стабильности и воспроизводимости.
(c) DM_RAZOR: NFW-база гало холодной тёмной материи
В то же время мы ясно указываем, что DM_RAZOR представляет только минимальную проверяемую NFW-базу (фиксированная c–M и отсутствие scatter; без адиабатического сжатия, feedback core, несферичности и средовых членов). Чтобы снизить риск «strawman baseline», эта статья не утверждает, что такие эффекты не существуют. Вместо этого она включает их в Приложение B (P1A) как низкоразмерные и проверяемые стресс-тесты, включая иерархическую обработку c–M scatter, core proxy и nuisance-параметр shear-calibration со стороны линзирования.
4.2 Реестр моделей и честное сравнение (общие параметры = определение замыкания)
Число параметров в основном наборе сравнения: DM_RAZOR k=20; семейство EFT k=21 (дополнительный параметр — глобальный log ℓ). Все модели используют одни и те же RC-данные, те же GGL-данные и ковариацию, ту же карту RC-bin→GGL-bin, те же барионные члены и те же преобразования единиц. Кроме того, форма ядра (none / exponential / yukawa / powerlaw_tail) является дискретным выбором и не вводит дополнительного непрерывного параметра, что предотвращает получение преимущества за счёт «одной лишней степени свободы».
4.3 Правдоподобие, априорные распределения и сэмплер
RC likelihood является диагональным гауссовым: σ_eff² = σ_obs² + σ_int². В основных результатах фиксируется σ_int=5 km/s, а Run-5 сканирует σ_int. GGL likelihood использует полную ковариационную гауссиану для каждого бина: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). Совместная цель: logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ). Априорные распределения главным образом задают физически допустимые границы (интервальные ограничения на log ℓ, log V0 и log M200); когда включаются свободные Υ и σ_int, используются слабо информативные priors (подробности см. в реализации и конфигурации выпускного пакета).
Сэмплер использует адаптивное блочное случайное блуждание Metropolis: на каждом шаге обновляется только случайный подблок пространства параметров, чтобы повысить acceptance rate в высокой размерности, а размер шага слегка адаптируется по оконной доле принятия (целевой acceptance rate около 0.25). Основные результаты используют quick mode (например, n_steps=800), и каждое рабочее пространство выводит trace, residuals и PPC-графики для ручного и скриптового аудита.
4.4 Проверка замыкания и отрицательный контроль (определение)
Проверка замыкания (Run-2) тестирует, может ли RC-only posterior предсказывать GGL без повторной подгонки GGL. Конкретно, из RC-only posterior samples вперёд генерируется ΔΣ(R) для 4 GGL-бинов и с полной ковариацией вычисляется logL_true; затем карта групп RC-bin→GGL-bin случайно переставляется для получения logL_perm. Сила замыкания определяется как ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩. Кроме того, Run-10 случайно перегруппирует 20 RC-бинов в 4×5 (shuffle) и пересчитывает замыкание, проверяя, насколько сильно сигнал зависит от правильной карты.
5 Основные результаты и интерпретация
5.1 Основные результаты совместной подгонки (RC+GGL)
Лучший logL_total из совместной подгонки и относительное преимущество ΔlogL_total (относительно DM_RAZOR) показаны в таблице S1a и на рис. S4. В основном наборе сравнения EFT_BIN имеет наибольшее совместное преимущество (ΔlogL_total=1337.210), тогда как остальные формы ядра EFT также сохраняют существенные преимущества (1154.827–1294.442). По информационным критериям (AICc/BIC) семейство EFT также значительно превосходит DM_RAZOR, что указывает: преимущество не вызвано смещением из-за числа параметров.
Примечание: основной вклад в ΔlogL_total≈1337 приходит от RC-члена (ΔlogL_RC≈1065 в joint-разложении, около 80%). Это можно понимать как умеренное улучшение примерно Δχ²≈0.90 на точку по N=2295 RC-точкам, которое в диагональном гауссовом likelihood естественно накапливается до преимущества порядка 10^3. В то же время GGL и проверка замыкания дают независимые междатасетные ограничения, а ранжирование остаётся стабильным при стресс-тестах σ_int, R_min и cov-shrink (см. раздел 6 и таблицу S1b).
5.2 Результаты проверки замыкания (RC-only → GGL)
Ключевая величина проверки замыкания ΔlogL_closure приведена в таблице S1b и на рис. S3. Сила замыкания семейства EFT составляет 171.977–280.513, выше 126.678 у DM_RAZOR. Это означает, что без разрешения дополнительных межданных степеней свободы posterior samples, полученные EFT из RC-данных, обладают более сильной переносимой предсказательной силой для GGL-данных.
Отрицательный контроль дополнительно поддерживает физическую релевантность сигнала замыкания: когда группировка RC-bin→GGL-bin случайно перемешивается, сила замыкания EFT падает до 6–15 (с небольшими различиями между ядрами), тогда как базовая сила замыкания достигает 172–281. Такое «схлопывание сигнала» исключает ложные преимущества, вызванные численной реализацией, ошибками единиц или некорректной обработкой ковариации.

Рис. R1 | Отрицательный контроль: после shuffle-группировки сигнал замыкания существенно падает (построено по метрикам Tab_Z1).
5.3 Смысл и ограничения результатов
Вывод исследования таков: «на этом наборе данных и при этом протоколе коррекция средней гравитации EFT превосходит протестированную базу DM_RAZOR». Следует подчеркнуть, что сторона DM использует только минимальную NFW-базу с фиксированной связью c(M), без core formation, несферичности, средовых членов или более сложных моделей связи галактика–гало. Поэтому рукопись не заявляет об исключении всех семейств DM-моделей. Вместо этого она предоставляет воспроизводимую контрольную базу, сосредоточенную на проверке замыкания, для оценки того, могут ли RC и GGL быть согласованно объяснены одними и теми же межданными параметрами и картой.
Чтобы ответить на это распространённое возражение, мы завершили независимый расширительный проект P1A (см. Приложение B). Не меняя общей карты RC-bin→GGL-bin или аудиторской рамки, он усиливает DM-базу «стандартизованным и проверяемым» образом: помимо трёх одно-параметрических усилений (SCAT/AC/FB), он добавляет (i) иерархический c–M scatter + mass–concentration prior (DM_HIER_CMSCAT), (ii) одно-параметрический proxy барионного feedback core (DM_CORE1P) и (iii) nuisance-параметр shear-calibration m со стороны слабого линзирования (DM_RAZOR_M), а также сообщает комбинированную модель DM_STD; EFT_BIN сохраняется как контрольный эталон.
• DM_RAZOR_SCAT (c–M scatter) — вводит параметр разброса концентрации halo-to-halo σ_logc, чтобы проверить, систематически ли фиксированная c(M) недооценивает объяснительную способность DM;
• DM_RAZOR_AC (Adiabatic Contraction) — использует один параметр α_AC для непрерывной интерполяции между «без сжатия» и «стандартным сжатием», минимальной ценой захватывая тенденцию барионов сжимать внутреннее гало;
• DM_RAZOR_FB (Feedback/core) — использует масштаб core (например, log r_core), чтобы описать, как формирование внутреннего core подавляет кривые вращения, сохраняя NFW-приближение на масштабах слабого линзирования.
Количественный scoreboard P1A дан в Приложении B, таблица B1 / рис. B1 (автоматически сгенерирован из Tab_S1_P1A_scoreboard). По метрике замыкания DM_RAZOR_FB даёт небольшой чистый прирост (122.21→129.45, +7.25), тогда как остальные усиления дают незначительный или отрицательный вклад в силу замыкания. На стороне совместной подгонки добавление иерархического c–M scatter prior (DM_HIER_CMSCAT) или комбинированной модели (DM_STD) может существенно улучшить joint logL, но не улучшает силу замыкания; это предполагает, что добавляется главным образом гибкость совместной подгонки, а не переносимость между зондами. Поэтому основной вывод главного текста следует читать так: при строгой общей карте и ограничениях проверки замыкания преимущество EFT в межданной согласованности не возникает из выбора «чрезмерно слабой базовой модели» на стороне DM. Выпускной пакет P1A, соответствующий Приложению B (дополнительные таблицы/рисунки и full_fit_runpack), будет включён как дополнительные файлы под тем же Zenodo Concept DOI, что и full_fit_runpack этой статьи: https://doi.org/10.5281/zenodo.18526286.
6 Устойчивость и контрольные эксперименты
6.1 Сканирование σ_int (Run-5)
Мы систематически сканируем внутренний разброс RC σ_int и повторяем совместный вывод при каждом σ_int, вычисляя ΔlogL_total относительно DM_RAZOR. Минимальные/максимальные значения ΔlogL_total для каждой модели во всём диапазоне сканирования приведены в таблице S1b.

Рис. R2 | Диапазон ΔlogL_total при сканировании σ_int (чем больше, тем лучше).
6.2 Сканирование R_min (Run-6)
Чтобы проверить влияние систематик данных в центральных областях (например, неокруговое движение, разрешение и недостаточное барионное моделирование), мы применяем к RC отсечки по порогу R_min и повторяем совместный вывод. Преимущество семейства EFT при сканировании R_min остаётся положительным и стабильным по масштабу.

Рис. R3 | Диапазон ΔlogL_total при сканировании R_min (чем больше, тем лучше).
6.3 Сканирование cov-shrink (Run-7)
Чтобы проверить неопределённость ковариации GGL, мы применяем shrinkage к ковариационной матрице каждого массового бина: C_α=(1−α)C+α·diag(C), и сканируем α. Результаты показывают, что преимущество семейства EFT нечувствительно к этой обработке.

Рис. R4 | Диапазон ΔlogL_total при сканировании cov-shrink (чем больше, тем лучше).
6.4 Лестница абляции (Run-8)
Внутри EFT_BIN мы выполняем вложенные абляции: от минимальной модели (без свободных параметров) к версиям, сохраняющим лишь небольшое число степеней свободы, и затем к полной модели с 20-bin амплитудой + глобальным масштабом. AICc/BIC показывают, что полная модель EFT_BIN настоятельно требуется данными.

Рис. R5 | Лестница абляции EFT_BIN (AICc; чем меньше, тем лучше).
6.5 Предсказание с удержанием (Run-9)
Мы дополнительно выполняем leave-one-bin-out (LOO) test: из 4 массовых GGL-бинов каждый раз удерживается один бин; вывод повторяется с использованием оставшихся бинов (и всех RC), а затем на удержанном бине оценивается тестовое лог-правдоподобие. Сводные метрики приведены в дополнительной таблице Tab_R3_leave_one_bin_out (продукт Run-9; шаблоны путей файлов перечислены в списке ключевых продуктов в разделе 8.2). Даже в худшем удержанном случае семейство EFT остаётся явно лучше DM_RAZOR.

Рис. R6 | LOO: распределение лог-правдоподобия для удержанного бина (из продуктов Run-9).
6.6 Отрицательный контроль: RC-bin shuffle (Run-10)
Run-10 случайно перегруппирует 20 RC-бинов в 4×5 и пересчитывает замыкание, сохраняя RC-only posterior неизменным. Результаты показывают, что по сравнению с исходной картой shuffle существенно снижает как closure mean logL_true, так и ΔlogL_closure (см. таблицу S1b и рис. R1), дополнительно поддерживая интерпретируемость сигнала замыкания.

Рис. R7 | Отрицательный контроль: shuffle-карта вызывает явное снижение closure mean logL_true (из продуктов Run-10).
7 Трассируемость и аудит согласованности (Provenance)
Все численные значения, цитируемые в этой статье, могут быть поэлементно прослежены в строгих сводных таблицах и аудиторских записях выпускного архива. Чтобы сделать основной текст более читаемым, полная цепочка provenance (список тегов, аудиторские таблицы, список checksums и метод проверки) перенесена в Приложение A.
8 Воспроизводимость и архив Zenodo
Заявление о доступности данных и кода: данные кривых вращения SPARC и слабого линзирования KiDS-1000, использованные в статье, являются публичными наборами данных. Отчёт публикационного уровня архивирован на Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526334), а полный пакет воспроизведения архивирован на Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526286). Подробные шаги выполнения, среда зависимостей, инвентарь архива и сведения о hash-проверке приведены в Приложении A; дизайн, run tags и outputs стресс-теста стандартизации DM-базы (P1A) приведены в Приложении B.
Под тем же Concept DOI полного пакета воспроизведения (https://doi.org/10.5281/zenodo.18526286) мы предоставляем две воспроизводимые точки входа по сценариям использования: • P1 (основной текст) full_fit_runpack: воспроизводит RC-only / closure / joint analyses и robustness scans для EFT vs DM_RAZOR, а также генерирует материалы основного текста, включая таблицы S1a/S1b и рис. S3/S4; • P1A (Приложение B) full_fit_runpack: воспроизводит стресс-тест стандартизации DM-базы (SCAT/AC/FB + hierarchical c–M scatter prior + core1p + lensing m + DM_STD, включая контроль EFT_BIN) и генерирует таблицу B1 и рис. B1 Приложения. Дополнительные таблицы/рисунки и full_fit_runpack P1A будут включены как дополнительные файлы под тем же Concept DOI, чтобы сохранить единую архивную точку входа.
9 Благодарности и заявления
9.1 Благодарности
Мы благодарим команды SPARC и KiDS-1000 за предоставление публичных данных и документации, а также участников workflow реконструкции и аудита этого проекта.
9.2 Вклад автора
Guanglin Tu отвечал за концептуальное предложение, дизайн исследования, инженерную реализацию, курирование данных, формальный анализ, реализацию и аудит workflow воспроизводимости, а также написание рукописи.
9.3 Финансирование
Самофинансирование автором Guanglin Tu (без внешнего финансирования / без номера гранта).
9.4 Конкурирующие интересы
Автор Guanglin Tu аффилирован с “EFT Working Group, Shenzhen Energy Filament Science Research Co., Ltd. (China)”; иных конкурирующих интересов не заявлено.
9.5 Помощь ИИ
OpenAI GPT-5.2 Pro и Gemini 3 Pro использовались для языковой полировки, структурного редактирования и организации workflow воспроизводимости. Они не использовались для генерации или изменения данных, результатов, рисунков, таблиц или кода, а также для генерации ссылок. Автор несёт полную ответственность за содержание и точность цитирования всей рукописи.
10 Список литературы
- Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.
- Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.
- Wright, C. O., & Brainerd, T. G. (2000). Gravitational Lensing by Navarro–Frenk–White Halos. The Astrophysical Journal, 534, 34–40.
- Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493. DOI: https://doi.org/10.1086/304888
- Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374. DOI: https://doi.org/10.1093/mnras/stu742
- Blumenthal, G. R., Faber, S. M., Flores, R., & Primack, J. R. (1986). Contraction of dark matter galactic halos due to baryonic infall. Astrophysical Journal, 301, 27. DOI: https://doi.org/10.1086/163867
- Di Cintio, A., Brook, C. B., Dutton, A. A., et al. (2014). A mass-dependent density profile for dark matter haloes including the influence of galaxy formation. Monthly Notices of the Royal Astronomical Society, 441, 2986–2995. DOI: https://doi.org/10.1093/mnras/stu729
- Read, J. I., Agertz, O., & Collins, M. L. M. (2016). Dark matter cores all the way down. Monthly Notices of the Royal Astronomical Society, 459, 2573–2590. DOI: https://doi.org/10.1093/mnras/stw713
- Energy Filament Theory. Zenodo (open science repository) DOI: https://doi.org/10.5281/zenodo.18517411
Приложение A: детали трассируемости и воспроизводимости
Это приложение суммирует долгосрочную архивную информацию для трассируемости и воспроизводимости, включая run tags, результаты аудита, инвентари архивов и ключевые точки проверки, чтобы читатели могли при необходимости проверять и воспроизводить работу.
A.1 Детали трассируемости и аудита
Для обеспечения долгосрочной трассируемости проект использует timestamp-теги для каждого запуска и вывода и сохраняет исторические продукты без перезаписи. Ключевые значения, цитируемые в рукописи, происходят из строгой компиляции (compile_tag=20260205_035929) и прошли следующие аудиты согласованности:
• Все stage-level таблицы содержат run_tag и stage tags; strict compilation script выбирает «полные и согласованные» canonical table sources из report/tables.
• Значения в Tab_Z1_master_summary и Tab_Z2_conclusion_highlights поэлементно сравниваются с выбранными canonical tables.
• При генерации PDF выполняется tag audit для «referenced table/figure tags», чтобы устаревшие продукты не смешивались с актуальными.
Ключевые теги (для поиска всех промежуточных продуктов): run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442.
Результат аудита согласованности: Tab_AUDIT_checks_strict сообщает pass=9, fail=0, skip=0 (подробности см. в release package).
A.2 Шаги воспроизведения и инвентарь архива
Это исследование использует систему воспроизводимости, состоящую из «отчёта публикационного уровня + дополнения с таблицами/рисунками + полностью перезапускаемого run package». Читатели могут напрямую обратиться к Tables & Figures Supplement, чтобы проверить все таблицы/рисунки, цитируемые в статье; чтобы воспроизвести численные значения и аудиторскую цепочку с нуля, они могут использовать full_fit_runpack для загрузки данных и повторного запуска полного workflow. После завершения встроенный в пакет скрипт сравнения с reference tables может использоваться для проверки согласованности табличных значений.
A.2.1 Быстрый старт воспроизведения (RUN_FULL, Windows PowerShell)
Этот раздел даёт более короткий путь воспроизведения (Windows PowerShell). Для быстрых проверок читателям рекомендуется напрямую обратиться к Tables & Figures Supplement и поэлементно проверить цитируемые таблицы и рисунки. Для end-to-end воспроизведения и генерации всех таблиц, рисунков и аудиторских продуктов используйте full_fit_runpack: следуйте README/ONE_PAGE_REPRO_CHECKLIST пакета, чтобы запустить verify_checksums.ps1 и RUN_FULL.ps1 (рекомендуется Mode=full).
Архивная запись Zenodo (Concept DOI): https://doi.org/10.5281/zenodo.18526286.
Теги основной цепочки этой статьи: run_tag=20260204_122515; strict compile_tag=20260205_035929; release_tag=20260205_112442.
A.2.2 Архивные материалы и ключевые точки проверки (Packages & checks)
Архив Zenodo предоставляет три взаимодополняющие категории материалов: (1) отчёт публикационного уровня (эта статья, v1.1; включая Приложение B: P1A DM-baseline standardization stress test); (2) Tables & Figures Supplement (дополнительные таблицы и рисунки, охватывающие все table/figure assets, цитируемые в статье, отдельно соответствующие P1 и P1A); и (3) full_fit_runpack (полный пакет воспроизведения: загружает данные с нуля и повторно запускает полный workflow, отдельно соответствующий P1 и P1A). Пункты (1)–(2) поддерживают быстрое чтение и независимую проверку; пункт (3) обеспечивает end-to-end полную воспроизводимость.
Категория материалов | Имя файла (пример) | Назначение и позиционирование (рекомендуемый порядок использования) |
Отчёт публикационного уровня (китайский и английский) | P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf | Полный отчёт, архивированный на Zenodo; основной текст даёт ключевые выводы и аудиты устойчивости, а Приложение B даёт P1A (стресс-тест стандартизации DM-базы). |
Tables & Figures Supplement (P1) | P1_RC_GGL_supplement_figs_tables_V1_1.zip | Все таблицы (CSV) и рисунки (PNG), цитируемые в основном тексте, включая скрипты генерации и файлы тегов. |
Tables & Figures Supplement (P1A) | P1A_supplement_figs_tables_v1.zip | Все таблицы и рисунки, цитируемые в Приложении B (P1A), включая Tab_S1_P1A_scoreboard и Fig_S1_P1A_scoreboard. |
full_fit_runpack (P1) | P1_RC_GGL_full_fit_runpack_v1_1.zip | Полное end-to-end воспроизведение: загрузить данные с нуля и повторно выполнить RC-only/closure/joint и сканирования устойчивости. |
full_fit_runpack (P1A) | P1A_RC_GGL_full_fit_runpack_v1.zip | Полное end-to-end воспроизведение (Приложение B): повторно выполнить DM 7+1 + DM_STD (включая контроль EFT_BIN) и сгенерировать материалы приложения; пакет включает скрипт сравнения с эталонными таблицами для проверки согласованности табличных значений. |
Рекомендация по цитированию: при цитировании этой статьи или сопутствующих материалов воспроизводимости цитируйте Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334).
Ключевые продукты, которые должны появиться и быть сопоставимыми после воспроизведения, включают:
- report/tables/Tab_D_closure_summary__20260204_122515__*.csv (сводка замыкания)
- report/tables/Tab_F_joint_summary__20260204_122515__*.csv (сводка совместной подгонки)
- report/tables/Tab_G_joint_sigma_sweep__20260204_122515__*.csv (сканирование σ_int)
- report/tables/Tab_H_joint_rmin_sweep__20260204_122515__*.csv (сканирование R_min)
- report/tables/Tab_I_joint_covshrink_sweep__20260204_122515__*.csv (сканирование cov-shrink)
- report/tables/Tab_R2_ablation_ladder__20260204_122515__*.csv (абляция)
- report/tables/Tab_R3_leave_one_bin_out__20260204_122515__*.csv (LOO)
- report/tables/Tab_R4_negctrl_rcbin_shuffle__20260204_122515__*.csv (отрицательный контроль)
- report/final/Tab_Z1_master_summary__20260204_122515__20260205_035929.csv (строгая мастер-таблица; соответствует таблицам S1a/S1b и значениям основного текста)
- report/final/P1_RC_GGL_final_bundle__20260204_122515__20260205_035929.pdf (PDF-пакет публикационного уровня; может использоваться для быстрого просмотра и цитирования)
Приложение B: P1A — стресс-тест стандартизации DM-базы (DM 7+1 + DM_STD; с контролем EFT)
Это приложение документирует расширительный проект (P1A) по «стресс-тестированию стандартизации DM-базы», согласованный с протоколом замыкания основного текста. Его роль — обновить минимальную базу DM_RAZOR, использованную в основном тексте (NFW + фиксированная c–M, без scatter / без contraction / без core), до набора DM-баз, более близкого к астрофизической практике и более устойчивого к распространённой критике, не вводя большого числа степеней свободы и не меняя общую карту RC-bin→GGL-bin или рамку аудита. P1A охватывает и расширяет предыдущий трёхветвевой стресс-тест: он сохраняет SCAT/AC/FB, добавляя hierarchical c–M scatter + prior, одно-параметрический core proxy и nuisance m калибровки shear со стороны линзирования; также предоставляется комбинированная модель DM_STD. EFT_BIN сохраняется как контрольный эталон.
Дополнительное примечание: силы замыкания и связанные значения в Приложении B (P1A) используют больший Monte Carlo budget (например, ndraw=400, nperm=24), чем quick budget в основном тексте, предназначенный для охвата полного семейства ядер EFT (например, ndraw=60, nperm=12). Поэтому абсолютные значения могут показывать sampling drift уровня O(10). Однако сравнения model-to-model внутри одного budget/table являются честными, а знак и масштаб преимущества остаются стабильными между бюджетами.
B.1 Цель и позиционирование (зачем P1A и почему как приложение)
P1A не пытается исчерпать все возможные варианты моделирования гало ΛCDM (например, несферичность, зависимость от окружения, сложные связи галактика–гало или высокоразмерную барионную физику). Вместо этого P1A следует принципу «низкоразмерно, проверяемо, воспроизводимо»: каждый модуль усиления вводит только ≤1 ключевой эффективный параметр и остаётся подчинён трём жёстким ограничениям этой статьи:
(i) Реестр параметров: каждый новый параметр должен быть явно записан и сообщён вместе с информационными критериями (AICc/BIC);
(ii) Общая карта: всё ещё используется та же карта группировки RC-bin→GGL-bin; «подгонка карты» отдельно для одного набора данных не допускается;
(iii) Проверка замыкания: любое усиление должно показать настоящий выигрыш в переносимом предсказании RC→GGL, а не просто более хорошую RC-only подгонку.
B.2 DM 7+1 + DM_STD: определения модулей, параметры и вход в совместный posterior
Как независимый runpack, P1A предоставляет 8 DM workspaces (DM 7+1) плюс 1 EFT control: начиная с DM_RAZOR как базы, он строит три legacy одно-параметрических усиления (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB), добавляет три более стандартных defensive modules (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M), а затем предоставляет комбинированную модель DM_STD. Общая цель этих модулей — покрыть три наиболее распространённых класса критики при минимальном увеличении размерности: (a) как c–M scatter и priors входят в иерархическую модель; (b) можно ли главный эффект барионного feedback захватить одно-параметрическим core proxy; и (c) могут ли ключевые систематики со стороны линзирования быть ошибочно приняты за физический сигнал.
Workspace | dm_model | Новый параметр(ы) (≤1) | Физическая мотивация (ядро) | Принцип реализации (audit-friendly) |
|---|---|---|---|---|
DM_RAZOR | NFW (фиксированная c–M, без scatter) | — | Минимальная, проверяемая ΛCDM-база гало; используется для строгого сравнения с EFT | Общая карта фиксирована; строгий реестр параметров; используется как baseline только для относительного сравнения |
DM_RAZOR_SCAT | NFW + c–M scatter (legacy) | σ_logc | Связь c–M имеет разброс; приближена одно-параметрическим log-normal scatter | ≤1 новый параметр; общая карта сохранена; прирост замыкания используется как критерий принятия |
DM_RAZOR_AC | NFW + адиабатическое сжатие (legacy) | α_AC | Барионный infall может вызывать адиабатическое сжатие гало; приближено одно-параметрической силой | ≤1 новый параметр; карта не меняется; сообщать изменения AICc/BIC и прирост замыкания |
DM_RAZOR_FB | NFW + feedback core (legacy) | log r_core | Feedback может сформировать core во внутренней области; приближается одно-параметрическим масштабом core | ≤1 новый параметр; тот же протокол closure/negative-control; улучшение RC-only не является единственной целью |
DM_HIER_CMSCAT | Иерархический c–M scatter + prior | σ_logc (hier) | Более стандартное иерархическое c_i∼logN(c(M_i),σ_logc); влияет на совместный posterior и RC, и GGL | Явный prior; латентные c_i маргинализированы; всё ещё низкоразмерно и проверяемо |
DM_CORE1P | 1-параметрический core proxy (вдохновлён coreNFW/DC14) | log r_core | Использует одно-параметрический core proxy для главного эффекта барионного feedback, избегая высокоразмерных деталей звездообразования | Цитирует стандартную литературу; ≤1 новый параметр; привязан к проверке замыкания |
DM_RAZOR_M | NFW + nuisance калибровки shear линзирования | m_shear (GGL) | Поглощает ключевую систематику слабого линзирования как эффективный параметр, снижая риск принять систематику за физику | Nuisance явно записан; не может влиять на RC обратно; результаты оцениваются главным образом по устойчивости замыкания |
DM_STD | Стандартизованная DM-база (HIER_CMSCAT + CORE1P + m) | σ_logc + log r_core (+ m_shear) | Включает три наиболее распространённых класса критики в всё ещё низкоразмерную стандартную базу | Сообщаются реестр параметров + информационные критерии; closure — основная метрика; используется как самый сильный defensive control для DM |
Примечание: приведённые выше имена параметров следуют инженерной реализации (например, σ_logc, α_AC, log r_core и m_shear). Проектный фокус P1A — «сделать DM-базу несколько сильнее, сохраняя её проверяемой», а не превратить сторону DM в неконтролируемый высокоразмерный fitter. В частности, DM_HIER_CMSCAT вводит c–M scatter иерархически: концентрации c_i каждого гало назначается логнормальный scatter вокруг c(M_i), ограниченный глобальным σ_logc и prior c(M); эта иерархическая структура влияет на совместный posterior и RC, и GGL.
B.3 Статистический протокол и продуктовые соглашения, согласованные с основным текстом
P1A повторно использует все продукты данных, общую карту и аудиторскую рамку из основного текста. Порядок выполнения и соглашения о продуктах остаются согласованными:
(1) Run‑1: RC-only inference (выводит posterior_samples.npz и metrics.json);
(2) Run‑2: проверка замыкания RC→GGL (выводит closure_summary.json и переставленную baseline);
(3) Run‑3: совместная подгонка RC+GGL (выводит joint_summary.json).
Все цитируемые числа происходят из автоматически скомпилированной таблицы (Tab_S1_P1A_scoreboard) и могут быть проверены после повторного запуска полного P1A workflow с помощью reference-table comparison script, встроенного в P1A full_fit_runpack.
B.4 Основные результаты, точки входа таблиц/рисунков и план архива (тот же DOI)
Этот раздел даёт ключевые количественные выводы P1A. Таблица B1 суммирует ключевые метрики для RC-only, RC→GGL closure и RC+GGL joint fitting (в скобках даны различия относительно базовой DM_RAZOR). Сила замыкания определяется как ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ (чем больше, тем лучше). Рис. B1 визуализирует тот же scoreboard. Основные пункты таковы:
• Среди трёх legacy-ветвей только DM_RAZOR_FB (feedback/core) даёт небольшой чистый прирост силы замыкания: 122.21→129.45 (+7.25); SCAT и AC не дают чистого улучшения;
• Новые DM_HIER_CMSCAT и DM_RAZOR_M имеют очень малые эффекты (~0) на силу замыкания, а DM_CORE1P также не показывает значимого чистого улучшения;
• Комбинированная модель DM_STD может существенно улучшить joint logL (ближе к оптимуму joint-fit), но её сила замыкания уменьшается, что предполагает: выигрыш в основном возникает из гибкости joint-fit, а не из межзондовой переносимости;
• В качестве контроля EFT_BIN всё ещё сохраняет явное преимущество как по силе замыкания, так и по совместной подгонке. Поэтому главный вывод устойчив к введению «более сильной DM-базы + lensing nuisance».
Для прямого сравнения с результатами основного текста таблицы S1a–S1b суммируют строгое сравнение между семейством EFT и DM_RAZOR: модели EFT улучшают совместную подгонку на ΔlogL_total≈1155–1337 относительно DM_RAZOR и достигают ΔlogL_closure=172–281 в проверке замыкания. P1A лишь создаёт «более жёсткий контроль» на стороне DM; его цель — снизить опасения вроде «strawman baseline» или «systematics-as-physics», а не заменить основное сравнение.
Таблица B1 | Scoreboard P1A (чем больше, тем лучше; скобки показывают различия относительно базовой DM_RAZOR).
Ветвь модели (workspace) | Δk | Лучший logL_RC только RC (Δ) | Сила замыкания ΔlogL_closure (Δ) | Лучший совместный logL_total (Δ) |
DM_RAZOR | 0 | -15702.654 (+0.000) | 122.205 (+0.000) | -27347.068 (+0.000) |
DM_RAZOR_SCAT | 1 | -15702.294 (+0.361) | 121.236 (-0.969) | -23153.311 (+4193.758) |
DM_RAZOR_AC | 1 | -15703.689 (-1.035) | 121.531 (-0.674) | -23982.557 (+3364.511) |
DM_RAZOR_FB | 1 | -15496.046 (+206.609) | 129.454 (+7.249) | -27478.531 (-131.463) |
DM_HIER_CMSCAT | 1 | -15702.644 (+0.010) | 121.978 (-0.227) | -23153.160 (+4193.908) |
DM_CORE1P | 1 | -15723.158 (-20.504) | 122.056 (-0.149) | -27336.258 (+10.810) |
DM_RAZOR_M | 0 (+m) | -15702.654 (+0.000) | 122.205 (+0.000) | -27340.451 (+6.617) |
DM_STD | 2 (+m) | -15832.203 (-129.549) | 105.690 (-16.515) | -22984.445 (+4362.623) |
EFT_BIN | 1 | -14631.537 (+1071.117) | 204.620 (+82.415) | -19001.142 (+8345.926) |
Рис. B1 | Scoreboard P1A: closure и joint ΔlogL относительно baseline (чем больше, тем лучше).

Примерные теги для завершённого набора запусков, соответствующего этому приложению, таковы (используются для поиска промежуточных продуктов P1A и таблиц/рисунков):
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.
B.5 Рекомендуемое цитирование (примечание к цитированию приложения)
Когда читателям нужно процитировать «стресс-тест стандартизации DM-базы» в дополнение к основным выводам статьи, рекомендуется цитировать главный вывод вместе со следующим примечанием: «См. Приложение B (P1A) для стандартизованных стресс-тестов DM-базы (legacy SCAT/AC/FB + hierarchical c–M scatter prior + core proxy + lensing shear-calibration nuisance), выполненных в том же протоколе замыкания.»