← Эксперимент

Публичный путеводитель на основе P1_RC_GGL: строгого теста замыкания галактической динамики и слабого линзирования (v1.1)

Исходный отчёт автора: Guanglin Tu | Версионная основа: P1 v1.1 | Статус: публичное пояснение / не рецензированная статья
Связанные архивы: DOI отчёта 10.5281/zenodo.18526334 | DOI пакета воспроизведения 10.5281/zenodo.18526286

Примечание к чтению

Это пояснение, а не отдельный академический отчёт. Оно основано на исходном отчёте P1, сохраняет ключевые рисунки и таблицы и добавляет простые объяснения «что это означает» на каждом ключевом шаге.

Этот документ объясняет только выводы, к которым P1 приходит в рамках заявленных наборов данных, реестра параметров и статистического протокола: в совместном тесте кривых вращения галактик (RC) и слабого линзирования галактика–галактика (GGL) модель среднего гравитационного отклика EFT существенно превосходит проверенную здесь минимальную baseline DM_RAZOR.

Этот документ не читает P1 как утверждение, что он «свергает тёмную материю». P1 — лишь первый шаг в экспериментах серии P. Он проверяет один наблюдаемый слой EFT — «среднее гравитационное основание», а не весь каркас EFT.

0 | Понять P1 за пять минут: что именно делает этот тест?

P1 можно представить как перекрёстную проверку между наблюдательными зондами. Он не просто спрашивает, может ли модель подогнаться под один набор данных. Он ставит на одну аудиторскую площадку два очень разных гравитационных считывания: кривые вращения (RC) считывают динамику внутри галактических дисков, а слабое линзирование галактика–галактика (GGL) считывает проецированный гравитационный отклик на более крупных масштабах.

Ключевая фраза P1

P1 поднимает планку сравнения от «хорошо ли подгоняет один зонд?» к «замыкается ли между зондами?». Сильная работа при правильном отображении, за которой следует обвал сигнала при перемешанном отображении, указывает, что модель, возможно, улавливает гравитационную структуру, общую для RC и GGL.

Таблица 0 | Ключевые числа P1 и их чтение простым языком

Показатель

Чтение в P1 / P1A

Значение простым языком

Joint-fit ΔlogL_total

В основном сравнении EFT на 1155–1337 выше DM_RAZOR

Разрыв суммарных баллов по двум наборам данных; чем выше, тем лучше общее объяснение.

Сила замыкания ΔlogL_closure

В основном сравнении EFT даёт 172–281; DM_RAZOR даёт 127

Способность предсказывать GGL после вывода только из RC; чем выше, тем выше межзондовая самосогласованность.

Negative-control shuffle

После перемешивания RC-bin→GGL-bin сигнал замыкания EFT падает до 6–23

Если правильное соответствие разрушено, преимущество должно исчезнуть; чем резче падение, тем сильнее оно отсекает ложный сигнал.

P1A multi-DM stress test

DM 7+1 + DM_STD, при сохранении EFT_BIN как контроля

P1A рассматривает не только минимальную DM_RAZOR; он помещает несколько низкоразмерных и аудируемых ветвей усиления DM в тот же протокол замыкания.


1 | Зачем запускать P1? Где застревает космология галактических масштабов

Проблемы галактических масштабов остаются трудными потому, что потребность в «дополнительной гравитации/массе» проявляется не только в кривых вращения. Многие наблюдения показывают тесную связь между видимым барионным веществом в галактиках и фактическими динамическими или линзировочными считываниями. Для пути тёмной материи это означает, что тёмные гало, барионная обратная связь, истории формирования галактик и наблюдательные систематики должны быть согласованы с большой точностью. Для гравитационных маршрутов без тёмной материи это означает, что модель не может хорошо выглядеть только на RC: она должна выдерживать также слабое линзирование, популяционные масштабные соотношения и отрицательные контроли.

Именно поэтому был спроектирован P1. Он не начинает с тезиса «тёмная материя неверна» или «EFT обязательно права». Он выносит на аудиторскую проверку одно проверяемое утверждение: оставляет ли средний гравитационный отклик EFT воспроизводимый и переносимый сигнал в перекрёстном замыкании RC→GGL.

Внешний литературный фон: почему окно RC+GGL важно

Радиальное ускорительное соотношение (RAR), предложенное McGaugh, Lelli и Schombert в 2016 году, показывает тесную корреляцию с малым разбросом между наблюдаемым ускорением, отслеживаемым кривыми вращения, и ускорением, предсказанным по барионному веществу. Это делает coupling барионов и гравитационного отклика неизбежным вопросом для теории галактических масштабов.

Brouwer et al. (2021) использовали слабое линзирование KiDS-1000, чтобы расширить RAR к меньшим ускорениям и большим радиусам, сравнив MOND, emergent gravity Verlinde и модели LambdaCDM. Они также отметили, что различия между early-/late-type галактиками, газовые гало и связи galaxy–halo остаются ключевыми объяснительными вопросами.

Mistele et al. (2024) далее вывели кривые круговой скорости изолированных галактик из слабого линзирования, сообщив об отсутствии явного падения вплоть до сотен kpc и даже примерно 1 Mpc, в согласии с BTFR. Это показывает, что слабое линзирование становится важным внешним считыванием для проверки гравитационного отклика на галактических масштабах.

Ценность P1, следовательно, не в том, что он первым обсуждает RC и GGL вместе. Она в том, что он помещает их в проверяемый протокол: фиксированное отображение, реестр параметров, замыкание RC-only→GGL, отрицательные контроли shuffle и много-DM стресс-тесты P1A.


2 | Что означает EFT в P1? Это не эффективная теория поля

Здесь EFT означает Теорию энергетических филаментов (Energy Filament Theory), а не привычную в физике эффективную теорию поля (Effective Field Theory). В техническом отчёте P1 EFT используется намеренно сдержанно: она не участвует как завершённая финальная теория, а сначала сжимается до наблюдаемой, готовой к подгонке и опровержимой параметризации «среднего гравитационного отклика».

Проще говоря, P1 пока не обсуждает все микроскопические источники дополнительной гравитации и не пытается одним шагом доказать весь каркас EFT. Он задаёт более узкий и жёсткий вопрос: если на галактических масштабах существует некоторый средний дополнительный гравитационный отклик, может ли он сначала объяснить RC, а затем предсказать GGL?

Какую часть EFT проверяет P1?

P1 проверяет «среднее гравитационное основание»: статистически устойчивый средний вклад, который может переноситься между выборками.

P1 пока не рассматривает stochastic / noise floor: случайные члены, вариации от объекта к объекту или дополнительный разброс, который может возникать из более микроскопических флуктуационных процессов.

P1 также не обсуждает полный микроскопический механизм, обилие, время жизни или глобальные космологические ограничения. Это первый шаг экспериментов серии P, а не финальный вердикт.


3 | План серии P1: почему начинать со «среднего основания»?

Серию P можно понимать как наблюдательную программу восстановления EFT. Она не выкладывает на стол все утверждения сразу; сначала она выделяет ту часть, которую публичные данные могут проверить наиболее прямо. P1 начинает со среднего члена: если средний гравитационный отклик не способен замкнуть RC→GGL, то для обсуждения более сложных шумовых членов или микроскопических механизмов не остаётся прочной точки входа.

Таблица 1 | Послойное позиционирование серии P

Уровень

Задаваемый вопрос

Роль в P1

P1

Может ли средний гравитационный отклик замкнуть RC→GGL?

Главный вопрос текущего отчёта

P1A

Если усилить сторону DM, остаётся ли вывод устойчивым?

Приложение B: stress test DM 7+1 + DM_STD

Поздняя работа серии P

Можно ли расширить протокол на больше данных, больше зондов и более сложные систематики?

Направление будущей работы

Более глубокие вопросы

Как соединяются средний член, шумовой член и микроскопический механизм?

Вне области выводов P1


4 | Какие это данные? Что говорят нам RC и GGL по отдельности?


4.1 Кривые вращения (RC): скоростной датчик диска

Кривая вращения записывает, с какой скоростью газ и звёзды обращаются вокруг центра галактики на разных радиусах. Чем быстрее они движутся, тем сильнее должна быть центростремительная сила на данном радиусе, а значит, тем сильнее эффективное гравитационное притяжение. P1 использует базу SPARC; после предварительной обработки она включает 104 галактики, 2 295 точек скорости и 20 RC-бинов.


4.2 Слабое линзирование (GGL): гравитационные весы на более крупных масштабах

Слабое линзирование галактика–галактика измеряет, как передние галактики слегка искривляют свет фоновых галактик. Это соответствует проецированному гравитационному отклику на более крупных, гало-подобных масштабах и не зависит от деталей газовой динамики в галактических дисках. P1 использует публичные данные GGL KiDS-1000 / Brouwer et al. 2021: четыре бина по звёздной массе, по 15 радиальных точек на бин, всего 60 точек данных, с полной ковариационной матрицей.


4.3 Фиксированное отображение: почему 20 RC-бинов → 4 GGL-бина имеют значение

P1 связывает 20 RC-бинов с 4 GGL-бинами по фиксированному правилу: каждому GGL-бину соответствуют пять RC-бинов, усреднённых с весами по числу галактик. Это отображение одинаково для всех моделей и становится жёстким ограничением как для теста замыкания, так и для честного сравнения.

Почему не настраивать отображение постфактум?

Если бы можно было постфактум выбирать, какие RC-бины соответствуют каким GGL-бинам, модель могла бы искусственно создать замыкание, переставляя соответствия. P1 заранее фиксирует отображение 20→4, а затем намеренно ломает его через shuffle negative control именно для того, чтобы проверить, зависит ли сигнал замыкания от физически разумного соответствия.


5 | Модели и метод: что именно сравнивает P1?


5.1 Сторона EFT: низкоразмерный средний гравитационный отклик

На стороне EFT средний гравитационный отклик описывает низкоразмерный дополнительный скоростной член. Форма этого дополнительного члена задаётся безразмерной kernel-функцией f(r/ℓ), где ℓ — глобальный масштаб, а амплитуда назначается по RC-бинам. Разные ядра представляют разные начальные наклоны, скорости перехода и дальние хвосты и используются как стресс-тесты устойчивости.


5.2 Сторона DM: основное сравнение и Приложение P1A нужно читать отдельно

В основном сравнении DM_RAZOR — минимизированная и аудируемая базовая линия NFW: она использует фиксированное отношение c–M и не включает разброс от гало к гало, адиабатическое сжатие, feedback core, несферичность или вклад окружения. Преимущество — контролируемая свобода и лёгкая воспроизводимость; ограничение — такая линия не может представлять все модели LambdaCDM или все модели гало тёмной материи.

Поэтому Приложение B (P1A) превращает сторону DM в набор стандартизированных стресс-тестов. Не меняя общего отображения и протокола замыкания, оно последовательно добавляет низкоразмерные ветви усиления: SCAT, AC, FB, HIER_CMSCAT, CORE1P, lensing m и объединённую baseline DM_STD, сохраняя EFT_BIN как контроль. Читать P1A можно так: вместо сравнения только с одной минимальной DM baseline он ставит несколько распространённых и аудируемых DM-механизмов под одну и ту же «линейку замыкания».

Точная формулировка вывода, используемая здесь

Основной текст: серия EFT значительно превосходит минимальную DM_RAZOR в основном сравнении.

Приложение B / P1A: в нескольких низкоразмерных и аудируемых ветвях усиления DM и стресс-тесте DM_STD некоторые совместные подгонки DM улучшаются, но сила замыкания не стирает преимущество EFT_BIN.

Поэтому самая безопасная формулировка такова: в пределах данных, отображения, реестра параметров и протокола замыкания P1/P1A средний гравитационный отклик EFT показывает более сильную межданных согласованность; это не то же самое, что исключить все модели тёмной материи.


5.3 Тест замыкания: важнейшая экспериментальная логика P1

1. Выполнить подгонку только по RC, получив набор апостериорных выборок RC-only.

2. Не перенастраивать модель по GGL; напрямую использовать апостериорное распределение RC для предсказания GGL.

3. Использовать полную ковариацию, чтобы вычислить балл предсказания GGL при правильном отображении, logL_true.

4. Случайно переставить соответствие RC-bin→GGL-bin и вычислить балл отрицательного контроля, logL_perm.

5. Вычесть одно из другого, чтобы получить силу замыкания: ΔlogL_closure = <logL_true> − <logL_perm>.

Простая аналогия

Тест замыкания похож на повторный экзамен в другой аудитории. Модель сначала учит закономерность в «аудитории RC», затем отвечает в «аудитории GGL». Если она выучила общую закономерность, а не локальный трюк, она должна хорошо выступить и после перехода в другую аудиторию. Если соответствие аудиторий намеренно перемешать, преимущество должно исчезнуть.


5.4 Перед чтением технических таблиц: четыре точки входа

Таблица 5.4 | Маршрут чтения следующего блока альбомных технических таблиц

Точка входа

Что смотреть

Почему это важно

Таблица S1a

Общий балл joint fit RC+GGL

Отвечает: чьё общее объяснение сильнее по двум наборам данных?

Таблица S1b

Сила замыкания, shuffle, сканирования устойчивости

Отвечает: может ли то, что выучено из RC, переноситься на GGL?

Таблица B0

Определения нескольких ветвей усиления DM в P1A

Не даёт свести P1 к «сравнению только с минимальной DM_RAZOR».

Таблица B1

Scoreboard замыкания и joint в P1A

Проверяет, исчезает ли преимущество замыкания после усиления DM.

Примечание по макету

Следующая страница переходит в альбомный формат, чтобы сохранить широкие таблицы из исходного отчёта без удаления столбцов или сжатия до нечитаемости. Основной текст уже дал простое чтение; альбомные технические таблицы предназначены для читателей, которым нужно проверить числа и ветви моделей.

Рис. 0.1 | Процесс теста замыкания P1 одним взглядом

Примечание: верхняя цепочка — «тест замыкания» (подгонка только по RC → использование RC posterior для предсказания GGL); нижняя цепочка — «совместная подгонка» (одновременное оценивание RC+GGL). Справа истинное отображение сравнивается с перемешанным отображением, чтобы получить силу замыкания ΔlogL.


6 | Ключевые технические таблицы: основные таблицы отчёта и таблицы P1A

Таблица S1a | Основные метрики сравнения совместной подгонки (RC+GGL, Strict; сохранено из исходного отчёта)

Модель (workspace)

W-kernel

k

Joint logL_total (best)

ΔlogL_total vs DM

AICc

BIC

DM_RAZOR

none

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

none

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponential

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

Таблица S1b | Метрики замыкания и устойчивости (Strict; сохранено из исходного отчёта)

Модель (workspace)

Closure ΔlogL (true-perm)

Negative-control ΔlogL после shuffle

Диапазон ΔlogL при сканировании σ_int

Диапазон ΔlogL при сканировании R_min

Диапазон ΔlogL при сканировании cov-shrink

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308

Таблица B0 | Определения ветвей усиления DM в P1A (сохранено из Приложения B исходного отчёта)

Workspace

модель DM

Новые параметры (≤1)

Физическая мотивация (ядро)

Принцип реализации (audit-friendly)

DM_RAZOR

NFW (fixed c–M, no scatter)

Минимальная, аудируемая baseline гало LambdaCDM; используется для строгого сравнения с EFT

Фиксированное общее отображение; строгий реестр параметров; используется только как baseline для относительного сравнения

DM_RAZOR_SCAT

NFW + scatter c–M (legacy)

σ_logc

Разрешает scatter в отношении c–M; аппроксимируется одно-параметрическим log-normal scatter

≤1 новый параметр; всё ещё использует общее отображение; выигрыш замыкания — критерий приёмки

DM_RAZOR_AC

NFW + adiabatic contraction (legacy)

α_AC

Барионное падение может вызывать адиабатическое сжатие гало; аппроксимируется одним параметром силы

≤1 новый параметр; отображение не меняется; сообщаются изменения AICc/BIC и выигрыш замыкания

DM_RAZOR_FB

NFW + feedback core (legacy)

log r_core

Feedback может сформировать внутренний core; аппроксимируется одним параметром масштаба core

≤1 новый параметр; тот же протокол замыкания/отрицательного контроля; улучшение RC-only не является единственной целью

DM_HIER_CMSCAT

Hierarchical c–M scatter + prior

σ_logc (hier)

Более стандартная иерархическая схема c_i∼logN(c(M_i), σ_logc); влияет на совместный posterior RC и GGL

Явный prior; latent c_i маргинализируются; остаётся низкоразмерной и аудируемой схемой

DM_CORE1P

1‑parameter core proxy (coreNFW/DC14‑inspired)

log r_core

Использует одно-параметрический core proxy для главного эффекта барионной обратной связи, избегая высокоразмерных деталей звездообразования

Ссылается на стандартную литературу; ≤1 новый параметр; связано с тестом замыкания

DM_RAZOR_M

NFW + lensing shear‑calibration nuisance

m_shear (GGL)

Поглощает ключевую систематику слабого линзирования эффективным параметром, снижая риск принять систематику за физику

Nuisance явно занесён в реестр; он не может обратно влиять на RC; результаты оцениваются главным образом по устойчивости замыкания

DM_STD

Standardized DM baseline (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

Помещает три самых распространённых возражения в одну всё ещё низкоразмерную стандартизированную baseline

Сообщает и реестр параметров, и информационные критерии; замыкание — главная метрика; используется как самый сильный защитный DM-контроль

Таблица B1 | Scoreboard P1A (чем выше, тем лучше; сохранено из Приложения B исходного отчёта)

Модельная ветвь (workspace)

Δk

RC-only best logL_RC (Δ)

Сила замыкания ΔlogL_closure (Δ)

Joint best logL_total (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

Как читать таблицу B1 (scoreboard P1A)

• Δk: новые степени свободы; большее значение означает более сложную модель, но не автоматически лучшую.

• Сосредоточьтесь на двух столбцах: сила замыкания ΔlogL_closure(Δ) (чем выше, тем больше переносная самосогласованность) и Joint best logL_total(Δ) (общий балл joint fit).

• Значение в скобках (Δ) — разница относительно DM_RAZOR для прямого сравнения.

• Главный вопрос этой таблицы: исчезает ли преимущество замыкания, когда DM baseline разумно усиливается.

• Подсказка для чтения: DM_STD заметно повышает joint score, но его сила замыкания снижается; EFT_BIN остаётся выше по силе замыкания.

Однофразовое резюме: в этом низкоразмерном и аудируемом наборе DM-усилений улучшение joint fit не автоматически создаёт более сильное замыкание; замыкание, то есть переносимость, остаётся ключевым критерием.


7 | Как читать основные результаты?

7.1 Совместная подгонка: по двум наборам данных EFT набирает более высокий балл в основном сравнении

Таблица S1a и рис. S4 показывают, что при тех же данных, том же общем отображении и примерно сопоставимом масштабе параметров серия EFT имеет joint ΔlogL_total на 1155–1337 выше относительно DM_RAZOR. Простое чтение таково: при одном правиле оценивания, применённом к RC и GGL вместе, модели EFT в основном сравнении получают более высокие суммарные баллы.


7.2 Тест замыкания: главный акцент P1 — переносимость

Высокая сила замыкания означает, что параметры, выведенные только из RC, могут лучше предсказывать GGL без повторного просмотра GGL. В отчёте P1 ΔlogL_closure у EFT составляет 172–281, тогда как у DM_RAZOR — 127. Это важнее, чем просто сказать, что каждая модель хорошо подгоняет свои данные, потому что на втором наборе данных свобода модели ограничена.


7.3 Отрицательный контроль: почему «обвал сигнала» — это хорошо?

После случайного перемешивания группового соответствия RC-bin→GGL-bin сигнал замыкания EFT падает до диапазона 6–23. Для обычного читателя этот шаг — проверка против «читерства»: если бы преимущество замыкания было лишь побочным эффектом кода, единиц, обработки ковариации или удачной подгонки, перемешанное соответствие могло бы всё ещё показывать преимущество. Вместо этого преимущество рушится, что указывает на его зависимость от правильного отображения.

Рис. S3 | Сила замыкания (чем выше, тем лучше): среднее преимущество log-likelihood при предсказании RC-only → GGL.

Как читать этот рисунок

Этот рисунок — центральный для P1. Чем выше столбец, тем лучше информация, выученная из RC, переносится на GGL.

Серия EFT в целом выше DM_RAZOR, что указывает на более сильное межзондовое замыкание в эксперименте «сначала учим RC, затем предсказываем GGL».

Рис. S4 | Преимущество совместной подгонки (чем выше, тем лучше): best logL_total для RC+GGL относительно DM_RAZOR.

Как читать этот рисунок

Этот рисунок показывает общий балл после совместной подгонки RC и GGL.

Все варианты EFT значительно выше нуля, показывая, что преимущество EFT в основном сравнении — не локальный эффект одной точки, а общее поведение совместного анализа.

Рис. R1 | Отрицательный контроль: после перемешивания групп сигнал замыкания резко падает.

Как читать этот рисунок

Этот рисунок показывает, что после перемешивания правильного соответствия RC↔GGL-бинов сигнал замыкания резко падает.

Это делает результат P1 больше похожим на реальную согласованность в отображении данных, а не на численное совпадение, доступное при любом отображении.


8 | Устойчивость и контроли: как P1 избегает впечатления простой настройки параметров

Самые естественные вопросы к любому техническому отчёту таковы: не возникает ли преимущество из одной настройки шума, одного участка данных в центральной области, одной обработки ковариации или переобучения? P1 отвечает несколькими стресс-тестами.

Таблица 2 | Как читать тесты устойчивости и отрицательные контроли P1

Тест

Какой вопрос он пытается снять

Чтение

Сканирование σ_int

Если RC содержит дополнительный неизвестный scatter, остаётся ли вывод устойчивым?

После ослабления ошибок RC ranking EFT и масштаб преимущества остаются устойчивыми.

Сканирование R_min

Если центральной области галактик нельзя полностью доверять, остаётся ли вывод устойчивым?

После отсечения центральной области EFT всё ещё сохраняет положительное преимущество.

Сканирование cov-shrink

Если оценка ковариации GGL неопределённа, остаётся ли вывод устойчивым?

После сжатия ковариации к диагональной матрице преимущество нечувствительно.

Лестница абляции

Получает ли EFT преимущество за счёт ненужной сложности?

Полный EFT_BIN необходим по информационным критериям.

LOO held-out prediction

Объясняет ли модель только уже виденные данные?

Оставленные вне подгонки GGL-бины всё ещё показывают относительно сильное обобщение.

RC-bin shuffle

Происходит ли замыкание из истинного отображения?

После перемешивания групп замыкание падает, поддерживая зависимость от отображения.

Рис. R2 | Диапазон ΔlogL_total при сканировании σ_int (чем выше, тем лучше).

Как читать этот рисунок

Проверяет, сохраняется ли преимущество EFT после изменения предполагаемого внутреннего scatter RC.

Рис. R3 | Диапазон ΔlogL_total при сканировании R_min (чем выше, тем лучше).

Как читать этот рисунок

Проверяет, остаётся ли преимущество EFT устойчивым после отсечения сложной центральной области.

Рис. R4 | Диапазон ΔlogL_total при сканировании cov-shrink (чем выше, тем лучше).

Как читать этот рисунок

Проверяет, чувствителен ли ranking к изменениям обработки ковариации слабого линзирования.

Рис. R5 | Лестница абляции EFT_BIN (AICc; чем ниже, тем лучше).

Как читать этот рисунок

Проверяет, действительно ли полный EFT_BIN необходим для объяснения данных, а не просто добавляет параметры.

Рис. R6 | LOO: распределение log-likelihood для оставленных вне подгонки бинов.

Как читать этот рисунок

Проверяет, предсказывает ли модель всё ещё GGL-бины, которых она не видела.

Рис. R7 | Отрицательный контроль: перемешанное отображение приводит к явному падению closure mean logL_true.

Как читать этот рисунок

Дополнительно показывает с точки зрения mean logL_true, что замыкание зависит от правильного межданных отображения.


9 | P1A: почему «несколько DM-моделей в приложении» имеют значение

Этот раздел не спрашивает: «EFT победила только одну минимальную DM_RAZOR?» Он спрашивает, меняются ли выводы теста замыкания и совместной подгонки, когда DM baseline усиливается в низкоразмерной, воспроизводимой и ясно учтённой постановке (P1A). Иными словами, P1A снижает критику о том, что сравнение выбрало слишком слабую DM baseline, и переносит обсуждение к вопросу: сохраняются ли различия в closure performance при аудируемом наборе DM-усилений.

P1A не пытается исчерпать все возможные модели гало LambdaCDM и не превращает сторону DM в высокоразмерный, непроверяемый подгонщик. Он выбирает низкоразмерные, воспроизводимые усиления с ясным реестром параметров: concentration scatter, adiabatic contraction, feedback core, hierarchical c–M scatter prior, one-parameter core proxy, weak-lensing shear-calibration nuisance и объединённую ветвь DM_STD.

Главное чтение P1A

Среди трёх legacy-ветвей только feedback/core даёт небольшой чистый прирост силы замыкания; SCAT и AC не дают чистого прироста замыкания.

DM_HIER_CMSCAT, DM_RAZOR_M и DM_CORE1P мало влияют на силу замыкания или не показывают значимого чистого прироста.

DM_STD может заметно улучшить joint logL, но его сила замыкания падает; это указывает, что он главным образом повышает гибкость joint fit, а не переносную предсказательную способность RC→GGL.

В таблице B1 P1A EFT_BIN всё ещё сохраняет более высокую силу замыкания и преимущество joint fit. Поэтому ключевое утверждение P1 не следует упрощать до «он победил только минимальный DM_RAZOR».

Рис. B1 | Scoreboard P1A: closure и joint ΔlogL относительно baseline (чем выше, тем лучше).

Как читать этот рисунок

Этот рисунок показывает, как несколько ветвей усиления DM работают относительно baseline.

Его смысл не в том, что «вся DM исключена». Он показывает, что в выбранном P1A низкоразмерном и аудируемом диапазоне DM-усилений усиление DM не стирает преимущество замыкания EFT_BIN.


10 | Почему эксперимент P1 стоит делать


10.1 Методологический смысл: поставить межзондовое замыкание выше однозондовой подгонки

Теория галактических масштабов легко застревает в споре о том, может ли данная модель подогнать один набор кривых вращения. P1 поднимает планку: могут ли параметры, выученные из RC, предсказать слабое линзирование без перенастройки по GGL? Это превращает P1 из соревнования по подгонке в тест переноса предсказаний.


10.2 Смысл прозрачности: считать воспроизводимую цепочку частью результата

Важный вклад P1 состоит в том, что он публикует данные, таблицы и рисунки, run labels, отрицательные контроли, пакет воспроизведения и аудиторскую цепочку вместе. Это важно и для сторонников, и для критиков: обсуждение может возвращаться к одним и тем же публичным данным, одному и тому же отображению, одним и тем же скриптам и одним и тем же метрикам, вместо сравнения лозунгов.


10.3 Физический смысл: сильный стресс-тест для гравитации без тёмной материи

В направлениях гравитации без тёмной материи многие модели могут объяснить часть феноменологии кривых вращения или RAR. Более трудная задача — одновременно пройти считывания слабого линзирования и через отрицательные контроли показать, что сигнал зависит от правильного отображения. Значение P1 в том, что он помещает средний гравитационный отклик EFT в протокол, похожий на внешний экзамен: RC — поле обучения, GGL — поле переноса, а shuffle — поле защиты от «читерства».


10.4 Важен ли это эксперимент для гравитации без тёмной материи?

Осторожный ответ таков: если обработка данных P1, пакет воспроизведения и протокол замыкания выдержат внешнюю проверку, его можно считать RC+GGL экспериментом замыкания, который заслуживает серьёзного внимания в исследованиях гравитации без тёмной материи / модифицированной гравитации. Его важность не в утверждении, что он «свергает тёмную материю», а в том, что он предлагает межзондовый критерий, который можно воспроизвести, оспорить и расширить.

Существует ли уже столь же сильный каркас предсказательного замыкания RC+GGL?

Уже существуют релевантные каркасы и наблюдательные традиции. MOND/RAR хорошо организует многие явления кривых вращения; работа KiDS-1000 по RAR из слабого линзирования также сравнивает MOND, emergent gravity Verlinde и модели LambdaCDM. LambdaCDM также может объяснять часть феноменологии слабого линзирования и динамики через связи galaxy–halo, газовые гало и моделирование feedback.

Однако точное утверждение P1 не в том, что никакой другой каркас не может объяснить RC+GGL. Оно в том, что при собственном публичном фиксированном отображении P1, замыкании RC-only→GGL, отрицательном контроле shuffle, реестре параметров и протоколе P1A multi-DM stress test EFT сообщает более сильные показатели замыкания.

Иными словами, больше всего внешней проверки в P1 заслуживает его конкретный и воспроизводимый протокол сравнения. Очень полезным следующим шагом было бы проверить, могут ли MOND/RAR, LambdaCDM/HOD, гидродинамические симуляции или другие каркасы модифицированной гравитации достичь равных или более высоких closure scores по тому же протоколу.


11 | Что P1 может заключить, а что не может?

Таблица 3 | Границы выводов P1

Можно заключить

При данных RC+GGL P1, фиксированном отображении и основном протоколе сравнения серия EFT имеет более высокую силу joint fit и замыкания, чем минимальная DM_RAZOR.

Можно заключить

В пределах низкоразмерного и аудируемого диапазона DM-усилений P1A несколько DM-усилений не стирают преимущество замыкания EFT_BIN.

Можно заключить

Отрицательный контроль shuffle показывает, что сигнал замыкания зависит от правильного межданных отображения и не может быть получен из произвольных отображений.

Нельзя заключить

P1 не опровергает все модели тёмной материи. P1A всё ещё не исчерпывает несферичность, зависимость от окружения, сложные связи galaxy–halo, высокоразмерный feedback или полные космологические симуляции.

Нельзя заключить

P1 не доказывает полную теорию EFT из первых принципов. Он проверяет только феноменологический слой среднего гравитационного отклика.

Нельзя заключить

P1 не исключает все систематики. Он даёт свидетельства устойчивости только в пределах перечисленных стресс-тестов и аудиторского периметра.


12 | Частые вопросы обычных читателей

Q1: Значит ли это, что «тёмной материи не существует»?

Нет. Выводы P1 должны быть ограничены данными, протоколом и сравнительными моделями, использованными здесь. P1A идёт дальше минимальной baseline DM_RAZOR, но всё ещё не представляет все возможные модели тёмной материи.

Q2: Значит ли это, что «EFT доказана»?

Тоже нет. P1 проверяет EFT как параметризацию среднего гравитационного отклика и показывает более сильное RC→GGL замыкание. Микроскопические механизмы и полная теория не являются выводами P1.

Q3: Почему не указать значение значимости σ напрямую?

P1 использует унифицированные likelihood scores, информационные критерии и различия замыкания. ΔlogL — относительное преимущество при одном и том же правиле оценивания; это не то же самое, что одно значение σ.

Q4: Зачем перемешивать отображение RC-bin→GGL-bin?

Это отрицательный контроль. Подлинный межзондовый сигнал должен зависеть от правильного отображения. Если после перемешивания сигнал оставался бы столь же сильным, это, наоборот, указывало бы на implementation bias или статистический артефакт.

Q5: Какой следующий шаг для P1 самый важный?

Расширить тот же протокол на больше данных, больше DM-контролей, более сложные систематики и больше каркасов модифицированной гравитации — особенно в форме, которая позволит внешним командам перепроверить его по той же closure metric.


13 | Краткий словарь

Таблица 4 | Краткий словарь

Термин

Объяснение в одном предложении

Кривая вращения (RC)

Соотношение радиус–скорость в галактическом диске, используемое для вывода эффективной гравитации в плоскости диска.

Слабое линзирование (GGL)

Измеряет среднее распределение гравитации/массы вокруг передних галактик по статистическим искажениям форм фоновых галактик.

Тест замыкания

Использует RC posterior для предсказания GGL, затем сравнивает его с отрицательным контролем при перемешанном отображении.

Отрицательный контроль

Намеренно ломает ключевую структуру, чтобы увидеть, исчезает ли сигнал; используется для отсечения ложных сигналов.

NFW-гало

Профиль плотности гало тёмной материи, широко используемый в моделях холодной тёмной материи.

Соотношение c–M

Соотношение между концентрацией гало c и массой M; разрешение scatter влияет на гибкость модели.

DM_STD

Стандартизированная ветвь DM-стресс-теста в P1A, объединяющая несколько низкоразмерных DM-усилений с lensing nuisance parameter.

ΔlogL

Разница log-likelihood между двумя моделями при одном и том же правиле оценивания; положительное значение означает, что первая модель работает лучше.

Ковариация

Матричное описание корреляций между точками данных; данные слабого линзирования обычно требуют полной ковариационной матрицы.


14 | Рекомендуемый маршрут чтения и входы для цитирования

1. Сначала прочитайте разделы 0–2, чтобы понять вопрос P1 и сдержанную роль EFT внутри P1.

2. Затем посмотрите рис. S3, рис. S4 и таблицы S1a/S1b, чтобы понять силу замыкания, совместную подгонку и отрицательные контроли.

3. Если вас беспокоит, что DM baseline слишком слабая, переходите прямо к разделу 9 и таблице B1 / рис. B1.

4. Для технической проверки вернитесь к техническому отчёту P1 v1.1, Tables & Figures Supplement и full_fit_runpack.

Основные входы в архивы

Технический отчёт P1 (release-level, Concept DOI): 10.5281/zenodo.18526334

Полный пакет воспроизведения P1 (Concept DOI): 10.5281/zenodo.18526286

Структурированная база знаний EFT (опционально, Concept DOI): 10.5281/zenodo.18853200

Примечание о лицензии: технический отчёт использует CC BY-NC-ND 4.0; полный пакет воспроизведения использует CC BY 4.0 (приоритет имеют записи технического отчёта и архивов Zenodo).


15 | Ссылки и внешний фон

McGaugh, S. S., Lelli, F., & Schombert, J. M. (2016). The Radial Acceleration Relation in Rotationally Supported Galaxies. Physical Review Letters, 117, 201101. DOI: 10.1103/PhysRevLett.117.201101.

Famaey, B., & McGaugh, S. S. (2012). Modified Newtonian Dynamics (MOND): Observational Phenomenology and Relativistic Extensions. Living Reviews in Relativity, 15, 10. DOI: 10.12942/lrr-2012-10.

Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.

Mistele, T., McGaugh, S., Lelli, F., Schombert, J., & Li, P. (2024). Indefinitely Flat Circular Velocities and the Baryonic Tully-Fisher Relation from Weak Lensing. The Astrophysical Journal Letters, 969, L3 / arXiv:2406.09685.

Bullock, J. S., & Boylan-Kolchin, M. (2017). Small-Scale Challenges to the LambdaCDM Paradigm. Annual Review of Astronomy and Astrophysics, 55, 343–387. DOI: 10.1146/annurev-astro-091916-055313.

Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.

Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493.

Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374.