Комбинированный анализ данных (Combined Data Analysis, CDA) представляет собой ключевой инструмент в физике ускорителей и смежных областях, позволяя интегрировать результаты различных экспериментов для получения более точных и надежных выводов. В условиях, когда отдельные эксперименты обладают ограниченной статистикой или систематическими погрешностями, комбинированный подход позволяет усилить чувствительность к физическим эффектам и уменьшить неопределенности.
Одним из наиболее распространённых методов комбинированного анализа является использование суммарной функции правдоподобия (likelihood). Пусть имеется N независимых экспериментов с функциями правдоподобия Li(θ), где θ — вектор параметров модели. Совокупная функция правдоподобия записывается как:
$$ L_{\text{total}}(\theta) = \prod_{i=1}^{N} L_i(\theta) $$
Максимизация Ltotal(θ) позволяет получить объединённую оценку параметров с учетом всех доступных данных. Для коррелированных экспериментов вводится ковариационная матрица C, учитывающая общие систематические ошибки.
В байесовской методологии каждая экспериментальная информация выражается через апостериорное распределение параметров P(θ|Di), где Di — данные i-го эксперимента. Совокупная апостериорная вероятность формулируется как:
$$ P(\theta | \{D_i\}) \propto P(\theta) \prod_{i=1}^{N} P(D_i | \theta) $$
где P(θ) — априорная вероятность. Байесовский подход позволяет естественно учитывать систематические ошибки, неоднородную статистику и параметры с ограниченными данными.
При обработке гистограмм и дискретных данных часто применяется метод наименьших квадратов. Суммарное χ² для нескольких экспериментов определяется как:
$$ \chi^2_{\text{total}}(\theta) = \sum_{i=1}^{N} \sum_{j=1}^{M_i} \frac{(y_{ij}^{\text{exp}} - y_{ij}^{\text{model}}(\theta))^2}{\sigma_{ij}^2} $$
где Mi — количество измерений в i-м эксперименте, σij — их погрешности. Оптимизация χtotal2 обеспечивает совместную оценку параметров с учётом всех наборов данных.
Систематические ошибки представляют собой одну из главных проблем при объединении данных. Для их учета используются следующие методы:
Особое внимание уделяется корректному учету корреляций между экспериментами, иначе комбинированный анализ может дать смещенные результаты.
Представим два эксперимента, измеряющих сечение одного и того же процесса:
| Эксперимент | Сечение, σ [pb] | Статистическая ошибка | Систематическая ошибка |
|---|---|---|---|
| A | 12.3 | 0.5 | 0.8 |
| B | 13.1 | 0.7 | 0.6 |
Используя комбинированный χ²-анализ с корреляционной матрицей для систематических ошибок, можно получить объединённое значение сечения с уменьшенной неопределенностью и оценить согласованность экспериментов.
Комбинированный анализ данных различных экспериментов является фундаментальным инструментом современной физики ускорителей, обеспечивая более точное определение физических параметров, снижение неопределенностей и возможность выявления новых эффектов. Его успешное применение требует тщательного учета систематических ошибок, корреляций между экспериментами и продуманного выбора статистических методов.