АНАЛИЗ ПОВОЗРАСТНЫХ РИСКОВ СМЕРТНОСТИ НАСЕЛЕНИЯ. МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ (утв. Минздравом РФ 22.01.2001 n 11-3/25-09)


Утверждаю
Руководитель Департамента
госсанэпиднадзора
Министерства здравоохранения
Российской Федерации
С.И.ИВАНОВ
22 января 2001 г. N 11-3/25-09
АНАЛИЗ ПОВОЗРАСТНЫХ РИСКОВ СМЕРТНОСТИ НАСЕЛЕНИЯ
МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ
Методические рекомендации предназначены для использования в системе социально-гигиенического мониторинга в центрах госсанэпиднадзора 1 и 2 уровней управления для оценки состояния здоровья населения.
Программное обеспечение к Методическим рекомендациям "Анализ повозрастных рисков смертности населения" можно взять на сайте Департамента госсанэпиднадзора Минздрава России - WWW.DEPART.DRUGREG.RU
Введение
Одной из основных задач, стоящих перед государственной санитарно-эпидемиологической службой на современном этапе, является определение причинно-следственных связей между состоянием здоровья населения и воздействием факторов среды обитания человека. Для решения этой задачи целесообразно использование методологии оценки риска здоровью населения. Оценка риска - это один из видов экспертных работ, направленный на определение числа людей, которые в ответ на воздействие на них конкретного неблагоприятного фактора, действующего с определенной силой и в известный промежуток времени, проявляют на него негативные реакции. Риск - это количественный показатель, что позволяет использовать его в оценке здоровья населения и при экономических расчетах для планирования оздоровительных мероприятий.
Принципиальное значение в применении методики оценки риска имеет тот факт, что оценка риска может быть сориентирована не на всю заболеваемость или смертность, а только на конкретный и измеряемый, а значит и управляемый фактор среды обитания человека, вызывающий конкретную патологию. Это позволяет работать более целенаправленно и продуктивно. Проведение такой работы, в свою очередь, невозможно без наличия баз данных по количественным и качественным характеристикам факторов среды обитания, а также по заболеваемости и смертности населения. Такой базой данных является Федеральный информационный фонд социально-гигиенического мониторинга. С помощью системы оценки риска, основанной на данных социально-гигиенического мониторинга, можно получать качественные и количественные характеристики влияния конкретного фактора (или ряда факторов) на здоровье задолго до того, как проявятся последствия этого влияния. Т.е. есть возможность прогнозировать результат такого воздействия, принимать управленческие решения с учетом возможного экономического ущерба.
Методология оценки риска здоровью существенно отличается от существующего гигиенического нормирования тем, что она базируется на конкретных показателях качества окружающей среды, а не указывает "порог допустимых концентраций", кроме того, она позволяет определить достоверно, сколько людей подвергнутся отрицательному воздействию фактора, через какое время наступит это воздействие и чем оно будет характеризоваться.
Сравнивая риск здоровью отдельных районов, регионов, можно формировать решения по оздоровлению ситуации. Кроме того, эта методология позволяет вплотную подойти к оценке стоимости здоровья, стоимости ущерба здоровью. Это является чрезвычайно актуальным в современных условиях экономического развития России [1, 2].
Здоровье населения (или общественное здоровье) характеризует здоровье популяции как целостного организма и измеряется системой статистических показателей, включающих:
- медико-демографические показатели - рождаемость, смертность (общая, перинатальная, младенческая, по отдельным причинам, повозрастная), естественный прирост, продолжительность жизни;
- заболеваемость - общая, по отдельным классам, болезням, группам населения;
- физическое развитие;
- инвалидизацию.
Медико-демографические показатели наиболее полно характеризуют состояние общественного здоровья, поскольку отражают степень исчерпанности жизнеспособности организма и весь диапазон воздействующих на население факторов социально-экономического, наследственного, природно-климатического и экологического генеза.
В ряду медико-демографических показателей показатели смертности и продолжительности жизни населения являются наиболее объективными критериями, несущими емкую информацию о состоянии и тенденциях изменения общественного здоровья. Статистические данные о смертности населения собираются органами государственной статистики на протяжении длительного времени путем обязательной и полной регистрации актов гражданского состояния и являются наиболее достоверными. Поэтому целесообразно использовать эти показатели на начальных этапах изучения состояния здоровья населения.
Первичные данные о смертности населения сводятся в формы (таблицы) статистической отчетности за очередной год, которые формируются на уровне области (республики, края) и крупных городов, откуда поступают в центральные органы статистики страны (Госкомстат РФ и ГВЦ Госкомстата РФ). Вычисленные на основании статистических данных основные показатели смертности и продолжительности жизни населения публикуются в справочниках по статистике населения, поставляются в международные организации (ООН, ВОЗ). В последние десятилетия такой показатель, как ожидаемая продолжительность жизни, стал рассматриваться как очень важный индикатор качества жизни и социального благополучия страны.
Сопоставимость и достоверность научных и практических результатов анализа смертности и продолжительности жизни населения обеспечивается в данной работе применением определенного набора методов расчета и анализа. Его основу составляет система показателей смертности населения и техника их количественного оценивания, которая тесно связана с теорией демографии и статистики. В Рекомендациях используется математический аппарат для исследования общей интенсивности смертности и от отдельных причин, а также возрастной относительной смертности от отдельных причин. Предусмотрено сравнение получаемой непараметрической модели общей интенсивности смертности с общепринятой моделью Гомперца - Мейкема, которая, как признается многими авторами, лучше большинства других известных формул описывает общебиологические тенденции в отношении смертности населения [3].
В традиционных методиках анализа повозрастной смертности населения используются периодные таблицы, основанные на вычислении коэффициентов смертности по данным, сгруппированным, как правило, по пятилетним интервалам. Получаемые при этом результаты усредняют как случайные, так и закономерные детали и отражают лишь основную тенденцию, мало отклоняясь от модели Гомперца - Мейкема при анализе смертности. В то же время при исследовании состояния здоровья населения важную информацию несут локальные закономерные отклонения от модели Гомперца - Мейкема, связанные с действиями факторов среды обитания, увеличивающими или снижающими риск летального исхода для людей определенного возраста. Механизмы появления указанных отклонений уточняются при проведении раздельного анализа смертности от определенных причин. Решение поставленной задачи с помощью традиционной схемы вычисления таблиц смертности имеет недостатки, связанные с ограничением объема статистического материала для небольших территорий. Точность предлагаемой методики повышается с увеличением объема исходных данных. Приемлемая для практического применения точность достигается при исследовании популяции объемом 100000 человек и более. Для населенных пунктов с меньшим населением достаточный объем информации достигается объединением данных за ряд лет. Целесообразно использовать в вычислениях регистры смертности (базы первичных персонифицированных данных) для обеспечения последующего более детального анализа.
Получаемые характеристики повозрастного риска для исследуемой популяции могут быть сопоставлены с аналогичными характеристиками той же популяции для других периодов времени либо с характеристиками популяций других территорий.
Поскольку для рекомендуемых расчетов использован достаточно сложный математический аппарат, Методические рекомендации сопровождаются прикладной программой, руководством пользователя, а также кратким математическим обоснованием применяемых методов исследования и конкретными примерами их использования.
Работа имеет следующую структуру:
В разделе 1 даются определения статистических показателей смертности, имеющих отношение к предлагаемой методике.
В разделе 2 описаны требования к процедуре сбора данных.
В разделе 3 приводится практический пример исследования некоторых повозрастных показателей смертности на фактическом материале. Результатом здесь являются графики аппроксимирующих функций повозрастных показателей смертности.
В разделе 4 излагается алгоритм аппроксимации повозрастных характеристик с такой степенью подробности, чтобы он мог быть реализован при помощи стандартных программных средств статистической обработки данных либо как прикладная программа. Этот материал предназначен для математиков-программистов, занимающихся разработкой и сопровождением программного обеспечения в учреждениях госсанэпиднадзора.
В Приложении 1 даны таблицы с исходными данными, использованными в приведенном практическом примере, как возможный образец оформления и как исходный материал для тестирования программы обработки данных.
В Приложении 2 даны значения аппроксимирующих функций из практического примера в табличном представлении. Они по содержанию дублируют графики и могут быть также использованы для тестирования программы обработки данных.
В Приложении 3 дано руководство пользователя для прикладной программы аппроксимации повозрастных показателей здоровья населения.
В Приложении 4 приводится глоссарий некоторых терминов, использованных в Рекомендациях.
Разработка теоретических положений предлагаемой методики выполнялась при поддержке Российского фонда фундаментальных исследований, грант 97-06-80128.
1. Основные понятия и термины
1.1. Повозрастные показатели смертности
В данном разделе даны определения основных понятий. Следует иметь в виду, что математические формулировки, при помощи которых даются определения, как правило, не могут служить непосредственно для вычислений. Они описывают изучаемые явления, но для получения оценок соответствующих показателей, т.е. их приближенных значений по статистическим данным, требуются специальные алгоритмы, изложенные в последующих разделах.
Интенсивность смертности характеризует риск смерти, связанный с возрастом. Численно она равна вероятности того, что индивидуум, доживший до определенного возраста а, умрет в течение малого интервала времени ДЕЛЬТА а, отнесенной к величине этого интервала. Более строго в математических терминах интенсивность смертности определяется как условная плотность вероятности умереть в заданном возрасте а при условии, что человек дожил до данного возраста. Это можно записать в виде [4]:
n (а, а + ДЕЛЬТА а)
d
лямбда(а) = lim -------------------, (1)
ДЕЛЬТА а->0 ДЕЛЬТА а х n (а)
l
где: n (а, а + ДЕЛЬТА а) - количество сверстников из когорты
d
умирающих в возрастном интервале (а, а + ДЕЛЬТА а); n (а) -
l
количество сверстников, доживших до возраста а; ДЕЛЬТА а - малый
интервал возраста. Таким образом для индивидуума, дожившего до
возраста а, вероятность смерти в течение малого интервала времени
ДЕЛЬТА а равна произведению значения функции лямбда(а) на ширину
этого интервала, то есть чем больше лямбда(а), тем выше названная
вероятность.
При детализированном изучении смертности выделяют отдельные
причины или группы причин смерти. Далее символом s будет
обозначаться некоторая конкретная причина смерти, например s
может быть смертью от болезней сердечно-сосудистой системы, от
травм и т.д. Интенсивность смертности от причины s есть
вероятность смерти индивидуума, дожившего до возраста а, в
течение интервала времени ДЕЛЬТА а именно от причины s, и эта
вероятность также делится на ДЕЛЬТА а. Более строго в
математических терминах интенсивность смертности от причины s
представляет собой характеристику вида:
n (а, а + ДЕЛЬТА а)
ds
лямбда (а) = lim --------------------, (2)
s ДЕЛЬТА а->0 ДЕЛЬТА а х n (а)
l
где: n (а, а + ДЕЛЬТА а) - количество сверстников, умирающих
ds
только от причины s в возрастном интервале (а, а + ДЕЛЬТА а).
Таким образом, вероятность смерти от причины s в некотором
возрасте за интервал времени ДЕЛЬТА а тем выше, чем больше
лямбда (а).
s
Сопоставление рисков смерти от различных причин позволяет
выявлять те причины смерти, которые приводят к наибольшим или
наименьшим потерям в определенном возрасте. Такое сопоставление
заключается в определении доли, которую составляет смертность от
причины s в смертности от всех причин для некоторого заданного
возраста а. Эту интересующую нас величину лямбда (а) / лямбда(а)
s
будем далее называть повозрастной относительной смертностью и
обозначать Р (а). Иначе повозрастную относительную смертность
s
можно понимать как вероятность того, что в случае смерти жителя
в возрасте а причиной смерти будет именно причина s. Это следует
из (1) и (2), т.к.:
лямбда (а)
s
Р (а) = ---------- =
s лямбда(а)
n (а, а + ДЕЛЬТА а)
ds
= lim --------------------, (3)
ДЕЛЬТА а->0 n (а, а + ДЕЛЬТА а)
d
где повозрастная относительная смертность оказывается равной
отношению количества умерших от причины s к количеству умерших от
всех причин в возрастном интервале (а, а + ДЕЛЬТА а) малой
величины ДЕЛЬТА а.
Важнейшим интегральным показателем состояния здоровья
_
населения является средняя продолжительность жизни А индивидуумов
изучаемой популяции. Эта характеристика определяется как
математическое ожидание возраста умерших. В периодных
исследованиях средняя продолжительность жизни определяется через
функцию интенсивности смертности [4] для текущего состояния
популяции, поэтому ее еще называют средней ожидаемой
продолжительностью жизни.
1.2. Функциональная аппроксимация
повозрастных показателей смертности
Рассмотренные определения (1) - (3) отражают детерминистически
определенные объективные законы существования популяции, но
проявляются эти законы как процессы со случайными реализациями.
Поэтому задачей функциональной аппроксимации является построение
по фактическим данным таких зависимостей (аппроксимирующих функций
или, иначе, оценок) лямбда*(а), лямбда*(а), Р*(а), которые
s s
приближенно, с определенной точностью, описывают (аппроксимируют,
оценивают) соответственно истинные закономерности лямбда(а),
лямбда (а), Р (а). При этом погрешность приближения зависит от
s s
точности метода аппроксимации, объема фактических данных, степени
искажения данных путем их группирования и т.д.
Задачей периодных исследований является построение оценок
повозрастных характеристик (1) - (3) на основе данных наблюдений
за популяцией за некоторый, сравнительно небольшой по сравнению с
продолжительностью человеческой жизни, период. Данными для
периодных исследований являются результаты подсчета количества
умерших в возрастных интервалах и распределение количества жителей
по возрастным интервалам на некоторый момент времени. Следует
заметить, что определения (1) - (3) даются как характеристики
когорты и поэтому не могут быть непосредственно использованы для
расчетных формул в периодных исследованиях. Однако благодаря
существованию определенной взаимозависимости оказывается возможным
выразить когортные характеристики (1) - (3) через статистические
характеристики популяции, оцениваемые по данным периодных
исследований.
Традиционно в периодных исследованиях используется метод
таблиц смертности [7]. В этом методе вычисляются коэффициенты
смертности:
d
m
i
М = --------------,
i p
m x ДЕЛЬТА а
i i
d
где: ДЕЛЬТА а - возрастной интервал; m - количество умерших
i i
p
в этом возрастном интервале за весь период наблюдений; m -
i
количество жителей на середину периода наблюдений, возраст которых
попадает в тот же интервал. Коэффициенты смертности являются
локальными оценками интенсивности смертности и при нанесении на
график дают кривую, аппроксимирующую функцию лямбда(а).
Как уже упоминалось, выбор ширины возрастных интервалов в
значительной степени влияет на точность аппроксимации
интенсивности смертности [3]. Кроме того, ошибки, вызванные
флуктуациями попадания возраста в интервалы, имеют несимметричное
распределение. Действительно, оценки интенсивности смертности,
выражаемые через коэффициенты смертности, могут принимать сколь
угодно большое положительное значение при малом значении
ДЕЛЬТА а , но не могут быть отрицательными. Это означает, что при
i
сглаживании локальных оценок интенсивность смертности будет в
среднем завышаться.
Для аппроксимации интенсивности смертности и повозрастной относительной смертности предлагается использовать единый математический аппарат, который основан на положениях теории оценивания статистических законов [3, 6]. Поэтому далее под термином целевая величина будет пониматься любая из исследуемых величин (1) - (3). Подход, предлагаемый в данных Рекомендациях, предусматривает два основных этапа в процедуре аппроксимации целевой величины. На первом этапе вычисляются локальные оценки преобразованной целевой величины, причем преобразование осуществляется таким образом, чтобы ошибки этих оценок были аддитивными и имели полностью определенные статистические свойства. На втором этапе из заданного множества полиномиальных функций выбирается оптимальная аппроксимирующая функция в соответствии с критерием, который обеспечивает ее близость к истинной (реально существующей) преобразованной целевой величине. Таким образом, отличительной особенностью рассматриваемого подхода является оптимизация выбора (минимизация ошибки) аппроксимирующей функции. Краткое математическое обоснование метода и соответствующий вычислительный алгоритм приводятся в разделе 4.
Конечным результатом двухэтапной процедуры являются аппроксимирующая функция интенсивности смертности:
k
m k-1
лямбда*(а) = exp(b + SUM b а )
1 k=2 k
и аппроксимирующая функция повозрастной относительной
смертности:
k
m k-1
exp(b + SUM b а )
1 k=2 k
Р*(а) = -------------------------,
s k
m k-1
1 + exp(b + SUM b а )
1 k=2 k
в которых коэффициенты b определены методом наименьших
k
квадратов по выборке локальных оценок преобразованной целевой
величины, а степень полинома выбрана в соответствии с критерием
аппроксимации.
Параметрическая аппроксимация интенсивности смертности
оказывается полезной при сравнении параметров моделей, полученных
для разных популяций [4]. Поэтому методикой предлагается
оценивание параметров R и альфа модели Гомперца:
лямбда (а) = R х exp(альфа х а)
G
и параметров А, R и альфа модели Гомперца - Мейкема:
лямбда (а) = А + R х exp(альфа х а)

по локальным оценкам логарифма интенсивности смертности,
рассматриваемым ниже. Это обеспечивает несмещенность
соответствующих аппроксимирующих функций лямбда*(а) и лямбда* (а)
G GM
по сравнению с функциями, получаемыми по коэффициентам
смертности из таблиц смертности.
2. Подготовка данных
2.1. Выбор ширины возрастных интервалов группирования
Подход функциональной аппроксимации требует минимально возможного предварительного искажения исходных данных. Так как для взрослого населения официально регистрируется количество полных прожитых лет, то следует группировать данные по одногодичным интервалам. При таком группировании в малых населенных пунктах будут существовать возрастные интервалы, в которые не попадает ни одного случая смерти или возраста жителей. Предполагается, что все интервалы являются закрытыми, включая последний интервал с ненулевым количеством попаданий, т.е. для каждого интервала известны и левая и правая граница. Допустимо использовать данные, группированные по более широким возрастным интервалам, но в этом случае детали изменения повозрастных характеристик, соизмеримые с шириной интервалов, будут излишне сглажены.
2.2. Подготовка данных об умерших за период наблюдения
Данные об умерших регистрируются в журналах городского бюро
ЗАГС. Числа умерших суммируются по соответствующим возрастным
интервалам за период наблюдений (t , t ), где: t - начало и t -
l r l r
конец этого периода. Для анализа смертности по отдельным причинам
необходимо составить таблицы количества умерших по возрастным
интервалам от каждой причины в отдельности.
Для анализа повозрастной относительной смертности требуется
_
сформировать таблицы умерших от причины s и умерших от причины s.
_
В таблицу умерших от причины s заносятся группированные данные о
возрасте умерших от любой причины, кроме причины s. Если
подготовлены таблицы данных об умерших от причины s и умерших от
всех причин, то вычитание в каждом возрастном интервале из
количества умерших от всех причин количества умерших от причины s
_
дает значение для таблицы умерших от причины s.
2.3. Подготовка данных о возрастном составе жителей
Таблица объединенных данных о возрастном составе жителей
формируется следующим образом. Период наблюдения (t , t )
l r
разбивается на n равных временных интервалов, середины которых
I
приходятся на моменты времени t ,... t . Методикой
l n
I
предполагается, что временные интервалы выбираются как можно уже.
Так как для пересчета возрастного состава населения органами
статистики используются данные за год, то минимально возможная
ширина временных интервалов разбиения периода наблюдений
составляет 1 год.
Для каждого i-го временного интервала составляется таблица
распределения возраста живущих на момент t . Данные о населении
i
для временных интервалов, не приходящиеся на год переписи
населения, оцениваются путем передвижки переписных данных с учетом
миграции и естественного движения населения. Полученные числа в
одних и тех же возрастных интервалах суммируются. Результатом
является единая таблица объединенных данных о возрастном составе
населения.
В частном случае период наблюдений может не разбиваться на
отдельные временные интервалы, т.е. n равняется 1. Тогда
I
используются данные о возрастном составе населения на середину
периода наблюдений. Однако в этом случае оценка функции
интенсивности смертности может быть значительно искажена, если
возрастной состав населения от начала к концу периода наблюдения
претерпевает серьезные изменения.
3. Пример проведения анализа повозрастных
показателей популяции на фактических данных
3.1. Исходные данные
Выполнение анализа интенсивности смертности рассматривается на примере обработки данных о смертности в г. Владимире за период с 1989 г. по 1993 г., которые содержали повозрастное количество всех умерших за указанный период и, отдельно, умерших от следующих причин: болезни кровеносной системы, новообразования, травмы и несчастные случаи, болезни органов дыхания. Заметим, что анализируемые отдельные причины охватывают не всех умерших. В таблицах 1 и 2 дается образец подготовки данных об умерших, а в таблице 3 о возрастном составе населения за указанный период. В проведенных исследованиях период наблюдения был разделен на пять одногодичных временных интервалов, поэтому в табл. 3 каждое число, соответствующее определенному возрастному интервалу, является суммой количества жителей, имевших соответствующий возраст в 1989, 1990, 1991, 1992 и 1993 гг.
3.2. Анализ интенсивности смертности
В соответствии с рассмотренным алгоритмом аппроксимации были получены функции, аппроксимирующие интенсивность смертности от всех причин и по отдельным группам болезней. На рис. 1 - 10 <*> показаны графики аппроксимирующих функций интенсивности смертности от всех причин и по рассмотренным группам болезней для мужчин и женщин. Образец табличного представления аппроксимирующей функции дается табл. 4 и 5. Для иллюстрации изучаемых изменений графики 1 - 10 изображены в логарифмическом масштабе, т.е. ось абсцисс имеет линейный масштаб, а ось ординат - логарифмический. В масштабе, линейном по оси ординат, изучаемые относительные изменения зависимостей так растут с ростом изучаемой величины, что невозможно отобразить на одном графике, результаты аппроксимации величины в областях ее малых и больших значений. Заметим также, что экспоненциальная кривая, визуально плохо отличимая по форме от других монотонно круто изгибающихся кривых, превращается в полулогарифмическом масштабе в легко опознаваемую прямую.
------------------------------------
<*> Рисунки не приводятся.
Обрыв слева на графиках изображенных кривых означает отсутствие соответствующих событий среди членов популяции от рождения до первого реализовавшегося события, необходимых для вычисления оценок изучаемых зависимостей.
Рассмотрение графиков позволяет сделать следующие выводы. Кривая интенсивности смертности от всех причин имеет максимум на моменте рождения. Затем она снижается примерно экспоненциально до возраста около 10 лет. Предполагается [5], что это происходит в связи с процессами адаптации детей к жизненным условиям и вымиранием родившихся с генетическими ошибками. Пройдя через минимум, кривая образует относительно крутой подъем, который можно связать с увеличивающимися в этом возрасте влиянием травм и других вредных воздействий, в том числе специфически свойственным современной жизни. Далее рассматриваемая кривая асимптотически приближается к экспоненте (в полулогарифмическом масштабе она выглядит как прямая), проявляя закономерность, уже отмечавшуюся феноменологически для больших возрастов Гомперцом и его последователями [4]. Средняя ожидаемая продолжительность жизни, рассчитанная по полученным интенсивностям смертности от всех причин, составляет 65,3 лет для мужчин и 75,5 лет для женщин.
Из приведенных графиков видно, что смертность от болезней кровеносной системы растет монотонно в старших возрастах. Люди, не умершие от других причин, неизбежно умирают от сердечно-сосудистых болезней. Это означает, что борьба с такими болезнями продлит человеческую жизнь, но не снизит существенно их относительную роль среди других причин смерти (если, разумеется, не ослаблять принимаемых мер борьбы с ними).
Смертность от новообразований достигает максимума при 80 годах, после чего она может даже снижаться. Интенсивность смертности от травм и несчастных случаев у мужчин достигает максимума приблизительно к 40 годам и после этого мало изменяется с возрастом. Интенсивность смертности от болезней органов дыхания имеет минимум в возрасте около 15 лет у мужчин и 20 лет у женщин, а с увеличением возраста растет так же, как интенсивность смертности от всех причин.
3.3. Анализ повозрастной относительной смертности
По исходным данным в соответствии с описанным алгоритмом оценивались функции повозрастной относительной смертности от заданных групп болезней. На рис. 11 - 18 показаны графики аппроксимации относительной смертности от различных болезней (относительных долей от всех случаев смерти) для мужчин и для женщин. Анализ графиков позволяет сделать следующие выводы.
У мужчин в возрасте до 5 лет максимальную опасность представляют болезни органов дыхания. С 5 до 45 лет наибольшую опасность представляют травмы и несчастные случаи, которые составляют до 75% всех летальных исходов. После 45 лет наибольшая вероятность смерти соответствует болезням кровеносной системы, причем эта вероятность монотонно растет с возрастом. Максимум относительной смертности мужчин от новообразований приходится на 60 лет.
Изучение интенсивности смертности и повозрастной относительной смертности позволяет выявлять аномальные отклонения от общего характера изменения соответствующих показателей риска для последующего более детального анализа. Так, например, в возрасте, близком к 8 - 10 годам, у мужчин наблюдается локальное повышение смертности от новообразований. Новообразования представляют в этом возрасте наибольшую, после травм, опасность. Величина экстремума повозрастной относительной смертности в этом случае достигает 9%. Изучение первичных данных, по которым выполнялся анализ повозрастных рисков, показывает, что в г. Владимире за период 1989 - 1993 гг. было зарегистрировано 7 случаев смерти от рака в возрасте от 5 до 14 лет. Из них 4 случая - рак крови и кроветворной системы и 3 - от других различных новообразований. В том же возрастном интервале в 1994 - 1998 гг. было зарегистрировано 4 случая смерти от новообразований, из которых 3 случая - рак крови и кроветворной системы. Эти данные свидетельствуют о стабильности аномалии смертности от рака крови в рассмотренном возрастном интервале.
У женщин в возрасте до 5 лет основная опасность смерти связана с болезнями органов дыхания. С 5 до 38 лет наиболее часты случаи смерти от травм и несчастных случаев, достигая максимума 60% от всех смертей в 17 лет. С 38 до 55 лет наибольшая вероятность смерти соответствует новообразованиям с максимумом 40% в возрасте 48 лет. После 55 лет оказывается наибольшей по сравнению с другими болезнями и монотонно растет с возрастом доля смертей от болезней кровеносной системы.
4. Краткое математическое обоснование
и алгоритм аппроксимации повозрастных показателей
4.1. Выражение повозрастных показателей через плотности
вероятности возраста умерших за период наблюдений
Рассмотрим случай, когда доступны данные за некоторый период
наблюдений (t , t ). Тогда определения повозрастных показателей
l r
(1), (2), (3), выражаемые через характеристики когорты, не могут
быть использованы непосредственно. Интенсивность смертности
выражается через периодные характеристики популяции следующим
образом:
p
n (t , t ) x f (а, t , t )
d l r d l r
лямбда(а) = --------------------------, (4)
t
r p
интеграл n (t) x f (а|t)dt
t l l
l
p
где: n (t , t ) - количество умерших от всех причин за период
d l r
(t , t ); f (а, t , t ) - плотность распределения вероятности
l r d l r p
возраста умерших за тот же период; n (t) - количество жителей в
l
популяции в момент времени t принадлежит (t , t ); f (а|t) -
l r l
плотность распределения возраста жителей в популяции на момент
p p
времени t. В рассматриваемых обозначениях n , n , f , f
d l d l
подстрочные символы d и l указываются для величин, относящихся,
соответственно, к выборке возраста умерших и к выборке возраста
жителей популяции, а надстрочный символ p обозначает
характеристики популяции и служит для их отличия от характеристик
когорты.
Формула (4) является исходной для традиционного метода
построения оценки интенсивности смертности через коэффициенты
смертности. В этом методе знаменатель формулы (4) заменяется
p
выражением (t - t ) x n (t ) x f (а|t ), где t - середина
r l l m l m m
периода наблюдения, тогда:
p
n (t , t ) x f (а, t , t )
d l r d l r
лямбда(а) ~= -----------------------------. (5)
p
(t - t ) x n (t ) x f (а|t )
r l l m l m
В числитель и знаменатель выражения (5) входят две функции
плотности вероятности f (а, t , t ) и f (а|t ), которые должны
d l r l m
быть оценены по результатам наблюдений. Коэффициенты смертности
в традиционном методе таблиц смертности представляют собой
отношение гистограммных оценок плотности вероятности возраста
умерших и возраста жителей, вычисляемых на одних и тех же
возрастных интервалах [4]. Это приводит к известным недостаткам
при анализе данных, полученных на небольших популяциях.
Переход от (4) к (5) не приводит к большим ошибкам в том
случае, когда распределение жителей по возрастам на начало и конец
периода наблюдения мало изменяется либо изменяется линейно. При
исследовании же относительно небольших популяций недостаток данных
восполняется увеличением периода наблюдений, и тогда рассмотренная
замена числителя в (4) может привести к значительному искажению
оценки интенсивности смертности. Поэтому рассмотрим разбиение
периода наблюдений (t , t ) на n равных интервалов шириной
l r l _____
ДЕЛЬТА t. Пусть t - середина i-го интервала, i = 1, n . Если
i I
ДЕЛЬТА t достаточно мало, то количество жителей в популяции и
плотность распределения вероятности их возраста мало изменяется в
_____
пределах (t - ДЕЛЬТА t / 2, t + ДЕЛЬТА t / 2), i = 1, n . Тогда:
i i I
p
n (t , t ) x f (а, t , t ) х n
d l r d l r I
лямбда(а) ~= ------------------------------------, (6)
p
n x f (а, t , t ) x (t - t )
lSUM lSUM l r r l
где:
n
p r p
n = SUM n (t ),
lSUM i=1 l i
p
n n (t )
I l i
f (а, t , t ) = SUM ------ f(а|t ).
lSUM l r i=1 p i
n
lSUM
Здесь введены обозначения: f (а, t , t ) - плотность
lSUM l r
распределения вероятности возраста, наблюдаемого как смесь из n
I
выборок возраста жителей, причем выборки наблюдаются в моменты
p
времени t ,... t ; n - суммарный объем этих выборок.
l n lSUM
I
Для дальнейшего изложения важным является выражение логарифма
функции интенсивности смертности через логарифм отношения
плотности вероятности возраста умерших к плотности вероятности
возраста жителей:
p
f (а, t , t ) n (t , t ) x n
d l r d l r I
ln лямбда(а) ~= ln(----------------) + ln(-----------------). (7)
f (а, t , t ) p
lSUM l r n x (t - t )
lSUM r l
Аналогичное выражение получается очевидным образом для
интенсивности смертности лямбда s(а) от причины s заменой
f (а, t , t ) на плотность f (а, t , t ) распределения возраста
d l r ds l r
p p
умерших от причины s и n (t , t ) на количество n (t , t )
d l r ds l r
умерших от причины s за весь период наблюдений.
Повозрастная относительная смертность от причины s может
рассматриваться, исходя из определения, как отношение
интенсивности смертности от данной причины к интенсивности
смертности от всех причин в возрасте а:
лямбда (а)
s
Р (а) = ----------.
s лямбда(а)
Тогда из (4) следует, что:
p
n (t , t ) x f (а, t , t )
ds l r ds l r
Р (а) = ----------------------------, (8)
s p
n (t , t ) x f (а, t , t )
d l r d l r
p
где: n (t , t ) - количество умерших от причины s за весь
ds l r
период наблюдений; f (а, t , t ) - плотность распределения
ds l r
вероятности возраста умерших от причины s за период наблюдения.
_
Введем в рассмотрение причину смерти s, которая соответствует
смерти от любой причины, отличающейся от причины s. Найдем логит
функции Р (а), используя определение logit P (а) = ln(Р (а) / (1 -
s s s
Р (а))). Применяя теорему Байеса, из (8) получаем:
s
p
f (а, t , t ) n (t , t )
ds l r ds l r
logit Р (а) = ln(--------------) + ln(------------), (9)
s f _(а, t , t ) p
ds l r n _ (t , t )
ds l r
где: f _(а, t , t ) - плотность распределения вероятности
ds l r
p
возраста умерших от причины s; n _(t , t ) - количество
_ ds l r
умерших от причины s за период (t , t ). В данном случае важно,
l r
что логит повозрастной относительной смертности выражается через
логарифм отношения плотности вероятности возраста умерших от
_
причины s к плотности вероятности возраста умерших от причины s.
4.2. Аппроксимация повозрастных показателей
Отличие рассматриваемой методики состоит в том, что вместо
гистограммного подхода, лежащего в основе традиционного метода
расчета коэффициентов смертности и оценки интенсивности
смертности, реализуется подход функциональной аппроксимации
повозрастных показателей с использованием прямых наблюдений
логарифма плотности вероятности [5], [6].
Предварительно укажем основные предпосылки методики
оценивания. В распоряжении исследователя имеются выборки
реализаций следующих случайных величин: возраст умерших от всех
причин, возраст умерших от причины s, возраст умерших от причины
_
s, возраст жителей. Как было показано авторами данной методики
в [5] и [6], из исходной выборки реализаций случайной величины
можно сформировать выборку так называемых прямых наблюдений
логарифма соответствующей функции плотности. Прямые наблюдения
логарифма плотности имеют в качестве своего математического
ожидания логарифм плотности вероятности, порождающей исходную
выборку, и содержат аддитивные ошибки с априори известными
статистическими свойствами, которые не зависят от исходного закона
распределения.
Как следует из (7) и (9), логарифм интенсивности смертности и
логит повозрастной относительной смертности определяются
логарифмом отношения двух функций плотности вероятности или,
иначе, разностью логарифмов двух плотностей. Поэтому разность
прямого наблюдения логарифма плотности возраста умерших и прямого
наблюдения логарифма плотности возраста жителей даст прямое
наблюдение логарифма интенсивности смертности с точностью до
константы. Аналогичным образом разность прямого наблюдения
логарифма плотности возраста умерших от причины s и прямого
_
наблюдения логарифма плотности возраста умерших от причины s даст
прямое наблюдение логита повозрастной относительной смертности с
точностью до константы. Получаемые прямые наблюдения могут
рассматриваться так, как если бы интенсивность смертности (или
логит повозрастной относительной смертности) непосредственно
измерялась со случайными ошибками, для которых априори известны
статистические свойства. Далее логарифм интенсивности смертности и
логит повозрастной относительной смертности будут обобщено
называться преобразованными целевыми функциями.
Процедура оценивания функции интенсивности смертности (логита повозрастной относительной смертности) состоит из двух основных шагов. На первом шаге формируются прямые наблюдения преобразованной целевой функции. На втором шаге по выборке прямых наблюдений генерируются регрессионные оценки из определенного класса функций, например алгебраических полиномов. В соответствии с критерием аппроксимации из полученного множества выбирается оптимальная аппроксимирующая функция. Полученная функция аппроксимирует преобразованную целевую функцию, а ее обратное преобразование дает непосредственное приближение к целевой функции. Для логарифма интенсивности смертности обратным преобразованием является потенцирование, а для логита повозрастной относительной смертности используется преобразование, обратное логиту: ant logit(у) = exp(у) / (1 + exp(у)).
Повышение точности построения оценок повозрастных характеристик в данной схеме по сравнению с традиционным методом таблиц смертности достигается за счет исключения субъективного выбора степени сглаживания.
Теперь рассмотрим алгоритм оценивания повозрастных показателей более подробно. Как следует из выражений (7) и (9), логарифм интенсивности смертности и логит повозрастной относительной смертности выражаются через логарифм отношения двух функций плотности и константу, что в общем виде может быть записано как:
f (а)
u
g(а) = ln----- + С = ln f (а) - ln f (а) + С , (10)
f (а) uv u v uv
v
где:
g(а) = ln лямбда(а),
f (а) = f (а, t , t ),
u d l r
f (а) = f (а, t , t ),
v lSUM l r
p
n (t , t ) x n
d l r l
C = ln(-----------------),
uv p
n x (t - t )
lSUM r l
если целевой функцией является интенсивность смертности, и:
g(а) = logitP (а),
s
f (а) = f (а, t , t ),
u ds l r
f (а) = f _(а, t , t ),
v ds l r
p
n (t , t )
ds l r
C = ln(-----------),
uv p
n _(t , t )
ds l r
если целевой функцией является логит повозрастной относительной
смертности.
Далее будет использоваться обозначение случайных величин U и
V, по реализациям которых необходимо аппроксимировать целевую
функцию. Так, если целевой функцией является интенсивность
смертности, то величина U есть возраст умерших, а величина V есть
возраст жителей. Если же целевой функцией является повозрастная
относительная смертность, то величина U есть возраст умерших от
_
причины s и величина V есть возраст умерших от причины s. Исходная
задача аппроксимации целевой функции сводится к задаче
аппроксимации преобразованной целевой функции. При этом
преобразованная целевая функция должна оцениваться как логарифм
отношения двух функций плотности распределения по результатам
наблюдений соответствующих случайных величин U и V.
В работах [3], [5] предложен способ формирования прямых наблюдений логарифма плотности из выборки реализаций случайной величины. Из (10) следует, что прямые наблюдения функции g(а) можно формировать как разности прямых наблюдений логарифма плотности величины U и величины V. Так как ошибки прямых наблюдений логарифма плотности являются аддитивными и их статистические свойства известны, то ошибки прямых наблюдений функции g(а) будут аддитивными, а их статистические свойства будут определены через свойства прямых наблюдений плотностей.
Алгоритм аппроксимации состоит из следующих шагов:
1) Преобразование исходных группированных по возрастным интервалам данных в округленные значения возраста для каждой из величин U и V.
2) Формирование прямых наблюдений функции g(а) по прямым наблюдениям логарифма плотности распределения величины U и величины V.
3) Построение множества моделей (аппроксимирующих функций) по выборке прямых наблюдений преобразованной целевой функции и выбор модели оптимальной сложности.
4) Обратное преобразование оптимальной аппроксимирующей функции.
Преобразование группированных данных в округленные данные. Исходные группированные данные заменяются округленными данными. Для этого количество случаев попадания в возрастной интервал приписывается середине интервала, причем интервалы, в которые не попало ни одного случая, опускаются. В результате имеем две выборки реализаций случайных величин:
n n
u u u v v v
Q = {(а , m )} , Q = {(а , m )} , (11)
u i i i=1 v i i i=1
u v
где: а , а - значения округленных реализаций величин U и V
i i
u v
соответственно; m , m - количество повторений совпадающих
i i
реализаций; n , n - количество различающихся значений каждой
u v
случайной величины.
Формирование прямых наблюдений логарифма плотности величин U и
V. Для каждой случайной величины формируются прямые наблюдения
логарифма плотности вероятности на интервалах между
последовательными упорядоченными значениями. Так, для величины U
имеем [6]:
u u
мю + 1 exp(ПСИ(мю ) - ПСИ(n ))
u i i uSUM
y = ln(------- х --------------------------),
i u u u
2мю а - а
i i+1 i
_________
i = 1, n - 1, (12)
u
n
u u u u u
где: мю = m + m - 1; n = SUM m - общее количество
i i i+1 uSUM i=1 i
реализаций случайной величины до группирования; ПСИ(.) -
пси-функция Эйлера (дигамма-функция), которая для целочисленного
аргумента определяется формулой:
n-1 1
ПСИ(n) = -C + SUM -
k=1 k
с постоянной Эйлера С ~= 0,577215.
u
Дисперсия ошибки, входящей в прямое наблюдение y , есть
u2 i
сигма [6]:
i
u2 u
сигма = ПСИ"(мю ) - ПСИ"(n + 1),
i i uSUM
где ПСИ"(.) - производная пси-функция Эйлера (тригамма-
функция), которая для целочисленного аргумента определяется
выражением:
2
пи n-1 1
ПСИ"(n) = --- - SUM --.
6 k=1 2
k
Аргумент прямого наблюдения логарифма функции плотности
принимается равным середине интервала между последовательными
ru u u
значениями, а = (а + а ) / 2. В результате имеем выборку
i i i+1
прямых наблюдений логарифма функции плотности для величины U:
n
ru u u2 u-1
R = {(а , y , сигма )} . (13)
u i i i i=1
Аналогичным образом из выборки Q формируется выборка прямых
v
наблюдений логарифма плотности величины V:
n
rv v v v-1
R = {(а , y , сигма )} . (14)
v i i i i=1
Формирование прямых наблюдений преобразованной целевой
функции. В основе формирования прямых наблюдений преобразованной
целевой функции лежит предположение, что в пределах любого
u u v v
интервала (а , а ) или (а , а ) между последовательными
i i+1 j j+1
наблюдениями случайной величины, изменениями функций f (а) и f (а)
u v
можно пренебречь. Тогда прямые наблюдения преобразованной целевой
функции формируются в следующей последовательности. Определяется
v v
интервал (а , а ) между последовательными значениями величины V,
j j+1 ru
в который попадает значение аргумента а прямого наблюдения из
i
из выборки R . Разность соответствующих прямых наблюдений
u
логарифма функций плотности с учетом константы С дает прямое
uv
ru
наблюдение преобразованной целевой функции в точке а . Эта
i
_________
процедура повторяется для всех i = 1, n - 1. Аналогичным образом
u
_________ u u
для всех j = 1, n - 1 определяется интервал (а , а ), в который
v i i+1
rv
попадает значение аргумента а , и также вычисляется прямое
j
наблюдение преобразованной целевой функции. Возможно возникновение
ситуации, в которой имеются два сформированных наблюдения, для
ru v v rv
которых одновременно выполняется а принадлежит (а , а ) и а
i j j+1 j
u u
принадлежит (а , а ). Тогда следует оставить одно наблюдение,
i i+1 ru rv
для которого принимается аргумент посередине между а и а .
r i j
Таким образом получаем прямые наблюдения y преобразованной
k
r r2
целевой функции в точках а , для которых дисперсии сигма ошибок
k k
u v
определяются через дисперсии ошибок в наблюдениях y и y :
i j
r u v r2 u2 v2
y = y - y + C , сигма = сигма + сигма ,
k i j uv k i j
ru v v
если а принадлежит (а , а )
i j j+1
rv u u
или а принадлежит (а , а ),
j i i+1
-- ru ru v v
¦ а , если а принадлежит (а , а )
¦ i i j j+1
¦ rv u u
¦ и а не принадлежит (а , а ),
¦ j i i+1
¦ rv ru v v
¦ а , если а не принадлежит (а , а )
¦ j i j j+1
r ¦ rv u u
а = { и а принадлежит (а , а ),
k ¦ j i i+1
¦ ru rv ru
¦ (а + а ) / 2, если а принадлежит
¦ i j i
¦ v v rv u u
¦ (а , а ) и а принадлежит (а , а ).
L- j j+1 j i i+1
В результате имеем выборку прямых наблюдений преобразованной
целевой функции объемом n :
r
n
r r r2 r
R = {(а , y , сигма )} . (15)
r k k k k=1
Аппроксимация преобразованной целевой функции. Выборка (15)
прямых наблюдений преобразованной целевой функции является
исходными данными для построения аппроксимирующей функции.
Статистические свойства ошибок прямых наблюдений не зависят от
истинной функции [6] и поэтому являются априорной информацией для
процедуры выбора модели оптимальной сложности. Здесь модель
выбирается из класса алгебраических полиномов вида:
k
m k-1
g*(а) = b + SUM b а , (16)
1 k=2 k
_____
где: коэффициенты b , k = 1, k вычисляются по выборке R
k m r
в соответствии с методом взвешенных наименьших квадратов.
Метод взвешенных наименьших квадратов заключается в том, что
коэффициенты b должны обеспечивать минимум взвешенной (в
k 2
соответствии с дисперсиями наблюдений) суммы квадратов S :
n
2 r r r 2 r2
S = SUM (y - g*(а )) / сигма . (17)
i=1 i i i
Поэтому вектор искомых коэффициентов является решением системы
уравнений:
k n
m r r r r2
{SUM b x SUM ПСИ (а ) ПСИ (а ) / сигма =
k=1 k i=1 k i l i i
n
r r r2 _____
= SUM y ПСИ (а ) / сигма , l = 1, k ,
i=1 i l i i m
k-1
где: ПСИ (а) = 1, ПСИ (а) = а при k > 1.
l k
Из множества полиномов с k = 1, 2,... необходимо выбирать
m
полином g*(а), близкий в некотором функциональном пространстве
к функции g(а). В качестве критерия аппроксимации при известной
дисперсии наблюдений используют критерий Маллоуса [7], который для
случая неравноточных наблюдений может быть записан в виде:
2
С = S - (n - 2k ). (18)
р r m
При различных значениях k вычисляются коэффициенты полинома
m
методом взвешенных наименьших квадратов по выборке R . Для каждого
r
полинома вычисляется значение критерия аппроксимации. Из множества
полиномов в качестве оптимального g* (а) выбирается тот полином,
opt
который обеспечивает минимальное значение критерия аппроксимации
(18).
Обратное преобразование аппроксимирующей функции. Полученная
функция g* (а) аппроксимирует преобразованную целевую функцию,
opt
поэтому функция, аппроксимирующая непосредственно целевую функцию,
получается соответствующим обратным преобразованием. При
исследовании интенсивности смертности, для которой g(а) =
= ln лямбда(а), функция лямбда*(а), аппроксимирующая
непосредственно интенсивность смертности, получается
потенцированием g* (а):
opt
лямбда*(а) = exp(g* (а)).
opt
Если выполняется исследование повозрастной относительной
смертности, то искомая функция Р*(а), аппроксимирующая
s
непосредственно функцию Р (а), получается следующим
s
преобразованием:
exp(g* (а))
opt
Р*(а) = ----------------.
s 1 + exp(g* (а))

ПРИКАЗ Генпрокуратуры РФ от 22.01.2001 n 2 ОБ ИЗМЕНЕНИИ ОРГАНИЗАЦИИ ПРОКУРОРСКОГО НАДЗОРА ЗА ИСПОЛНЕНИЕМ ЗАКОНОВ НА ТРАНСПОРТЕ И В ТАМОЖЕННЫХ ОРГАНАХ И РЕОРГАНИЗАЦИИ ТРАНСПОРТНЫХ ПРОКУРАТУР  »
Постановления и Указы »
Читайте также