УДК 614.73:539 – 623.4
Математическое моделирование зависимости
заболеваемости населения от загрязнения окружающей среды в нефтегазовых
регионах Прикаспия
У.З. Зинуллин
Департамент Комитета Госсанэпиднадзора
Министерства здравоохранения Республики Казахстан по Атырауской области,
Научный центр гигиены и эпидемиологии имени Хамзы Жуматова,
Наиболее представительным, как в научных исследованиях, так и в практическом здравоохранении является метод математического моделирования, позволяющий имитировать реально протекающие процессы, выделять наиболее значимые и оптимальные значения из множества вариантов, количественно отражать взаимосвязь ряда факторов вскрытую качественным анализом, использовать результаты автономных прогнозов о динамике отдельных факторов и выстраивать систему взаимосвязанных моделей.
Основным достоинством метода моделирования является возможность изучения степени изменчивости системы под влиянием отдельных факторов и определение всей полноты взаимосвязи переменных.
Наиболее значимая группа методов математического моделирования – это статистико-вероятностные модели. Они позволяют прогнозировать ту или иную величину (зависимую переменную) на основе изменения факторов (независимых переменных), входящих в модель. Простейшей статистико-вероятностной моделью являются модели (уравнения) парной корреляции, достаточно широко распространенные для оценки различных показателей здравоохранения. Они устанавливают количественную меру взаимосвязи двух факторов между собой.
Значительный интерес представляют факторные модели, описывающие влияние на прогнозируемую величину не одного, а ряда факторов, зависимость которых может быть выражена уравнением множественной корреляции или уравнением множественной линейной регрессии. Поэтому система уравнений – одна из наиболее эффективных прогнозных моделей.
Построение модели, описывающей
зависимость между заболеваемостью и загрязнением атмосферного воздуха и
водопроводной воды в Атырауской области, рассчитывались на основе следующих
факторов: по атмосферному воздуху изучались – пыль, SO2, NO2,
NH3, H2S, CO; по водопроводной воде – мутность,
сухой остаток, сульфаты, хлориды, железо, фтор, нитраты.
Расчеты проводились в универсальной статистической программе Statistica 6,0 для Windows с использованием модуля «множественная регрессия» и метода пошаговой регрессии.
Метод пошаговой регрессии состоит в том, что на каждом шаге в модель включается, либо исключается изучаемая нами независимая переменная. Таким образом, выделяется множество наиболее «значимых» переменных. Это позволяет определить и сократить число переменных, которые достоверно описывают зависимость. При использовании этого метода в регрессионное уравнение последовательно включаются независимые переменные, пока уравнение не станет удовлетворительно описывать исходные данные. Включение переменных определяется при помощи критерия Фишера – F.
Корреляционно-регрессионный анализ позволяет измерить количественно тесноту, направление связи (корреляционный анализ), а также установить аналитическое выражение зависимости результата от конкретных факторов при постоянстве остальных действующих на результативный признак факторных признаков (регрессионный анализ).
Нами, с целью изучения влияния на уровень заболеваемости населения Атырауской области (моделируемый признак Y) ряда факторов (факторные признаки – Х1, Х2, Х3, Х4 и Х5), в качестве аппарата математической модели был использован множественный корреляционно-регрессионный анализ между показателями заболеваемости населения и концентрациями загрязняющих веществ атмосферного воздуха и качества водопроводной воды в Жылыойском районе и в пп. Кульсары и Каратон.
По результатам расчетов получены достоверные и адекватные вероятностные модели множественной регрессии, связывающей заболеваемость населения с несколькими переменными Х.
В наших моделях:
Y – зависимая переменная - показатель заболеваемости населения
x1 – x5 – независимые переменные, а именно:
x1 – концентрация H2S в атмосферном воздухе
x2 – концентрация SO2 в атмосферном воздухе
x3 – концентрация NO2 в атмосферном воздухе
x4 – концентрация хлоридов в воде
x5 – концентрация сульфатов в воде.
Перед построением моделей были выполнены предварительные преобразования, а именно показатели заболеваемости были прологарифмированы (вычислен натуральный логарифм) для стабилизации дисперсии. Т.е., чем выше абсолютное значение переменной, тем выше и уровень случайных ошибок. При логарифмировании все ошибки становятся примерно одинаковыми. После получения моделей необходимо вычислить экспоненту (EXP) полученного значения показателя заболеваемости, чтобы обратно вернуться к истинному значению данного показателя.
Общее
качество полученных моделей оценивалось при помощи коэффициентов множественной
корреляции (R), детерминации (R2) и критерия Фишера (F).
Коэффициент множественной корреляции R – это степень зависимости двух или более независимых переменных (переменных X) с зависимой переменной Y. По определению он равен корню квадратному из коэффициента детерминации (R2).
Коэффициент детерминации (R2) – показывает степень описания процесса моделью. Значение R2 является индикатором степени подгонки модели к данным (значение R2 близкое к 1,0 показывает, что модель объясняет почти всю изменчивость соответствующих переменных).
Критерий Фишера (F) – оценивает достоверность и надежность модели по уровню значимости (р или Значимость F), который должен быть меньше расчетного значения F.
В наших расчетах полученные модели для всех исследуемых регионов характеризуются высокой надежностью и достоверностью (F расчетное > значимости F) и высокой точностью предсказания (таблица 1), т.е. модель хорошо описывает явление (R2 > 0,9). Коэффициенты множественной корреляции для всех поселков (R > 0,95) свидетельствуют о тесной связи факторных признаков с результативным.
Таблица 1 – Показатели регрессионной статистики и дисперсионного анализа
Населенные пункты |
Коэффициенты |
Критерии Фишера, F |
||
множественной корреляции, R |
детерминации, R2 |
F расчетное |
значимость F |
|
п.
Кульсары |
0,966 |
0,933 |
6,98 |
0,13 |
п.
ТШО |
0,982 |
0,965 |
13,69 |
0,07 |
Жылыойский
район |
0,951 |
0,904 |
7,08 |
0,07 |
Значение коэффициентов детерминации можно интерпретировать следующим образом: построенная регрессия для п. ТШО объясняет 96,5% разброса значений относительно среднего, для Жылыойского района – 90,4% и для п. Кульсары – 93,3%.
Для оценки значимости полученных коэффициентов регрессионного уравнения использовался t-критерий Стьюдента. В случаях, когда значение t-критерия Стьюдента меньше 2-х, коэффициент регрессии считался нулевым. Это означает, что соответствующая независимая переменная практически не влияет на зависимую, и этот коэффициент (фактор) не включался в уравнение.
После пошагового определения достоверных переменных и исключения незначимых – прогнозные математические модели приняли следующий вид (таблица 2).
Таблица 2 – Прогнозные модели зависимости заболеваемости от
уровня загрязнения атмосферного воздуха в исследуемых
поселках
Населенные пункты |
Уравнения регрессии |
п. Кульсары |
Y = 4,7 + 109,9 · x2 + 26,2 · x3 |
п. ТШО |
Y = 9,5 + 617,2 · x1 + 30,8 · x2 |
Жылыойский район |
Y = 6,9 + 34,0 · x2 + 10,2 · x3 |
Жылыойский район |
Y = 3,2 + 0,9 · x4 +
1,2 · x5 |
Из данных таблицы 2 следует, что на показатель общей заболеваемости населения исследуемых поселков существенное влияние оказывают концентрации следующих загрязняющих веществ:
– для п. Кульсары – Х2 и Х3 (концентрации SO2 и NO2 в воздухе);
– для п. ТШО – Х1 и Х2 (концентрации H2S и SO2 в воздухе);
– для Жылыойского р-на – Х2 и Х3 (концентрации SO2 и NO2 в воздухе);
– для Жылыойского р-на – Х4 и Х5 (концентрации хлоридов и сульфатов в водопроводной воде).
Таким образом, подставляя определенные значения концентраций исследуемых веществ в уравнение регрессии можно вычислить прогнозируемые показатели общей заболеваемости населения в изучаемых населенных пунктах.
Выделив наиболее значимые величины концентраций загрязняющих веществ в атмосферном воздухе, можно иллюстративно представить влияние этих факторов на общую заболеваемость населения изучаемых поселков.
Многомерная модель зависимости общей заболеваемости населения п. Каратон от концентрации H2S и SO2 в воздухе выглядит следующим образом (рисунок 1).
Рисунок 1 – Модель зависимости общей заболеваемости населения
п. Каратон от концентрации H2S и SO2 в атмосферном воздухе
Заболеваемость будет увеличиваться в 1,9 раз при росте концентрации H2S на 0,001 мг/м3 (12,5 % ПДК), а возрастание концентрации SO2 на 0,01 мг/м3 (20 % ПДК) увеличит показатель заболеваемости в 1,4 раза.
На рисунке 2 показана модель зависимости общей заболеваемости населения Жылыойского района от концентрации в воздушной среде SO2 и NO2. Так, увеличение концентрации SO2 на каждые 0,01 мг/м3 (20 % ПДК) будет способствовать повышению показателя общей заболеваемости в 1,4 раза, и увеличение концентрации NO2 также на 0,01 мг/м3 (25 % ПДК) повысит заболеваемость в 1,1 раза.
На рисунке 3 демонстрируется модель влияния концентрации SO2 и NO2 в атмосферном воздухе на показатель общей заболеваемости населения п. Кульсары. Так, на каждые 0,01 мг/м3 (20 % ПДК) увеличения концентрации SO2 приходится возрастание показателя общей заболеваемости населения в 3,0 раза, и на каждые 0,01 мг/м3 (25 % ПДК) увеличения концентрации NO2 – в 1,3 раза.
Таким образом, определены основные факторы и степень их влияния на показатели общей заболеваемости населения: для п. ТШО – это концентрации H2S и SO2, а для Жылыойского района и п. ТШО – концентрации SO2 и NO2 в воздушной среде с прямо пропорциональной зависимостью.
Рисунок 2 – Модель зависимости общей заболеваемости населения
Жылыойского района от концентрации SO2 и NO2 в атмосферном воздухе
Рисунок 3 – Модель зависимости общей заболеваемости населения п. ТШО от концентрации SO2 и NO2 в атмосферном воздухе
После анализа и оценки влияния ряда факторов на показатель общей заболеваемости, возникает необходимость изучить влияние этих факторов на основные классы болезней в Атырауской области.
Для разделения выборки на однородные подвыборки используют методы кластерного анализа, т.е. совокупности многомерных статистических процедур, которые позволяют упорядочить объекты по однородным группам.
Поэтому для нахождения групп схожих объектов и поиска существующих реальных структур данных нами проведен кластерный анализ близости основных классов болезней в Атырауской области (рисунок 4).
Из рисунка 4 видно, что болезни крови и
кроветворных органов, уха и сосцевидного отростка, врожденные пороки развития
(ВПР), новообразования, а также инфекционные и эндокринные болезни образуют достаточно тесную группу, связанную с
болезнями кожи, подкожной клетчатки и костно-суставной системы. К этой группе
на следующей иерархической ступени присоединяются болезни нервной и мочеполовой
системы. Далее, объединяясь с болезнями органов дыхания, кровообращения, глаза
и его придатков, образующих достаточно выраженную однородную группу, кластеры
соединяются на заключительном уровне иерархии с болезнями органов пищеварения,
имеющих собственную специфику.
Рисунок 4 – Кластерный анализ взаимосвязи между различными классами болезней населения в Атырауской области
Таким
образом, нами установлена однородность групп и степень взаимосвязи между
различными классами болезней, которые формируют показатель общей заболеваемости
населения Атырауской области.
После проведения кластерного анализа, используя множественный корреляционно-регрессионный анализ, были найдены зависимости влияния концентраций H2S, SO2 и NO2 в атмосферном воздухе на показатели заболеваемости населения Атырауской области по основным классам болезней.
Данные вычисления представлены в виде уравнений множественной линейной регрессии.
Нами установлено, что на заболеваемость населения болезнями глаз и его придатков оказывает статистически достоверное влияние только концентрации SO2 (R=0,9; R2=0,7; р<0,05).
Зависимость имеет вид:
Заболеваемость глаза и его придатков |
= |
EXP (4,9+84,9 ×
концентрация SO2 в воздухе, мг/м3) |
Это
означает, при увеличении концентрации SO2 в воздухе на
0,01 мг/м3 (20 % ПДК) заболеваемость
глаза и его придатков повысится в 2,3 раза.
Доказано статистически достоверное влияние только концентрации SO2 (R=0,8; R2=0,7; р<0,05) на заболеваемость населения болезнями органов дыхания:
Заболеваемость органов дыхания |
= |
EXP (5,8+83,7 ×
концентрация SO2 в воздухе, мг/м3) |
Т.е. при повышении концентрации SO2 в воздухе на 0,01 мг/м3 (20 % ПДК) заболеваемость органов дыхания увеличится в 2,3 раза.
Нам
удалось определить статистически достоверное (R=0,8; R2=0,6; р<0,05) влияние на заболеваемость системы кровообращения
концентраций H2S и NO2:
Заболеваемость системы кровообращения |
= |
EXP (6,0 + 13,4 ×
конц. H2S + 31,2 × конц. NO2 мг/м3) |
Из этого следует, что при увеличении концентрации H2S на 0,001 мг/м3 (12,5% ПДК) и NO2 на 0,01 мг/м3 (25% ПДК) заболеваемость системы кровообращения повысится в 1,1 и 1,4 раза соответственно.
Также мы получили статистически достоверное (R=0,8; R2=0,7; р<0,05) влияние концентрации SO2 на заболеваемость мочеполовой системы:
Заболеваемость мочеполовой системы |
= |
EXP (4,6+108,9 * концентрация SO2 в воздухе, мг/м3) |
Это
значит, что при увеличении концентрации SO2 в воздухе на 0,01 мг/м3 (20 % ПДК) заболеваемость мочеполовой системы повысится в 2,9 раза.
Нами установлено, что на заболеваемость населения болезнями кожи и подкожной клетчатки оказывает статистически достоверное влияние только концентрации SO2 (R=0,8; R2=0,7; р<0,05).
Зависимость имеет вид:
Заболеваемость кожи и подкожной клетчатки |
= |
EXP (4,3+46,4 * концентрация SO2 в воздухе, мг/м3) |
Это означает, при увеличении концентрации SO2 в воздухе на 0,01 мг/м3 (20 % ПДК) заболеваемость кожи и подкожной клетчатки повысится в 1,1 раза.
Данные рисунка 5 показывают прямую зависимость заболеваемости населения от объема общих выбросов в атмосферный воздух.
Рисунок 5 – Зависимость уровня заболеваемости от объема валовых выбросов в атмосферу
Чтобы объективно оценить медико-демографическую ситуацию в Атырауской области в целом немаловажное значение имеет оценка соответствующих показателей и в отдельных районах области, особенно в тех, которые расположены вблизи нефтедобывающих и нефтеперерабатывающих предприятий.
Для объективизации анализируемых данных нами применялся метод сравнительной ранговой оценки статистических показателей, основанный на ранжировании различных медико-демографических показателей с учетом значений интервалов между рангами.
С этой целью в системе рангов определялось
место отдельных регионов по каждому из анализируемых показателей, затем
вычислялась региональная сумма рангов, по величине которой (или ее усредненному
значению) и определялся уровень «благополучия» того или иного региона. Этот
метод позволяет дать объективную оценку состояния здоровья населения того или
иного региона на основании изучения разнородных и не всегда взаимосвязанных
между собой показателей.
Ранговая оценка статистических показателей предполагает создание вариационного ряда, в котором каждому из показателей (по мере их возрастания или убывания) присваивается определенный ранг (номер). Такая оценка необходима при изучении каких-либо процессов или явлений в случаях невозможности проведения полноценной вариационной статистики.
Нами проведено изучение медико-демографических показателей, в достаточной степени отражающих состояние так называемого «благополучия» жителей Атырауской области и отдельных ее районах. К таким показателям отнесли рождаемость и смертность населения, младенческую смертность, а также общую заболеваемость. Для объективизации оценки «благополучия» отдельных районов области использовали их ранговое распределение как по каждому из исследованных показателей, так и по их сумме.
Статистической обработке подлежали данные по всем административным территориям Атырауской области. Ранговые места (с 1 по 6-й) распределились следующим образом (рисунок 6): г. Атырау, Жылыойский, Макатский, Исатайский, Махамбетский районы, т.е. наиболее «благополучными» районами являлись: Махамбетский.
Таким образом, результаты исследований свидетельствуют о сложной медико-демографической ситуации как в самой Атырауской области, так и в отдельных ее городах и районах, обусловленной комплексом факторов, куда, кроме влияния результатов деятельности нефтедобывающих и нефтеперерабатывающих предприятий, можно отнести географические и экологические особенности.
РЕЗЮМЕ
Математическое моделирование зависимости
заболеваемости населения от загрязнения окружающей среды в нефтегазовых
регионах Прикаспия
На уровень и структуру общей заболеваемости населения существенное влияние оказывают загрязняющие вещества в п. Кульсары – концентрации SO2 и NO2 в воздухе, в п. ТШО – концентрации H2S и SO2; в Жылыойском районе – концентрации SO2 и NO2, в сельских населенных пунктах Жылыойского района – концентрации хлоров и сульфатов в питьевой воде.
Результаты исследований свидетельствуют о сложной медико-демографической ситуации, как в самой Атырауской области, так в отдельных ее городах и районах, обусловленной комплексом факторов предприятий нефтедобычи и нефтепереработки и географических и экологических особенностей региона.
SUMMARY
Mathematical modelling of dependence of desease of the
population from environmental contamination in oil-and-gas regions Prikaspija
Polluting substances in
Kulsary settlement - concentration of SO2
and NO2 in air, TSО settlement - concentration of H2S
and SO2, in Zhylyojsk area - concentration of SO2 and NO2,
in rural settlements of Zhylyojsk area - concentration of chlorines and
sulfates in potable water render essential influence on the level and structure
of the general morbidity of the population.
Results of the researches say about
serious medicine-demographic situation, as in Atyrau area, so in its separate towns
and areas, caused by complex of factors of the oil extracting enterprises and
oil refining and geographical and ecological features of the region.