Модели статистического прогнозирования БД
Модели статистического прогнозирования
Качество воздухав городеЧастота легочныхзаболеванийОпеределимхарактерзависимостиКачественное заключение
Уточнение характера зависимостиПримеси в воздухе,влияющие наздоровьеСильно влияющиеНесильно влияющиеЧисло заболеванийСборэкспериментальных данныхАнализОбобщениеОксидуглеродаДолжнобытьмного
Массовые количественные данныеСтатистика=НаукаСборАнализИзмерение
СтатистикаЭкономическаяМедицинскаяСоциальнаяМатематическаястатистика
Пример из медиц. статистики: Представление экспериментальных данныхТабличноеГрафическоеСредняяконцентрация угарного газаЧисло хроническихбольных на 1000 жителейНесильное влияниеРезкий ростзаболеваемости
Статистические данныеПриближённые,усреднённыеХарактер зависимостивеличиныВерноотражаютНосят оценочный характерОценочнаямодельМатематическая модельP=f(C)Формульное выражение функциональной зависимостиГрафик долженпроходить близко к экспер. точкамподборМатем. методы
Искомая функцияГрафик проходитчерез всеСлишком сложныйвид функцииэкспериментальныеточкиПриближенныеданныеНет смыслаОсновные требованияДостаточная простотаУдобно использоватьв дальнейших вычисленияхОтклонения точек отграфикаМинимальныРавномерныРегрессионнаямодель
Получение регрессионной моделиПодбор вида функцииВычислениепараметров функцииНе имеет строгогорешенияОпытИнтуицияСлепойпереборНаиболее используемые функцииy=ax+by=ax+by=ax2+bx+cy=aln(x)+by=aebxy=axby=ax3+bx2+cx+dabcdМетодывычисленияпараметровМетоднаименьшихквадратов18 век,К. Гаусс
у = ах + b ― линейная функция;у = ах2 + bх + с ― квадратичная функция;у = а ln(х) + b ― логарифмическая функция;у = ае bx ― экспоненциальная функция;у = ахb ― степенная функция.
Квадратичная функция называется в математике полиномом второй степени.Иногда используются полиномы и более высоких степеней, например полином третьей степени имеет вид:у = ах3 + bх2 + сх + d.
Во всех этих формулах:х ― аргумент,у ― значение функции,а, b, с, d ― параметры функции,ln(х) ― натуральный логарифм,е ― константа, основание натурального логарифма.
Искомая функцияМНК(y1э-y1ф)2(y2э-y2ф)2(yiэ-yiф)2Σ (yiЭ-yiф)211i=1kminИскомая функция должна бытьпостроена так, чтобысумма квадратов отклонений y-координатвсех экспериментальных точек от y-координат графика функциибыла минимальной
Статистическая обработка данныхИспользуемыематематическиепакетыпрограммМНКПостроение любой функцииКритерии соответствияРегрессионнаямодельГрафикТренд
С первого взгляда хочется отбраковать вариант линейного тренда.График линейной функции ― это прямая.Полученная по МНК прямая отражает факт роста заболеваемости от концентрации угарного газа, но по этому графику трудно что-либо сказать о характере этого роста.А вот квадратичный и экспоненциальный тренды правдоподобны.
Полученные функции:линейная функция: у = 46,361х - 99,881;экспоненциальная функция: у = 3,4302 е 0,7555х ;квадратичная функция: у = 21,845х2 - 106,97х + 150,21.
Регрессионная модельФункцияГрафикФормулаКоэффициентдетерминированностиИнтервал0 ... 1Удачнаярегрессионная модельR2Неудачнаярегрессионная модель
Регрессионная математическая модельЗначения,полученные путёмизмеренийПрогнозирование процессадля других значений аргументаВосстановлениезначенияЭкстраполяцияВ пределахэкспериментальныхзначенийЗа пределамиэкспериментальныхданныхВ том числес помощью ЭТГрафическимспособомдержится на гипотезе: предположим, что за пределами экспериментальной области закономерность сохраняется
Конец фильма