ГЛАВА 8. ИНТЕРВАЛЬНОЕ ЭКСПЕРТНОЕ ПРОГНОЗИРОВАНИЕ

ГЛАВА 8. ИНТЕРВАЛЬНОЕ ЭКСПЕРТНОЕ ПРОГНОЗИРОВАНИЕ
Случайность—запасной фонд Господа Бога. Всемогущий прибегает к нему лишь в тех важных случаях, особенно теперь. когда люди стали так проницательны, что предвидят грядущее, наблюдая природу и постигая ее закономерности. А. Дюма
Если Вы когда-нибудь угадали, никогда не позволяйте забыть это.
Из правил прогнозиста
§8.1. Основные элементы методики
Для количественного анализа инвестиций в производство необходим достаточно большой объем информации. Часть ее обеспечивается технико-экономическими расчетами и накопленной производственной статистикой. Однако многие данные, особенно при разработке крупных проектов, можно получить лишь экспертным путем. Существование значительных диапазонов для реально возможных будущих состояний объекта прогноза требует разработки не точечных, а интервальных экспертных прогнозов и наделения последних субъективными вероятностями их реализации (осуществления). Чем больше эта вероятность, тем шире интервал прогноза при всех прочих равных условиях. Кратко методика сводится к "извлечению" из эксперта некоторых суждений и их преобразованию в более узкие интервалы прогноза, чем это первоначально было задано экспертом для некоторых крайних ситуаций.
Определение интервала для прогнозируемой величины и его увязывание с вероятностью реализации можно во многих случаях сделать вполне выполнимой задачей, если воспользоваться предлагаемой ниже методикой'. Данная методика отличается прагматичностью: она проста в реализации и не требует от эксперта глубоких знаний в области теории вероятностей и математической статистики. Достаточно быть знакомым с основными параметрами статистических распределений (средней, модой, дисперсией). Однако за простоту, как правило, надо платить. Плата заключается в нестрогом применении положений математической статистики. Последнее, впрочем, оправдывается и тем, что сами исходные данные обычно не являются результатами статистических наблюдений.
Согласно данной методике в задачу эксперта входят:
• определение реально возможного диапазона значений прогнозируемой величины;
• выбор вида распределения вероятностей реализации в пределах этого диапазона;
• выбор уровня надежности прогноза (вероятности его реализации).
Кроме того, при прогнозировании сумм или произведения показателей эксперт должен вынести суждение о наличии (или отсутствии) значительной зависимости слагаемых или сомножителей (да, нет). Это суждение выносится исходя из содержания рассматриваемых показателей, накопленного опыта или, в лучшем случае, основывается на результатах предварительного регрессионного или корреляционного анализа статистических данных.
Кратко охарактеризуем перечисленные этапы.
Методика разработана совместно с Е. 3 Демиденко в Институте мировой экономики и международных отношении. Для экспертного прогнозирования создана и более сложная методика, которая получила название "прогнозирование на проблемных сетях" (ИМЭМО. Анализ на проблемных сетях. М., 1982. Т. 1, 2). Данная методика позволяет получить обобщенные экспертные оценки группы экспертов, специалистов в разных областях знания. Каждый эксперт выдает оценку "своего" участка проблемной сети в виде статистического распределения прогнозируемого параметра.
Реально возможный диапазон (РВД) — полный интервал реально возможных значений, в котором с практически 100%-й вероятностью (наверняка) окажется, по мнению эксперта, соответствующая характеристика. Эксперт для этого определяет экстремальные значения показателя (нижнюю и верхнюю границу) исходя из крайних сценариев развития исследуемого объекта. Пример: ожидается, что при наихудшей конъюнктуре для продавца цена продукции не может быть меньше А, при наилучшей — не более Б, или темп роста производства в некотором временном интервале не опустится ниже а°/о и не превысит 6%.
Ожидаемый вид распределения вероятностей для прогнозируемой величины в пределах установленного РВД. Эксперт должен вынести самое общее суждение о виде распределения, выбрав один из четырех вариантов. Предлагаются следующие виды распределений: а) нормальное; б) треугольное; в) трапециевидное; г) равномерное. Для упрощения полагаем, что распределения б) и в) являются симметричными. (Можно было бы рассмотреть и несимметричные варианты этих распределений, однако вряд ли эксперт сможет более или менее удовлетворительно определить необходимые для этого параметры.) Заметим, что распределения б) и в) не встречаются в "классической" статистике.
(а) Нормальное распределение N. Ожидается, что варианты значений прогнозируемого параметра сосредоточены около среднего значения. Значения параметра, существенно отличающиеся от среднего, т. е. находящиеся в "хвостах" распределения, имеют малую вероятность осуществления.
(б) Треугольное распределение Т. Этот вид распределения можно рассматривать как некоторый суррогат нормального в тех случаях, когда известно только, что распределение симметрично и имеет одну моду, причем следует ожидать, что вероятность реализации более или менее равномерно растет по мере приближения к моде.
(в) Трапециевидное распределение Тр. Предполагается, что в пределах РВД существует интервал значений с наибольшей вероятностью реализации (НВР). Например, предполагается,

что в диапазоне от 10 до 30% наиболее вероятны процентные ставки в пределах 15-25%.
(г) Равномерное распределение Р. По мнению эксперта, все варианты прогнозируемого показателя имеют одинаковую вероятность реализации, что равносильно отсутствию каких-либо дополнительных экспертных суждений о характере явления.
По-видимому, наибольшую информацию эксперт должен иметь для того, чтобы утверждать, что распределение близко к нормальному', и, наоборот, при полном отсутствии такой информации логично остановиться на равномерном распределении. Распределения Г и Тр занимают промежуточные места. Графическая иллюстрация перечисленных распределений приведена на рис. 8.1, на котором буквенные символы обозначают:
a, b —границы РВД;
М — модальное значение переменной;
m₁, М₂— границы НВР.
' Для этого при наличии значительного объема статистических данных применяют специальную процедуру проверки гипотезы о принадлежности данного распределения к нормальному. Однако в рамках обсуждаемой задачи, вероятно, достаточно экспертного суждения.
При использовании указанных распределений, кроме нормального, полагаем, что площадь под кривой распределения равна 1, или 100%. С небольшой натяжкой сказанное можно отнести и к нормальному распределению.
Третьим необходимым элементом методики является доверительная вероятность (ДВ), которая характеризует уровень вероятности реализации прогноза. Например, допустим, что интервальная оценка цены продукции в рамках прогноза считается надежной, если ДВ принята на уровне 0,9. Таким образом, в 9 случаях (шансах) из 10 (иными словами, с 90%-й вероятностью) можно утверждать, что прогноз окажется оправданным. Чем больше величина ДВ, тем ближе интервальный прогноз к РВД.
§ 8.2. Методы определения
интервальных прогнозов
После установления РВД и выбора вида распределения и уровня ДВ расчет границ интервального прогноза становится чисто технической задачей. Ее решение заключается в отсечении "лишних" концов РВД соответственно принятой доверительной вероятности. Иначе говоря, находят величины

где х — величина, зависящая от вида распределения и вероятности неудачи (неосуществления прогноза); очевидно, что упомянутая вероятность равна 1 - ДВ. Площади под кривой распределения, отсекаемые от "хвостов", равны половине этой вероятности (см. рис. 8.2) для треугольного распределения:

Значения этой вероятности для некоторых уровней ДВ приведены в табл. 8.1.

ДВ, %	60	70	75	80	90
а	0,2	0,15	0,125	0,1	0,05

Из сказанного следует, что задача определения интервального прогноза сводится к расчету размера х. Методики разработаны для следующих ситуаций:
А. Объект прогнозирования — отдельная количественная характеристика. Эксперт указывает РВД, вид распределения, а для распределения Тр и интервал наиболее вероятных значений прогнозируемого показателя.
Б. Прогноз суммы показателей, Y=å y-Например, сумма объемов выпуска нескольких видов продукции. Для каждого слагаемого указывается РВД и вид распределения. ДВ назначается только для итоговой суммы.
В. Прогноз произведения двух показателей, Y = vw .Например, произведение "нормативного" и объемного показателей. Эксперт указывает РВД, вид распределения и ДВ для каждого сомножителя.
На первый взгляд представляется, что обсуждаемую методику легко распространить на прогноз суммы произведений. Формально это несложно выполнить. Однако, как показали расчеты, степень "сжатия" прогнозного интервала в этих условиях весьма мала, так что применение данной методики не имеет смысла.
Покажем технику применения перечисленных методик для каждого из указанных распределений вероятностей.
МЕТОДИКА А. Расчет интервального прогноза отдельной характеристики
Распределение N.
Известно, что площадь под кривой нормального распределения в пределах М ± 3<т примерно равна 99%. Отсюда

где М — средняя,
ст — стандартное (среднее квадратическое) отклонение.
Пусть z —нормированное отклонение от средней', зависящее от выбранной доверительной вероятности. Тогда нормированное значение искомой величины х составит:

где

Вероятности невыполнения прогноза в каждом "хвосте" нормального распределения составят:

Заметим, что для нормального распределения ДВ = F(z).
В табл. 8.2 приводятся значения z, и, а в зависимости от уровня ДВ.
Площадь под кривой нормального распределения приводится в таблицах как функция F(z)нормированного отклонения z.
Таблицы нормального распределения обычно приводятся в учебниках по теории вероятностей и математической статистике, а более подробные — в специальных справочных изданиях. См., напр.: Ликеш И., Ляга И. Основные таблицы математической статистики. М.: Финансы и статистика, 1985. В Приложении (табл. 5) приводится краткая таблица значений F(z).

ДВ(%)	68	75	80	85	90	95
zи а	1 2 0,16	1,15 1,85 0,125	1,281,72 0,1	1,44 1,54 0,075	1,65 1,35 0,05	1,96 1,04 0,025

Необходимое для расчета по формуле (8.2) значение ст находим следующим образом:

Распределение Т. Искомая величина находится как функция от Lи а:

Распределение Тр.
Здесь возможны два варианта.

ПРИМЕР 1
Ожидается, что РВД (допустим, речь идет о годовом размере добычи минерального сырья) оценивается экспертом в объеме 1,2—1,8 млн. т. Определим интервальный прогноз для всех перечисленных выше видов распределений при условии, что ДВ = 80%. Для принятого уровня доверительной вероятности а=0,1.

Как видим, распределения N,Т и Тр дали примерно одинаковые интервалы для прогноза, а распределение Р — более "размытый" вариант.
МЕТОДИКА Б. Прогноз суммы показателей
Рассматриваются два варианта постановки задачи, когда слагаемые — это независимые величины и когда они зависимы друг от друга¹.
Независимые слагаемые. Прогнозируемый показатель представляет собой сумму некоторых однородных величин. Слагаемые — независимые или слабо зависимые между собой показатели. Определение прогнозного интервала предполагает выполнение следующих последовательных шагов:
• установление РВД и определение видов распределений (напомним, что все они симметричные);
• расчет средних значений этих распределений и дисперсий;
• расчет общей средней (суммы частных средних) и дисперсии суммы;
• оценка границ интервального прогноза.
Формулы для расчета средних и дисперсий приведены в табл. 8.3 .

Распределение	Средняя	Дисперсия
N Т Тр Р	a+L/2 a+L/2 a+L/2 a+L/2	(L/6)^2L/24 (L²+l²)/24 L/12

Во всех приведенных в таблице формулах L= b - а.
¹Строго говоря, это утверждение нуждается в специальной статистической проверке, что требует большого объема информации и достаточно трудоемко. При определении интервального прогноза, вероятно, достаточно экспертного суждения.
²Формулы для расчета основных параметров ряда важнейших распределений можно найти в "Справочнике по статистическим распределениям" ХагичсаН. иПикокаДж. (М.: Статистика, 1980).
Расчет суммы средних и дисперсии суммы производится следующим образом:
• сумма частных средних

дисперсия суммы

где М., D.—средние значения и дисперсии частных распределении;
• стандартная ошибка

Интервал прогноза определяется как

где z(нормированное отклонение) находится по табл. 8.2 или табл. 5 Приложения в зависимости от принятой ДВ.
ПРИМЕР 2
Эксперты установили следующие РВД и виды распределений для четырех слагаемых (в целях иллюстрации метода приняты различные виды распределений):

Слагаемое	а	b	L	Распределение
12 3 4	10 50 8 20	12 55 13 24	2 5 5 4	Т; М = 11 Тр; НВР =52-53 Р Т; М = 22
Сумма	88	104	—	—

Полученные по этим данным значения частных средних и дисперсий приведены в следующей таблице.

Слагаемое	Средняя	Дисперсия
1 2 3 4	1152,5 10,5 22	2^2/24= 0,177 (5²+1²)/24= 1,08 5²/12 =2,08 4² /24 = 0,677
Сумма	96	4,01

Как видим, интервал прогноза заметно уже, чем суммы граничных значений РВД слагаемых (88—104), но вероятность "попадания" в него также меньше (не 100, а 75%).
Сильная зависимость между слагаемыми. Теоретически обоснованное решение проблемы требует в этой ситуации измерения коэффициентов корреляции между попарно взятыми случайными переменными (в нашем случае — слагаемыми). Поскольку следует ожидать в основном положительной корреляции, то дисперсия увеличивается. Следовательно, увеличивается и интервал прогноза. Например, если в примере 2 полагать, что коэффициенты корреляции у всех пар слагаемых одинаковы и равны, допустим, 0,9 (сильная положительная корреляция), то стандартная ошибка увеличится почти в 2 раза и составит 3,91 вместо 2. Искомый интервал в этом случае равен 91,5—100,5. Однако в такого рода задачах вряд ли практически возможен расчет коэффициентов корреляции (хотя бы в связи с отсутствием необходимой информации), поэтому целесообразно поступить иным образом, избежав тем самым расчет упомянутых коэффициентов.
Для решения задачи определим граничные значения прогнозных интервалов для каждого слагаемого, применив методику А. Обозначим эти величины как А. и В. . Искомые граничные значения для суммы составят:

Слагаемые этих сумм рассчитаем с учетом того, что вероятности реализации прогноза для каждого слагаемого должны быть больше доверительной вероятности для суммы в целом. ДВ для суммы составит

Для отдельного слагаемого ДВ определяется как

ПРИМЕР 3
Используем данные примера 2 и найдем интервальный прогноз для суммы теперь уже зависимых слагаемых при условии что коэффициенты корреляции неизвестны. Примем, что ДВ для суммы равна 75%. Соответственно для отдельного слагаемого
ДВ_j. = ^/0,75 = 0,93 . По формуле (8.1) находим а = 0,035. Результаты расчетов величин х, v_j.и w_jпредставлены в следующей таблице.

Слагаемое	Распределение	a	b	L(1)	Формула	X	A_j	B_j
12 3 4	Ттр P	10 50 8 20	12 55 13 24	25(1) 5 4	(8.6) (8.8) (8.9) (8.6)	0,26 1,01 0,18 0,53	10,26 51,01 8,18 20,53	11,74 53,99 12,82 23,47
Сумма		88	104	—	—	—	89,98	102,02

МЕТОДИКА В. Прогноз произведения двух параметров
Иногда прогнозируемый показатель представляет собой произведение двух величин Y = VW, где одна величина — качественная характеристика (производительность труда, фондоотдача и т. п.), вторая — объемная величина (количество отработанного времени, размер фондов и пр.). Показатель Y прогнозируется не непосредственно, а на основе прогнозов сомножителей. Если рассматривать сомножители как независимые величины (а в большинстве случаев это правомерно), то методика сводится к следующему.
1. Для каждого сомножителя находится интервальный прогноз: V₁ V₂ W₁,W₂.При этом доверительная вероятность принимается на уровне Р. Причем

Иначе говоря, прогноз сомножителей должен быть сделан с большей доверительной вероятностью, чем прогноз итогового показателя (см. табл. 8.4; в ней же приводятся соответствующие значения а).

ДВ (%)	60	70	75	80	90	95
Р (%) а	77,5 0,112	83,7 0,082	86,60,067	89,4 0,053	94,9 0,026	97,5 0,013

2. Рассчитываются граничные значения прогнозного интервала как произведения V₁W₁, V₂W₂.С вероятностью ДВ можно утверждать, что реальное значение Y будет находиться в указанных пределах.
Можно применить и иной подход, взяв за базу средние распределений. Тогда последовательно находим: средние и дисперсии каждого распределения, произведение средних и дис-
Персию произведения. Последняя рассчитывается следующим образом':

где Dи М — дисперсия и средняя.
ПРИМЕР 4
Прогнозируется произведение двух случайных переменных, РВД которых показаны ниже в таблице. Доверительная вероятность
принята на уровне 80%. Таким образом, Р =100^/0,8 = 89,4% . По табл. 8.4 находим а= 0,053.
Применим первый из рассмотренных выше подходов. По формулам (8.6) и (8.9) определим значения х и границы прогнозных интервалов для каждого сомножителя. ^:

	Распределение	a	b	L	X	А	в
V W Y	Т Р	3 10	5 14	2 4	0,33 0,21	3,33 10,21 34,00	4,67 13,79 64,40

Как видим, прогнозный интервал 34 — 64,4 довольно широк. Однако он уже, чем произведение граничных значений РВД (30 — 70).
Для применения второго метода рассчитаем средние и дисперсии.

	Средняя	Дисперсия
V W Y	4 12 48	0,167 1,333 7,56

¹В 8.3 содержится доказательство приведенного выражения, поскольку оно, по-видимому, представляет определенный интерес и, по крайней мере, в учебной литературе не встречалось.
Для принятого уровня доверительной вероятности z = 1,28 (см. табл. 8.2). Границы прогнозного интервала составят:

§ 8.3. Математическое приложение
Доказательство формулы (8.14)
Исходим из известного в математической статистике соотношения

где D_x— дисперсия случайной переменной х;
Е(х) — математическое ожидание переменной х.
В силу (1) можно записать:

Известно, что

В свою очередь,

Перепишем (2), использовав полученные выражения, и заменим математические ожидания переменных на соответствующие средние (M_v;М_w.), после чего имеем: