Градиентный метод с дроблением шага и метод наискорейшего спуска


	Загрузить архив:
	Файл: ref-21653.zip (11kb [zip], Скачиваний: 293) скачать

Семинарская работа

Выполнил

Студент группы МОС-22

Кравченко Александр

Градиентный метод с дроблением шага.

В этом варианте градиентного метода величина шага αⁿ на каждой итерации выбирается из условия выполнения неравенства

f(xⁿ⁺¹) = f(xⁿ -aⁿf¢(xⁿ)) £ f(xⁿ) -eaⁿ||f¢(xⁿ)||²,

где eÎ (0, 1) — некоторая заранее выбранная константа. Условиегарантирует (если, конечно, такие aⁿ удастся найти), что получающаяся последовательность будет . Процедуру нахождения такого aⁿ обычно оформляют так.

Выбирается число dÎ (0, 1) и некоторый начальный шаг a⁰. Теперь для каждого n полагают aⁿ = a⁰ и делают шаг градиентного метода. Если с таким aⁿ условиевыполняется, то переходят к следующему n. Если же условие не выполняется, то умножают aⁿ на d ("дробят шаг") и повторяют эту процедуру до тех пор пока равенство

f¢(xⁿ) =

1

0

f¢¢[x* + s(xⁿ - x*)](xⁿ - x*) ds

не будет выполняться. В условиях об условной сходимости градиентного метода с постоянным шагом эта процедура для каждого n за конечное число шагов приводит к нужному aⁿ.

Можно показать, что в условиях (о линейной сходимости градиентного метода с постоянным щагом) . Описанный алгоритм избавляет нас от проблемы выбора a на каждом шаге, заменяя ее на проблему выбора параметров e, d и a⁰, к которым градиентный метод менее чувствителен. При этом, разумеется, объем вычислений возрастает (в связи с необходимостью процедуры дробления шага), впрочем, не очень сильно, поскольку в большинстве задач основные вычислительные затраты ложатся на вычисление градиента.

Метод наискорейшего спуска.

Этот вариант градиентного метода основывается на выборе шага из следующего соображения. Из точки xⁿ будем двигаться в направлении до тех пор пока не достигнем минимума функции f на этом направлении, т.е. на луче L = {x Î R^m: x = xⁿ - af¢(xⁿ); a ³ 0}:

aⁿ = argmin_aÎ[0,_¥)f(xⁿ -af¢(xⁿ)).

Рис. 1

Другими словами, aⁿ выбирается так, чтобы следующая итерация была точкой минимума функции f на луче L (см. ). Такой вариант градиентного метода называется методом наискорейшего спуска. Заметим, что в этом методе направления соседних шагов ортогональны. В самом деле, поскольку функция j: a® f(xⁿ -af¢(xⁿ)) достигает минимума при a = aⁿ, точка aⁿ является функции j:

0 = j¢(aⁿ) =

f(xⁿ -af¢(xⁿ))

ê
ê

a=aⁿ

= (f¢(xⁿ -aⁿf¢(xⁿ)), -f¢(xⁿ)) = -(f¢(xⁿ⁺¹), f¢(xⁿ)).

требует решения на каждом шаге задачи одномерной оптимизации. Практика показывает, что этот метод часто требует меньшего числа операций, чем .

В общей ситуации, тем не менее, теоретическая скорость сходимости метода наискорейшего спуска не выше скорости сходимости градиентного метода с постоянным (оптимальным) шагом.