Построение аппроксимирующих моделей минимизируемой функции
Рассмотрим класс алгоритмов, поиск глобального минимума по которым сводится к следующей последовательности действий:
1) проводятся испытания в точках xi, i = 1, 2,…, N, расположенных определенным образом на интервале [a, b];
2) по полученным значениям (xi, Q (xi)), i = 1,2,…, N, строится математическая модель, аппроксимирующая функцию Q (х) на интервале [a, b];
3) оценивается точность приближения построенной модели к функции Q (х);
4) если точность аппроксимации недостаточна, то проводятся дополнительные испытания и процедура поиска повторяется с п. 2; в противном случае при помощи полученной математической модели принимается решение о расположении на интервале [а, b] точки глобального минимума х* функции Q (х).
Будем считать, что минимизируемые кривые Q (х) являются непрерывными функциями, удовлетворяющими условию (4.1), в котором количественное значение константы Липшица L в общем случае может быть неизвестно.
Согласно теореме Вейерштрасса, любая непрерывная функция Q (х) может быть аппроксимирована равномерно сходящейся последовательностью алгебраических полиномов PN(х)=∑akxk, т. е. для
любого числа ε > 0 найдется такой полином PN (х), что для всех х∈[a, b] будет справедливо неравенство
|Q(x) — PN(х)| ≤ ε.
Однако степень аппроксимирующего полинома PN (х) при этом является произвольной и может оказаться очень высокой. В связи с этим возникает экстремальная задача определения при фиксированной степени N такого полинома PN (x), который наилучшим образом аппроксимирует функцию Q (х):
min max |Q(x)—PN(х)|.
Для непрерывных функций Q (х) оптимальное решение задачи (4.25) существует и является единственным многочленом степени не выше N, который в аналитическом виде может быть представлен при помощи интерполяционного полинома Лагранжа
PN(x) = ∑Q(xi)ωN+1 (x)/[(x-xi)ωN+1(xi)], (4.26)
Точность приближения функции Q (x) полиномом (4.26) будет тем выше, чем меньше многочлен ωN+1(х) будет отклоняться от нуля. Поэтому точки испытаний xi, i = 1, 2,…, N, которые в (4.26) являются узлами интерполяции, необходимо выбирать таким образом, чтобы при увеличении числа испытаний N, С одной стороны, обеспечить равномерную сходимость последовательности полиномов PN (х) к функции Q (х), а с другой — наибольшую скорость уменьшения многочлена ωN+1(х). Для рассматриваемого класса минимизируемых функций Q (х) сформулированные требования выполняются, если в качестве точек испытаний xi выбирать нули многочлена Чебыщева TN(х) = cos (N arccos (x)), которые являются вещественными, простыми и лежат в интервале [-1, 1]:
xi = cos[(2i-1)/2N — π], i=1,2,…,V, (4.27)
Использование в качестве математической модели интерполяционного полинома Лагранжа (4.26), а в качестве точек испытаний — нулей многочлена Чебышева (4.27) приводит к алгоритму F13, реализующему пассивную стратегию поиска точки глобального минимума х* произвольной кривой Q (х):
1. Определяется расположение точек испытаний на интервале [а, b]
xi = |(b — а)ξi + (а + b)|/2, i = 1, 2, …, N + 1, где
ξi = cos[(2i-1)/2(N+1) — π]
2. По информации о проведенных испытаниях (xi, Q (xi)), i = 1, 2, …, N + 1, строится математическая модель функции Q (х) в виде интерполяционного полинома Лагранжа.
3. Находится первая производная от полинома РN (х) и путем решения уравнения:
РN(x) = 0
(например, с помощью метода Мюллера вычисляются корни алгебраического полинома (N — 1)-й степени, среди которых выбирается значение x*, удовлетворяющее условию
РN(х) = min РN(х).
4. В качестве апостериорного интервала неопределенности [aN, bN], в котором предполагается наличие точки минимума х*, выбирается отрезок между точками испытаний xш и xi+1 удовлетворяющих условию:
xi ≤ x* ≤ хi+1.
При малом числе испытаний алгоритм F13 может не локализовать точку минимума х* (т. е. интервал [xi, xi+1] не будет содержать точку x*). Однако в силу равномерной сходимости полиномов РN(х) к функции Q(x) с ростом числа испытаний N вероятность потери точки глобального минимума х* будет убывать. Недостатком рассмотренного алгоритма является то, что при изменении числа проводимых испытаний хотя бы на одно (так как многочлены Чебышева TN (х) и TN+1 (х) не имеют общих корней), для сохранения свойства равномерной сходимости полиномов PN(х) к функции Q (х), необходимо узлы интерполяции {xi} вычислять заново, что приводит к потере всей информации о предыдущих испытаниях. В связи с этим рассмотрим последовательную стратегию поиска точки глобального минимума x* с помощью интерполяционных полиномов Лагранжа (4.26), в которых система узлов интерполяции {xi} обладает следующими свойствами:
— при увеличении числа испытаний N новые узлы лишь добавляются между старыми узлами, которые сохраняются неизменными;
— построенные по этим узлам интерполяционные полиномы PN(х) обладают свойством равномерной сходимости к функции Q (х).
Для удовлетворения сформулированных требований, предъявляемых к узлам интерполяции {хi}, необходимо, чтобы они вычислялись о помощью полиномов, корни которых не меняются при изменении числа N, но в то же время эти полиномы должны обладать свойствами многочленов, наименее отклоняющихся от нуля на интервале [-1,1].