30.09.2019

Линия тренда в Excel на разных графиках. Расчет параметров трендов


Когда тип тренда установлен, необходимо вычислить оптимальные значения параметров тренда исходя из фактических уровней. Для этого обычно используют метод наименьших квадратов (МНК). Его значение уже рассмотрено в предыдущих главах учебного пособия, в данном случае оптимизация состоит в минимизации суммы квадратов отклонений фактических уровней ряда от выравненных уровней (от тренда). Для каждого типа тренда МНК дает систему нормальных уравнений, решая которую вычисляют параметры тренда. Рассмотрим лишь три такие системы: для прямой, для параболы 2-го порядка и для экспоненты. Приемы определения параметров других типов тренда рассматриваются в специальной монографической литературе.

Для линейного тренда нормальные уравнения МНК имеют вид:

Нормальные уравнения МНК для экспоненты имеют следующий вид:

По данным табл. 9.1 рассчитаем все три перечисленных тренда для динамического ряда урожайности картофеля с целью их сравнения (см. табл. 9.5).

Таблица 9.5

Расчет параметров трендов

Согласно формуле (9.29) параметры линейного тренда равны а = 1894/11 = 172,2 ц/га; b = 486/110 = 4,418 ц/га. Уравнение линейного тренда имеет вид:

у ̂ = 172,2 + 4,418t , где t = 0 в 1987 г Это означает,что средний фактический и выравненный уровень, отнесенный к середине периода, т.е. к 1991 г., равен 172 ц с 1 ra a среднегодовой прирост составляет 4,418 ц/га в год

Параметры параболического тренда согласно (9.23) равны- b = 4,418; a = 177,75; с = -0,5571. Уравнение параболического тренда имеет вид у̃ = 177,75 + 4,418t - 0.5571t 2 ; t = 0 в 1991 г. Это означает, что абсолютный прирост урожайности замедляется в среднем на 2·0,56 ц/га в год за год. Сам же абсолютный прирост уже не является константой параболического тренда, а является средней величиной за период. В год, принятый за начало отсчета т.е. 1991 г., тренд проходит через точку с ординатой 77,75 ц/га; Свободный член параболического тренда не является средним уровнем за период. Параметры экспоненциального тренда вычисляются по формулам(9.32) и (9.33) lnа = 56,5658/11 = 5,1423; потенцируя, получаем а = 171,1; lnk = 2,853:110 = 0,025936; потенцируя, получаем k = 1,02628.

Уравнение экспоненциального тренда имеет вид: y ̅ = 171,1·1,02628 t .

Это означает, что среднегодовой темп поста урожайности за период составил 102,63%. В точке принятК начало отсчета, тренд проходит точку с ординатой 171,1 ц/га.

Рассчитанные по уравнениям трендов уровни записаны в трех последних графах табл. 9.5. Как видно по этим данным. расчетные значения уровней по всем трем видам трендов различаются ненамного, так как и ускорение параболы, и темп роста экспоненты невелики. Существенное отличие имеет парабола - рост уровней с 1995 г. прекращается, в то время как при линейном тренде уровни растут и далее, а при экспоненте их ост ускоряется. Поэтому для прогнозов на будущее эти три тренда неравноправны: при экстраполяции параболы на будущие годы уровни резко разойдутся с прямой и экспонентой, что видно из табл. 9.6. В этой таблице представлена распечатка решения на ПЭВМ по программе «Statgraphics» тех же трех трендов. Отличие их свободных членов от приведенных выше объясняется тем, что программа нумерует года не от середины, а от начала, так что свободные члены трендов относятся к 1986 г., для которого t = 0. Уравнение экспоненты на распечатке оставлено в логарифмированном виде. Прогноз сделан на 5 лет вперед, т.е. до 2001 г.. При изменении начала координат (отсчета времени) в уравнении параболы меняется и средний абсолютной прирост, параметр b . так как в результате отрицательного ускорения прирост все время сокращается, а его максимум - в начале периода. Константой параболы является только ускорение.

В строке «Data» приводятся уровни исходного ряда; «Forecast summary» означает сводные данные для прогноза. В следующих строках - уравнения прямой, параболы, экспоненты - в логарифмическом виде. Графа ME означает среднее расхождение между уровнями исходного ряда и уровнями тренда (выравненными). Для прямой и параболы это расхождение всегда равно нулю. Уровни экспоненты в среднем на 0,48852 ниже уровней исходного ряда. Точное совпадение возможно, если истинный тренд - экспонента; в данном случае совпадения нет, но различие, мало. Графа МАЕ -это дисперсия s 2 - мера колеблемости фактических уровней относительно тренда, о чем сказано в п. 9.7. Графа МАЕ - среднее линейное отклонение уровней от тренда по модулю (см. параграф 5.8); графа МАРЕ - относительное линейное отклонение в процентах. Здесь они приведены как показатели пригодности выбранного вида тренда. Меньшую дисперсию и модуль отклонения имеет парабола: она за период 1986 - 1996 гг. ближе к фактическим уровням. Но выбор типа тренда нельзя сводить лишь к этому критерию. На самом деле замедление прироста есть результат большого отрицательного отклонения, т. е. неурожая в 1996 г.

Вторая половина таблицы - это прогноз уровней урожайности по трем видам трендов на годы; t = 12, 13, 14, 15 и 16 от начала отсчета (1986 г.). Прогнозируемые уровни по экспоненте вплоть до 16-го года ненамного выше,.чем по прямой. Уровни тренда-параболы - снижаются, все более расходясь с другими трендами.

Как видно в табл. 9.4, при вычислении параметров тренда уровни исходного ряда входят с разными весами - значениями t p и их квадратов. Поэтому влияние колебаний уровней на параметры тренда зависит от того, на какой номер года приходится урожайный либо неурожайный год. Если резкое отклонение приходится на год с нулевым номером (t i = 0 ), то оно никакого влияния на параметры тренда не окажет, а если попадет на начало и конец ряда, то повлияет сильно. Следовательно, однократное аналитическое выравнивание неполно освобождает параметры тренда от влияния колеблемости, и при сильных колебаниях они могут быть сильно искажены, что в нашем примере случилось с параболой. Для дальнейшего исключения искажающего влияния колебаний на параметры тренда следует применить метод многократного скользящего выравнивания.

Этот прием состоит в том, что параметры тренда вычисляются не сразу по всему ряду, а скользящим методом, сначала за первые т периодов времени или моментов, затем за период от 2-го до т + 1, от 3-го до (т + 2)-го уровня и т.п. Если число исходных уровней ряда равно п, а длина каждой скользящей базы расчета параметров равна т, то число таких скользящих баз t или отдельных значений параметров, которые будут по ним определены, составит:

L = п + 1 - т.

Применение методики скользящего многократного выравнивания рассматривать, как видно из приведенных расчетов, возможно только при достаточно большом числе уровней ряда, как правило 15 и более. Рассмотрим эту методику на примере данных табл. 9.4 -динамики цен на нетопливные товары развивающихся стран, что опять же дает возможность читателю участвовать в небольшом научном исследовании. На этом же примере продолжим и методику прогнозирования в разделе 9.10.

Если вычислять в нашем ряду параметры по 11 -летним периодам (по 11 уровням), то t = 17 + 1 - 11 = 7. Смысл многократного скользящего выравнивания в том, что при последовательных сдвигах базы расчета параметров на концах ее и в середине окажутся разные уровни с разными по знаку и величине отклонениями от тренда. Поэтому при одних сдвигах базы параметры будут завышаться, при других - занижаться, а при последующем усреднении значений параметров по всем сдвигам базы расчета произойдет дальнейшее взаимопогашение искажений параметров тренда колебаниями уровней.

Многократное скользящее выравнивание не только позволяет получить более точную и надежную оценку параметров тренда, но и осуществить контроль правильности выбора типа уравнения тренда. Если окажется, что ведущий параметр тренда, его константа при расчете по скользящим базам не беспорядочно колеблется, а систематически изменяет свою величину существенным образом, значит, тип тренда был выбран неверно, данный параметр константой не является.

Что касается свободного члена при многократном выравнивании, то нет необходимости и, более того, просто неверно вычислять его величину как среднюю по всем сдвигам базы, ибо при таком способе отдельные уровни исходного ряда входили бы в расчет средней с разными весами, и сумма выравненных уровней разошлась бы с суммой членов исходного ряда. Свободный член тренда - это средняя величина уровня за период, при условии отсчета времени от середины периода. При отсчете от начала, если первый уровень t i = 1, свободный член будет равен: a 0 = у ̅ - b ((N-1)/2). Рекомендуется длину скользящей базы расчета параметров тренда выбирать не менее 9-11 уровней, чтобы в достаточной мере погасить колебания уровней. Если исходный ряд очень длинный, база может составлять до 0,7 - 0,8 его длины. Для устранения влияния долго-периодических (циклических) колебаний на параметры тренда, число сдвигов базы должно быть равно или кратно длине цикла колебаний. Тогда начало и конец базы будут последовательно «пробегать» все фазы цикла и при усреднении параметра по всем сдвигам его искажения от циклических колебаний будут взаимопогашаться. Другой способ - взять длину скользящей базы, равной длине цикла, чтобы начало базы и конец базы всегда приходились на одну и ту же фазу цикла колебаний.

Поскольку по данным табл. 9.4, уже было установлено, что тренд имеет линейную форму, проводим расчет среднегодового абсолютного прироста, т. е. параметра b уравнения линейного тренда скользящим способом по 11-летним базам (см. табл. 9.7). В ней же приведен расчет данных, необходимых для последующего изучения колеблемости в параграфе 9.7. Остановимся подробнее на методике многократного выравнивания по скользящим базам. Рассчитаем параметр b по всем базам:

Таблица 9.7

Многократное скользящее выравнивание по прямой



Уравнение тренда: у ̂ = 104,53 - 1,433t ; t = 0 в 1987 г. Итак, индекс цен в среднем за год снижался на 1,433 пункта. Однократное выравнивание по всем 17 уровням может исказить этот параметр, ибо начальный уровень содержит значительное отрицательное отклонение, а конечный уровень - положительное. В самом деле, однократное выравнивание дает величину среднегодового изменения индекса всего на 0,953 пункта.




9.7. Методика изучения и показатели колеблемости

Если при изучении и измерении тенденции динамики колебания уровней играли лишь роль помех, «информационного шума», от которого следовало по возможности абстрагироваться, то в дальнейшем сама колеблемость становится предметом статистического исследования. Значение изучения колебаний уровней динамического ряда очевидно: колебания урожайности, продуктивности скота, производства мяса экономически нежелательны, так как потребность в продукции агрокомплекса постоянна. Эти колебания следует уменьшать, применяя прогрессивную технологию и другие меры. Напротив, сезонные колебания объемов производства зимней и летней обуви, одежды, мороженого, зонтиков, коньков - необходимы и закономерны, так как спрос на эти товары тоже колеблется по сезонам и равномерное производство требует лишних затрат на хранение запасов. Регулирование рыночной экономики как со стороны государства, так и производителей в значительной мере состоит в регулировании колебаний экономических процессов.

Типы колебаний статистических показателей весьма разнообразны, но все же можно выделить три основных: пилообразную или маятниковую колеблемость, циклическую долгопериодическую и случайно распределенную во времени колеблемость. Их свойства и отличия друг от друга хорошо видны при графическом изображении рис. 9.2.

Пилообразная или маятниковая колеблемость состоит в попеременных отклонениях уровней от тренда в одну и в другую сторону. Таковы автоколебания маятника. Такие автоколебания можно наблюдать в динамике урожайности при невысоком уровне агротехники: высокий урожай при благоприятных условиях погоды выносит из почвы больше питательных веществ, чем их образуется естественным путем за год; почва обедняется, что вызывает снижение следу- ющего урожая ниже тренда, он выносит меньше питательных веществ, чем образуется за год, плодородие возрастает и т.д.

Рис. 9.2. Виды колебаний

Циклическая долгопериодическая колеблемость свойственна, например, солнечной активности (10-11-летние циклы), а значит, и связанным с ней на Земле процессам - полярным сияниям, грозовой деятельности, урожайности отдельных культур в ряде районов, некоторым заболеваниям людей, растений. Для этого типа характерны редкая смена знаков отклонений от тренда и кумулятивный (накапливающийся) эффект отклонений одного знака, который может тяжело отражаться на экономике. Зато колебания хорошо прогнозируются.

Случайно распределенная во времени колеблемость - нерегулярная, хаотическая. Она может возникать при наложении (интерференции) множества колебаний с разными по длительности циклами. Но может возникать в результате столь же хаотической колеблемости главной причины существования колебаний, например суммы осадков за летний период, температуры воздуха в среднем за месяц в разные годы.

Для определения типа колебаний применяются графическое изображение, метод «поворотных точек» М. Кендэла, вычисление коэффициентов автокорреляции отклонений от тренда. Эти методы будут рассмотрены далее.

Основными показателями, характеризующими силу колеблемости уровней, выступают уже известные по главе 5 показатели, характеризующие вариацию значений признака в пространственной совокупности. Однако вариация в пространстве и колеблемость во времени принципиально различны. Прежде всего различны их основные причины. Вариация значений признака у одновременно существующих единиц возникает из-за различий в условиях существования единиц совокупности. Например, разная урожайность картофеля в совхозах области в 1990 г. вызвана различиями в плодородии почв, в качестве семян, в агротехнике. А вот суммы эффективных температур за вегетационный период и осадков не являются причинами пространственной вариации, так как в одном и том же году на территории области эти факторы почти не варьируют. Напротив, главными причинами колебания урожайности картофеля в области за ряд лет как раз являются колебания метеорологических факторов, а качество почв колебаний почти не имеет. Что же касается общего прогресса агротехники, то он является причиной тренда, но не колеблемости.

Второе коренное отличие состоит в том, что значения варьирующего признака в пространственной совокупности можно считать в основном не зависимыми друг от друга, напротив, уровни динамического ряда, как правило, являются зависимыми: это показатели развивающегося процесса, каждая стадия которого связана с предыдущими состояниями.

В-третьих, вариация в пространственной совокупности измеряется отклонениями индивидуальных значений признака от среднего значения, а колеблемость уровней динамического ряда измеряется не их отличиями от среднего уровня (эти отличия включают и тренд, и колебания), а отклонениями уровней от тренда.

Поэтому лучше использовать разные термины: различия признака в пространственной совокупности называть только вариацией, но не колебаниями: никто же не станет называть различия численности населения Москвы, Петербурга, Киева и Ташкента «колебаниями числа жителей»! Отклонения уровней динамического ряда от тренда будем называть всегда колеблемостью. Колебания всегда происходят во времени, не может существовать колебаний вне времени, в фиксированный момент.

На основе качественного содержания понятия колеблемости строится и система ее показателей. Показателями силы колебании уровней являются: амплитуда отклонений уровней отдельных периодов или моментов от тренда (по модулю), среднее абсолютное отклонение уровней от тренда (по модулю), среднее квадратическое откло;-нение уровней от тренда. Относительные меры колеблемости: относительное линейное отклонение от тренда и коэффициент колеблемости - аналог коэффициента вариации.

Особенностью методики вычисления средних отклонений от тренда является необходимость учета потерь степеней свободы колебаний на величину, равную числу параметров уравнения тренда. Например, прямая линия имеет два параметра, и, как известно из геометрии, через любые две точки можно провести прямую линию. Значит, имея лишь два уровня, мы проведем линию тренда точно через эти два уровня, и никаких отклонений уровней от тренда не окажется, хотя на самом деле и эти два уровня включали колебания, не были свободны от действия факторов колеблемости. Парабола второго порядка пройдет точно через любые три точки и т.п.

Учитывая потерю степеней свободы, основные абсолютные показатели колеблемости вычисляются по формулам (9.34) и (9.35):

среднее линейное отклонение

(9.34)

среднее квадратичное отклонение

(9.35)

где y i - фактический уровень;

y ̂ i - выравненный уровень, тренд;

n - число уровней;

р - число параметров тренда.

Знак времени «t » в скобках после показателя означает, что это показатель не обычной пространственной вариации, как в главе V, а показатель колеблемости во времени.

Относительные показатели колеблемости вычисляются делением абсолютных показателей на средний уровень за весь изучаемый период. Расчет показателей колеблемости проведем по результатам анализа динамики индекса цен (см. табл. 9.7). Тренд примем по результатам многократного скользящего выравнивания, т. е. у ̂ = 104,53 - 1,433t ; t = 0 в 1987 г.

1. Амплитуда колебаний составила от -14,0 в 1986 г. до +15,2 в 1984 г., т.е. 29,2 пункта.

2. Среднее линейное отклонение по модулю найдем, сложив модули |u i | (их сумма равна 132,3), и разделив на (п - р), согласно формуле (9.34):

=8,82 пункта.

3. Среднее квадратическое отклонение уровней от тренда по формуле (9.35) составило:

= 9,45 пункта.

Небольшое превышение среднего квадратического отклонения над линейным указывает на отсутствие среди отклонений резко выделяющихся по абсолютной величине.

4. Коэффициент колеблемости: или 9,04%. Колеблемость умеренная, не сильная. Для сравнения приводим показатели (без расчета) по колебаниям урожайности картофеля, данные таблиц 9.1 и 9.5 - отклонение от линейного тренда:

s (t ) = 14,38 ц с 1 га, v (t ) = 8,35%.

Для выявления типа колебаний воспользуемся приемом, предложенным М. Кендэлом. Он состоит в подсчете так называемых «поворотных точек» в ряду отклонений от тренда и i т. е. локальных экстремумов. Отклонение, либо большее по алгебраической величине, либо меньшее двух соседних, отмечается точкой. Обратимся к рис. 9.2. При маятниковой колеблемости все отклонения, кроме двух крайних, будут «поворотными», следовательно, их число составит п - 1. При долгопериодических циклах на цикл приходятся один минимум и один максимум, а общее число точек составит 2(n : l ), где l - длительность цикла. При случайно распределенной во времени колеблемости, как доказал М. Кендэл, число поворотных точек в среднем составит: 2/3 (n - 2). В нашем примере при маятниковой колеблемости было бы 15 точек, при связанной с 11-летним циклом было бы 2-(17: 11) ≈ 3 точки, при случайно распределенной во времени в среднем было бы (2/3)·(17-2) =10 точек.

Фактическое число точек 6 выходит за границы двукратного среднего квадратического отклонения числа поворотных точек, которое по Кендэлу равно , в нашем случае .

Наличие 6 точек, при 2 точках за цикл, означает, что в ряду могут быть примерно 3 цикла, продолжительность периода которых 5,5 - 6 лет. Возможно сочетание таких циклических колебаний со случайными.

Другой метод анализа типа колеблемости и поиска длины цикла основан на вычислении коэффициентов автокорреляции отклонений от тренда.

Автокорреляция - это корреляция между уровнями ряда или отклонениями от тренда, взятыми со сдвигом во времени: на 1 период (год), на 2, на 3 и т. д., поэтому говорят о коэффициентах автокорреляции разных порядков: первого, второго и т. д. Рассмотрим сначала коэффициент автокорреляции отклонений от тренда первого порядка.

Одна из основных формул для расчета коэффициента автокорреляции отклонений от тренда имеет вид:

(9.36)

Как легко видеть по табл. 9.7, первое и последнее в ряду отклонения участвуют только в одном произведении в числителе, а все прочие отклонения от второго до (п - 1)-го - в двух. Поэтому и в знаменателе квадраты первого и последнего отклонений следует взять с половинным весом, как в хронологической средней. По данным табл. 9.7 имеем:

Теперь обратимся к рис. 9.2. При маятниковой колеблемости все произведения в числителе будут отрицательными величинами, и коэффициент автокорреляции первого порядка будет близок к -1. При долголериодических циклах будут преобладать положительные произведения соседних отклонений, а смена знака происходит лишь дважды за цикл. Чем длиннее Цикл, тем больше перевес положительных произведений в числителе, и коэффициент автокорреляции первого порядка ближе к +1. При случайно распределенной во времени колеблемости знаки отклонений чередуются хаотически, число положительных произведений близко к числу отрицательных, ввиду чего коэффициент автокорреляции близок к нулю. Полученное значение говорит о наличии как случайно распределенных во времени колебаний, так и циклических. Коэффициенты автокорреляции следующих порядков: II = - 0,577; Ш = -0,611; IV == -0,095; V = +0,376; VI = +0,404; VII = +0,044. Следовательно, противофаза цикла ближе всего кЗ годам (наибольший отрицательный коэффициент при сдвиге на 3 года), а совпадающие фазы ближе к б годам, что и дает длину цикла колебаний. Эти максимальные по абсолютной величине коэффициенты не близки к единице. Это означает, что циклическая колеблемость смешана со значительной случайной колеблемостью. Таким образом, подробный автокорреляционный анализ в целом дал те же результаты, что и выводы по автокорреляции первого порядка.

Если динамический ряд достаточно длинен, можно поставить и решить задачу об изменении показателей колеблемости с течением времени. Для этого рассчитывают эти показатели по подпериодам, но длительностью не менее 9-11 лет, иначе измерения колеблемости ненадежны. Кроме того, можно рассчитывать показатели колеблемости скользящим способом, а затем произвести их выравнивание, т. е. вычислить тренд показателей колеблемости. Это полезно, чтобы сделать вывод о действенности мер, применявшихся для уменьшения колебаний урожайности и других нежелательных колебаний, а также для того, чтобы по тренду сделать прогноз ожидаемых в будущем размеров колебаний.

9.8. Измерение устойчивости в динамике

Понятие «устойчивость» используется в весьма различных смыслах. По отношению к статистическому изучению динамики мы рассмотрим два аспекта этого понятия: 1) устойчивость как категория, противоположная колеблемости; 2) устойчивость направленности изменений, т. е. устойчивость тенденции.

В первом понимании показатель устойчивости, который может быть только относительным, должен изменяться от нуля до единицы (100%). Это разность между единицей и относительным показателем колеблемости. Коэффициент колеблемости составил 9,0%. Следовательно, коэффициент устойчивости равен 100% - 9,0% = 91,0%. Этот показатель характеризует близость фактических уровней к тренду и совершенно не зависит от характера последнего. Слабая колеблемость и высокая устойчивость уровней в данном смысле могут существовать даже при полном застое в развитии, когда тренд выражен горизонтальной прямой.

Устойчивость во втором смысле характеризует не сами по себе уровни, а процесс их направленного изменения. Можно узнать, например, насколько устойчив процесс сокращения удельных затрат ресурсов на производство единицы продукции, является ли устойчивой тенденция снижения детской смертности и т. д. С этой точки зрения полной устойчивостью направленного изменения уровней динамического ряда следует считать такое изменение, в процессе которого каждый следующий уровень либо выше всех предшествующих (устойчивый рост), либо ниже всех предшествующих (устойчивое снижение). Всякое нарушение строго ранжированной последовательности уровней свидетельствует о неполной устойчивости изменений.

Из определения понятия устойчивости тенденции вытекает и метод построения ее показателя. В качестве показателя устойчивости можно использовать коэффициент корреляции рангов Ч. Спирмэна (Spearman) - r x .

где п - число уровней;

Δ i - разность рангов уровней и номеров периодов времени.

При полном совпадении рангов уровней, начиная с наименьшего, и номеров периодов (моментов) времени по их хронологическому порядку коэффициент корреляции рангов равен +1. Это значение соответствует случаю полной устойчивости возрастания уровней. При полной противоположности рангов уровней рангам лет коэффициент Спирмэна равен -1, что означает полную устойчивость процесса сокращения уровней. При хаотическом чередовании рангов уровней коэффициент близок к нулю, это означает неустойчивость какой-либо тенденции. Приведем расчет коэффициента корреляции Спирмэна по данным о динамике индекса цен (табл. 9.7) в табл. 9.8.

Таблица 9.8

Расчет коэффициентов корреляции рангов Спирмена

Ранг лет, Р x

Ранг уровней, Р у

Р x y

(P x -P y ) 2

Ввиду наличия трех пар «связанных рангов» применяем формулу (8.26):

Отрицательное значение r x указывает на наличие тенденции снижения уровней, причем устойчивость этой тенденции ниже средней.

При этом следует иметь в виду, что даже при 100%-ной устойчивости тенденции в ряду динамики может быть колеблемость уровней, и коэффициент их устойчивости будет ниже 100%. При слабой колеблемости, но еще более слабой тенденции, напротив, возможен высокий коэффициент устойчивости уровней, но близкий к нулю коэффициент устойчивости тренда. В целом же оба показателя связаны, конечно, прямой зависимостью: чаще всего большая устойчивость уровней наблюдается одновременно с большей устойчивостью тренда.

Устойчивость тенденции развития или комплексная устойчивость, в динамике может быть охарактеризована соотношением между среднегодовым абсолютным изменением и средним квадратическим (либо линейным) отклонением уровней от тренда:

Если, как нередко бывает, распределение отклонений уровней ряда от тренда близко к нормальному, то с вероятностью 0,95 отклонение от тренда вниз не превысит 1,645s (t ) по величине. Следовательно, если в ряду динамики

с > 1,64, то уровни, более низкие, чем предыдущие, в среднем будут встречаться менее 5раз за 100 периодов, или 1 раз из 20, т. е. устойчивость тренда будет высока. При с = 1 нарушения ранжированности уровней будут встречаться в среднем 16 раз из 100, а при с = 0,5 – уже 31 раз из 100, т. е. устойчивость тенденции будет низкой. Можно также пользоваться отношением среднего темпа прироста к коэффициенту колеблемости, что дает показатель, близкий к с - показателю устойчивости. Этот показатель более пригоден для экспоненциального тренда. О показателях устойчивости нелинейных трендов и об общих проблемах устойчивости экономических и социальных процессов можно подробнее прочесть в рекомендуемой к данной главе литературе .

Ряда. Уравнение тренда.

Кривые роста, описывающие закономерности развития явлений во времени, - это результат аналитического выравнивания динамических рядов. Выравнивание ряда с помощью тех или иных функций (т. е. их подгонка к данным) в большинстве случаев оказывается удобным средством описания эмпирических данных. Это средство при соблюдении ряда условий можно применить и для прогнозирования. Процесс выравнивания состоит из следующих основных этапов:

Выбора типа кривой, форма которой соответствует характеру изменения динамического ряда;

Определения численных значений (оценивание) параметров кривой;

Апостериорного контроля качества выбранного тренда.

В современных ППП все перечисленные этапы реализуются одновременно, как правило, в рамках одной процедуры.

Аналитическое сглаживание с использованием той или иной функции позволяет получить выравненные, или, как их иногда не вполне правомерно называют, теоретические значения уровней динамического ряда, т. е. те уровни, которые наблюдались бы, если бы динамика явления полностью совпадала с кривой. Эта же функция с некоторой корректировкой или без нее, применяется в качестве модели для экстраполяции (прогноза).

Вопрос о выборе типа кривой является основным при выравнивании ряда. При всех прочих равных условиях ошибка в решении этого вопроса оказывается более значимой по своим последствиям (особенно для прогнозирования), чем ошибка, связанная со статистическим оцениванием параметров.

Поскольку форма тренда объективно существует, то при выявлении ее следует исходить из материальной природы изучаемого явления, исследуя внутренние причины его развития, а также внешние условия и факторы на него влияющие. Только после глубокого содержательного анализа можно переходить к использованию специальных приемов, разработанных статистикой.

Весьма распространенным приемом выявления формы тренда является графическое изображение временного ряда. Но при этом велико влияние субъективного фактора, даже при отображении выровненных уровней.

Наиболее надежные методы выбора уравнения тренда основаны на свойствах различных кривых, применяемых при аналитическом выравнивании. Такой подход позволяет увязать тип тренда с теми или иными качественными свойствами развития явления. Нам представляется, что в большинстве случаев практически приемлемым является метод, который основывается на сравнении характеристик изменения приростов исследуемого динамического ряда с соответствующими характеристиками кривых роста. Для выравнивания выбирается та кривая, закон изменения прироста которой наиболее близок к закономерности изменения фактических данных.

В табл. 4 приводится перечень наиболее употребительных при анализе экономических рядов видов кривых и указываются соответствующие «симптомы», по которым можно определить, какой вид кривых подходит для выравнивания.

При выборе формы кривой надо иметь в виду еще одно обстоятельство. Рост сложности кривой в целом ряде случаев может действительно увеличить точность описания тренда в прошлом, однако в связи с тем, что более сложные кривые содержат большее число параметров и более высокие степени независимой переменной, их доверительные интервалы будут в общем существенно шире, чем у более простых кривых при одном и том же периоде упреждения.

Таблица 4

Характер изменения показателей, основанных
на средних приростах для различных видов кривых

Показатель Характер изменения показателей во времени Вид кривой
Примерно одинаковые Прямая
Линейно изменяются Парабола второй степени
Линейно изменяются Парабола третьей степени
Примерно одинаковые Экспонента
Линейно изменяются Логарифмическая парабола
Линейно изменяются Модифицированная экспонента
Линейно изменяются Кривая Гомперца

В настоящее время, когда использование специальных программ без особых усилий позволяет одновременно строить несколько видов уравнений, широко эксплуатируются формальные статистические критерии для определения лучшего уравнения тренда.

Из сказанного выше, по-видимому, можно сделать вывод о том, что выбор формы кривой для выравнивания представляет собой задачу, которая не решается однозначно, а сводится к получению ряда альтернатив. Окончательный выбор не может лежать в области формального анализа, тем более, если предполагается с помощью выравнивания не только статистически описать закономерность поведения уровня в прошлом, но и экстраполировать найденную закономерность в будущее. Вместе с тем различные статистические приемы обработки данных наблюдения могут принести существенную пользу, по крайней мере, с их помощью можно отвергнуть заведомо непригодные варианты и тем самым существенно ограничить поле выбора.

Рассмотрим наиболее используемые типы уравнений тренда:

1.Линейная форма тренда:

где - уровень ряда, полученный в результате выравнивания по прямой;

Начальный уровень тренда;

Средний абсолютный прирост; константа тренда.

Для линейной формы тренда характерно равенство так называемых первых разностей (абсолютных приростов) и нулевые вторые разности, т. е. ускорения.

2.Параболическая (полином 2-ой степени) форма тренда:

Для данного типа кривой постоянными являются вторые разности (ускорение), а нулевыми – третьи разности.

Параболическая форма тренда соответствует ускоренному или замедленному изменению уровней ряда с постоянным ускорением. Если < 0 и > 0, то квадратическая парабола имеет максимум, если > 0 и < 0 – минимум. Для отыскания экстремума первую производную параболы по t приравнивают 0 и решают уравнение относительно t.

3.Экспоненциальная форма тренда:

где - константа тренда; средний темп изменения уровня ряда.

При > 1 данный тренд может отражать тенденцию ускоренного и все более ускоряющегося возрастания уровней ряда. При < 1 – тенденцию постоянно, все более замедляющегося снижения уровней временного ряда.

4.Гиперболическая форма тренда (1 типа):

Данная форма тренда может отображать тенденцию процессов, ограниченных предельным значением уровня.

5.Логарифмическая форма тренда:

где - константа тренда.

Логарифмическим трендом может быть описана тенденция, проявляющаяся в замедлении роста уровней ряда динамики при отсутствии предельно возможного значения. При достаточно большом t логарифмическая кривая становится мало отличимой от прямой линии.

6.Обратнологарифмическая форма тренда:

7.Мультипликативная (степенная) форма тренда:

8.Обратная (гиперболическая 2 типа) форма тренда:

9.Гиперболическая форма тренда 3 типа:

10.Полином 3-ей степени:

Для всех нелинейных, относительно исходных переменных моделей (уравнений регрессии), а их здесь большинство, требуется провести вспомогательные преобразования, представленные в таблице ниже.

Таблица 5

Модели, сводящиеся к линейному тренду

Модель Уравнение Преобразование
Мультипликативная (Степенная)
Гиперболическая I типа
Гиперболическая II типа
Гиперболическая III типа
Логарифмическая
Обратнологариф­мическая

В формулах, перечисленных в таблице, как и во всех формулах, описывающих модель тренда, есть коэффициенты уравнений.

Однако, при практическом использовании линеаризации с помощью преобразования исследуемых переменных следует иметь ввиду, что оценки параметров, полученных линеаризацией с помощью М.Н.К. (метод наименьших квадратов), минимизируют сумму квадратов отклонений для преобразованных, а не исходных переменных. Поэтому полученные с помощью линеаризации зависимостей оценки нуждаются в уточнении.

Для решения поставленной задачи по аналитическому сглаживанию динамических рядов в системе STATISTICA нам потребуется создать несколько новых дополнительных переменных, необходимых для выполнения дальнейшей работы, а также осуществить некоторые вспомогательные операции по преобразованию нелинейных моделей тренда в линейные.

Итак, нам предстоит построить уравнение тренда, которое по существу является уравнением регрессии, в котором в качестве фактора выступает «время». Прежде всего, мы создадим переменную «Т», содержащую моменты времени четвертого периода. Так как четвертый период включает 12 лет, то переменная «Т» будет состоять из натуральных чисел от 1 до 12, соответствующих месяцам года.

Кроме того, для работы с некоторыми моделями тренда нам потребуется еще несколько переменных, содержание которых можно понять из их обозначения. Это переменные, получаемые из временного ряда: «Т^2», «Т^3», «1/Т» и «ln T». А также переменные, получаемые из исходных данных за четвертый период: «1/Import4» и «ln Import4». Также необходимо создать такую же таблицу для экспорта. Все это предлагается сделать на новом рабочем листе, скопировав туда данные за 4-й период.

Для этого воспользуемся уже известным нам меню Workbook/Insert.

В итоге получаем следующие электронные таблицы.

Рис. 38. Таблица со вспомогательными переменными для импорта

Рис. 39. Таблица со вспомогательными переменными для экспорта

Для аналитического выравнивания рядов динамики мы будем использовать модуль Multiple Regression в меню Statistics. Рассмотрим пример построения графического изображения и определение численных параметров тренда, выраженного линейной зависимостью.

Рис. 40. Модуль Multiple Regression в меню Statistics

Для выбора зависимых и независимых переменных воспользуемся кнопкой Variables.

В открывшемся окне в левом информационном поле мы выбираем зависимую переменную Y t , (в нашем случае это Import 4 – данные по четвертому периоду). Номера выбранных зависимых переменных отображаются внизу в поле Dependent var. (or list for batch). Соответственно в правом поле мы выбираем независимые переменные (в нашем случае одну – время «Т»). Номера выбранных независимых переменных высвечиваются внизу в поле Independent variable list.

После того, как завершен выбор переменных, нажимаем ОК. Система выдает окно с обобщенными результатами расчета параметров тренда (далее они будут рассмотрены более подробно) и возможностью выбора направления для последующего детального анализа. Заметим, что значение оценки, высвеченное красным цветом, указывает на статистическую значимость результатов.

Рис. 41. Закладка Advanced

На закладке располагается несколько кнопок, позволяющих получить максимально детализированные сведения по интересующему нас направлению анализа. При нажатии на нее получаем две таблицы с результатами регрессионного анализа. В первой представлены результаты расчета параметров уравнения регрессии, во второй – основные показатели уравнения.

Рис. 42. Основные показатели уравнения для данных импорта за четвертый период (линейный тренд)

Здесь N = – объем результативной переменной. В верхнем поле расположены показатели R, , Adjusted R, F, p, Std.Error of Estimate , означающие соответственно теоретическое корреляционное отношение, коэффициент детерминации, уточненный коэффициент детерминации, расчетное значение критерия Фишера (в скобках дано число степеней свободы), уровень значимости, стандартная ошибка уравнения (эти же показатели можно увидеть во второй таблице). В самой таблице нас интересуют столбец В , в котором расположены коэффициенты уравнения, столбец t и столбец p-level , обозначающие расчетное значение t-критерия и расчетный уровень значимости, необходимые для оценки значимости параметров уравнения. При этом система помогает пользователю: когда процедура предполагает проверку на значимость, STATISTICA выделяет значимые элементы красным цветом (т.е. отвергается нулевая гипотеза о равенстве параметров нулю). В нашем случае |t факт | > t табл для обоих параметров, следовательно они значимы.

Рис. 43. Параметры уравнения регрессии для данных импорта за четвертый период (линейный тренд)

Для оценки статистической значимости уравнения в целом на закладке Advanced воспользуемся кнопкой ANOVA (Goodness Of Fit), позволяющей получить таблицу дисперсионного анализа и значение F-критерия Фишера.

Рис. 44. Таблица дисперсионного анализа

Sums of Squares – сумма квадратов отклонений: на пересечении со строкой Regression – сумма квадратов отклонений теоретических (полученных по уравнению регрессии) значений признака от средней величины. Эта сумма квадратов используется для расчета факторной, объясненной дисперсии зависимой переменной. На пересечении со строкой Residual – сумма квадратов отклонений теоретических и фактических значений переменной (для расчета остаточной, необъясненной дисперсии), Total – отклонений фактических значений переменной от средней величины (для расчета общей дисперсии). Столбец df – число степеней свободы, Means Squares обозначает дисперсию: на пересечении со строкой Regression – факторную, со строкой Residual - остаточную, F – критерий Фишера, используемый для оценки общей значимости уравнения и коэффициента детерминации, p-level – уровень значимости.

Параметры уравнения тренда в STATISTICA, как и в большинстве других программ, рассчитываются по метод наименьших квадратов (МНК).

Метод позволяет получить значения параметров, при которых обеспечивается минимизация суммы квадратов отклонений фактических уровней от сглаженных, т. е. полученных в результате аналитического выравнивания.

Математический аппарат метода наименьших квадратов описан в большинстве работ по математической статистике, поэтому нет необходимости подробно на нем останавливаться. Напомним только некоторые моменты. Так, для нахождения параметров линейного тренда (2.10) необходимо решить систему уравнений:

Данная система уравнений упрощается, если значения t подобрать таким образом, чтобы их сумма равнялась нулю, т. е. начало отсчета времени перенести в середину рассматриваемого периода. Очевидно, что перенос начала координат имеет смысл только при ручной обработке динамического ряда.

Если , то , .

В общем виде систему уравнений для нахождения параметров полинома можно записать как

При сглаживании временного ряда по экспоненте (которая часто используется в экономических исследованиях) для определения параметров следует применить метод наименьших квадратов к логарифмам исходных данных.

После переноса начала отсчета времени в середину ряда получают:

следовательно:

Если наблюдаются более сложные изменения уровней временного ряда и выравнивание осуществляется по показательной функции вида , то параметры определяются в результате решения следующей системы уравнений:

В практике исследования социально-экономических явлений исключительно редко встречаются динамические ряды, характеристики которых полностью соответствуют признакам эталонных математических функций. Это обусловлено значительным числом факторов разного характера, влияющих на уровни ряда и тенденцию их изменения.

На практике чаще всего строят целый ряд функций, описывающих тренд, а затем выбирают лучшую на основе того или иного формального критерия.

Рис. 45. Закладка Residuals/Assumptions/Prediction

Здесь воспользуемся кнопкой Perform Residual Analysis, открывающую модуль анализа остатков. Под остатками (Residuals) в данном случае понимается отклонение исходных значений динамического ряда от прогнозируемых, в соответствии с выбранным уравнением тренда. Сразу же переходим к закладке Advanced.

Рис. 46. Закладка Advanced в Perform Residual Analysis

Воспользуемся кнопкой Summary: Residuals & Predicted, позволяющую получить одноименную таблицу, которая содержит исходные значения динамического ряда Observed Value, прогнозируемые значения по выбранной модели тренда Predicted Value, отклонения прогнозных значений от исходных Residual Value, а также различные специальные показатели и стандартизированные значения. Также в таблице представлены максимальное, минимальное значения, средняя и медиана по каждому столбцу.

Рис. 47. Таблица, содержащая показатели и специальные значения для линейного тренда

В данной таблицы наибольший интерес для нас представляет столбец Residual Value, значения которого в дальнейшем используются для характеристики качества подбора тренда, а также столбец Predicted Value, который содержит прогнозные значения динамического ряда в соответствии с выбранной моделью тренда (в нашем случае – линейной).

Далее построим график исходного временного ряда совместно с вычисленными в соответствии с линейным уравнением тренда прогнозными значениями для четвертого периода. Для этого лучше всего скопировать значения из столбца Predicted Value в таблицу, в которой были созданы переменные для построения трендов.

Рис. 48. Третий период динамического ряда импорта (млрд. $) и линейный тренд

Итак, мы получили все необходимые результаты расчета параметров тренда, выраженного линейной моделью, для четвертого периода исходного динамического ряда, а также построили график данного ряда, совмещенный с линией тренда. Далее будут представлены остальные модели трендов.

Следует заметить, что в результате линеаризации степенной и экспоненциальной функций STATISTICA возвращает значение линеаризованной функции равное , поэтому для дальнейшего использования их надо преобразовать с помощью следующей элементарной транзакции , в том числе и для построения графических изображений. Для гиперболических функций, а также для обратнологарифмической функции необходимо выполнить преобразование вида .

Для этого также целесообразно создать дополнительные переменные и получить их с помощью формул на основе уже имеющихся переменных.

Итак, при решении задачи с помощью процедуры Multiple Regression, необходимо в качестве переменных выбрать натуральные логарифмы исходного ряда и оси времени.

Рис. 49. Основные показатели уравнения для данных импорта за третий период (степенная модель)

Рис. 50. Параметры уравнения регрессии для данных импорта за третий период (степенная модель)

Рис. 51. Таблица дисперсионного анализа

Рис. 52. Таблица, содержащая показатели и специальные значения для степенной модели

Затем, как и в случае с линейным трендом, копируем значения из столбца Predicted Value в таблицу, но там для этого строим еще одну переменную, в которой получаем прогнозные значения по степенной функции с помощью преобразования .

Рис. 53. Создание дополнительной переменной

Рис. 54. Таблица со всеми переменными

Рис. 55. Третий период динамического ряда импорта (млрд. $) и степенная модель

Рис.56. Основные показатели уравнения для данных импорта за третий период (экспоненциальная модель)

Рис. 57. Третий период динамического ряда импорта (млрд. $) и экспоненциальная модель

Рис.58. Основные показатели уравнения для данных импорта за третий период (обратная модель)

Рис. 59. Третий период динамического ряда импорта (млрд. $) и обратная модель

Рис. 60. Основные показатели уравнения для данных импорта за третий период (полином второй степени)

Рис. 61. Третий период динамического ряда импорта (млрд. $) и полином второй степени

Рис. 62. Основные показатели уравнения для данных импорта за третий период (полином 3-й степени)

Рис. 63. Третий период динамического ряда импорт (млрд. $) и полином 3-й степени


Рис. 64. Основные показатели уравнения для данных импорта за третий период (гипербола 1-ого вида)

Рис. 65. Третий период динамического ряда импорт (млрд. $) и гипербола 1-ого вида


Рис. 66. Основные показатели уравнения для данных импорта за третий период (гипербола 3 типа)

Рис. 67. Третий период динамического ряда импорт и гипербола 3 типа


Рис. 68. Основные показатели уравнения для данных импорта за третий период (логарифмическая модель)

Рис. 69. Третий период динамического ряда импорт (млрд. $) и логарифмическая модель


Рис. 70. Основные показатели уравнения для данных импорта за третий период (обратнологарифмическая модель)

Рис. 71. Третий период динамического ряда импорт (млрд. $) и обратнологарифмическая модель


Затем построим таблицу со вспомогательными переменными для построения трендов для экспорта.

Рис. 72. Таблица со вспомогательными переменными

Проделаем те же операции что и для четвертого период импорта.

Рис. 73. Основные показатели уравнения для данных экспорта за третий период (линейная модель)

Рис. 74. Третий период динамического ряда экспорта (млрд. $) и линейная модель

Рис. 75. Основные показатели уравнения для данных экспорта за третий период (степенная модель тренда)

Рис. 76. Третий период динамического ряда экспорта и степенная модель


Рис. 77. Основные показатели уравнения для данных экспорта за третий период (экспоненциальная модель тренда)

Рис. 78. Третий период динамического ряда экспорта (млрд. $) и экспоненциальная модель


Рис. 79. Основные показатели уравнения для данных экспорта за третий период (обратная модель тренда)

Рис. 80. Третий период динамического ряда экспорта (млрд. $) и обратная модель


Рис. 81. Основные показатели уравнения для данных экспорта за третий период (полином второй степени)

Рис. 82. Третий период динамического ряда экспорта (млрд. $) и полином второй степени


Рис. 83. Основные показатели уравнения для данных экспорта за третий период (полином третей степени)

Рис. 84. Третий период динамического ряда экспорта (млрд. $) и полином третей степени


Рис. 85. Основные показатели уравнения для данных экспорта за третий период (гипербола 1-ого вида)

Рис. 86. Третий период динамического ряда экспорта и гипербола 1-ого типа


Рис. 87. Основные показатели уравнения для данных экспорта за третий период (гипербола 3-ого вида)

Рис. 88. Третий период динамического ряда экспорта (млрд. $) и гипербола 3-ого типа


Рис. 89. Основные показатели уравнения для данных экспорта за третий период (логарифмическая модель)

Рис. 90. Третий период динамического ряда экспорта (млрд. $) и логарифмическая модель


Рис. 91. Основные показатели уравнения для данных экспорта за третий период (обратнологарифмическая модель)

Рис. 91. Третий период динамического ряда экспорта (млрд. $) и обратнологарифмическая модель


Выбор наилучшего тренда

Как уже отмечалось, проблема выбора формы кривой - одна из основных проблем, с которой сталкиваются при выравнивании ряда динамики. Решение этой проблемы во многом определяет результаты экстраполяции тренда. В большинстве специализированных программ для выбора лучшего уравнения тренда предоставляется возможность воспользоваться следующими критериями:

Минимальное значение среднеквадратической ошибки тренда:

,

где - фактические уровни ряда динамики;

Уровни ряда, определенные по уравнению тренда;

n - число уровней ряда;

p - число факторовв уравнении тренда.

- минимальное значение остаточной дисперсии:

Минимальное значение средней ошибки аппроксимации;

Минимальное значение средней абсолютной ошибки;

Максимальное значение коэффициента детерминации;

Максимальное значение F- критерия Фишера:

: ,

где k – число степеней свободы факторной дисперсии,равное числу независимых переменных (признаков-факторов) в уравнении;

n-k-1 - число степеней свободы остаточной дисперсии.

Применение формального критерия для выбора формы кривой, по-видимому, даст практически пригодные результаты в том случае, если отбор будет проходить в два этапа. На первом этапе отбираются зависимости, пригодные с позиции содержательного подхода к задаче, в результате чего происходит ограничение круга потенциально приемлемых функций. На втором этапе для этих функций подсчитываются значения критерия и выбирается та из кривых, которой соответствует минимальное его значение.

В данном пособии для идентификации тренда используется формальный метод, который основывается на использовании численного критерия. В качестве такого критерия рассматривается максимальный коэффициент детерминации:

.

Расшифровка обозначений и формулы данных показателей даны в предыдущих разделах. Коэффициент детерминации показывает, какая доля общей дисперсии результативного признака обусловлена вариацией признака – фактора. В таблицах STATISTICA он обозначается как R?.

В следующей ниже таблице будут представлены уравнения моделей трендов и коэффициенты детерминации данных импорта.

Таблица 6

Уравнения моделей трендов и коэффициенты детерминации Import.

Сопоставив значения коэффициентов детерминации для различных типов кривых можно сделать вывод о том, что для исследуемого третьего периода лучшей формой тренда будет полином третей степени для импорта и для экспорта.

Далее необходимо проанализировать выбранную модель тренда с точки зрения ее адекватности реальным тенденциям исследуемого временного ряда через оценку надежности полученных уравнений трендов по F-критерию Фишера. В данном случае расчетное значение критерия Фишера для импорта равно 16,573; для экспорта – 13,098, а табличное значение при уровне значимости равно 3,07. Следовательно, эта модель тренда признается адекватно отражающей реальную тенденцию изучаемого явления.

Линейное уравнение тренда имеет вид y = at + b.

Параметры уравнений функции тренда находят с помощью теории корреляции методом наименьших квадратов.

1.Метод наименьших квадратов.
Метод наименьших квадратов МНК), является одним из способов противостоять ошибкам измерений.(Как в Физике погрешность отклонений)
Этот метод как правило используют для нахождения параметров уравнений (Линий, гипербол парабол и т.д.)
Этот способ заключается в минимизации суммы квадратов отклонений.
Смысл МНК можно выразить через вот этот график

2. Анализ точности определения оценок параметров уравнения тренда(по таблице стьюдента находим ТТабл и делаем интервальный прогноз,т.е. выявляем реднеквадратическую ошибку)

3.Проверка гипотез относительно коэффициентов линейного уравнения тренда(статистика критерий стьюдента,фишера)

Проверка на наличие автокорреляции остатков.
Важной предпосылкой построения качественной регрессионной модели по МНК является независимость значений случайных отклонений от значений отклонений во всех других наблюдениях. Это гарантирует отсутствие коррелированности между любыми отклонениями и, в частности, между соседними отклонениями.
Автокорреляция (последовательная корреляция) Автокорреляция остатков (отклонений) обычно встречается в регрессионном анализе при использовании данных временных рядов и очень редко при использовании перекрестных данных.
Проверка наличия гетероскедастичности .
1) Методом графического анализа остатков .
В этом случае по оси абсцисс откладываются значения объясняющей переменной X, а по оси ординат либо отклонения e i , либо их квадраты e 2 i .
Если имеется определенная связь между отклонениями, то гетероскедастичность имеет место. Отсутствие зависимости скорее всего будет свидетельствовать об отсутствии гетероскедастичности.
2) При помощи теста ранговой корреляции Спирмена.
Коэффициент ранговой корреляции Спирмена.

36. Методы измерения устойчивости тенденций динамики (коэффициент рангов Спирмена).

Понятие «устойчивость» используется в весьма различных смыслах. По отношению кстатистическому изучению динамики мы рассмотрим два аспекта этого понятия: 1) устойчивостькак категория, противоположная колеблемости; 2) устойчивость направленности изменений, т.е. устойчивость тенденции.

Устойчивость во втором смысле характеризует не сами по себе уровни, а процесс ихнаправленного изменения. Можно узнать, например, насколько устойчив процесс сокращенияудельных затрат ресурсов на производство единицы продукции, является ли устойчивойтенденция снижения детской смертности и т. д. С этой точки зрения полной устойчивостьюнаправленного изменения уровней динамического ряда следует считать такое изменение, впроцессе которого каждый следующий уровень либо выше всех предшествующих (устойчивыйрост), либо ниже всех предшествующих (устойчивое снижение). Всякое нарушение строгоранжированной последовательности уровней свидетельствует о неполной устойчивостиизменений.


Из определения понятия устойчивости тенденции вытекает и метод построения ее показателя.В качестве показателя устойчивости можно использовать коэффициент корреляции рангов Ч.Спирмэна (Spearman) - rx.

где п - число уровней;

I - разность рангов уровней и номеров периодов времени.

При полном совпадении рангов уровней, начиная с наименьшего, и номеров периодов (моментов)времени по их хронологическому порядку коэффициент корреляции рангов равен +1. Этозначение соответствует случаю полной устойчивости возрастания уровней. При полнойпротивоположности рангов уровней рангам лет коэффициент Спирмэна равен -1, что означаетполную устойчивость процесса сокращения уровней. При хаотическом чередовании ранговуровней коэффициент близок к нулю, это означает неустойчивость какой-либо тенденции.

Отрицательное значение rx указывает на наличие тенденции снижения уровней, причемустойчивость этой тенденции ниже средней.

При этом следует иметь в виду, что даже при 100%-ной устойчивости тенденции в рядудинамики может быть колеблемость уровней, и коэффициент их устойчивости будет ниже100%. При слабой колеблемости, но еще более слабой тенденции, напротив, возможен высокийкоэффициент устойчивости уровней, но близкий к нулю коэффициент устойчивости тренда. Вцелом же оба показателя связаны, конечно, прямой зависимостью: чаще всего большаяустойчивость уровней наблюдается одновременно с большей устойчивостью тренда.

37. Моделирование тенденции ряда динамики при наличии структурных изменений.

От сезонных и циклических колебаний следует отличать единовременные изменения характера тенденции временного ряда, вызванные структурными изменениями в экономике или иными факторами. В этом случае, начиная с некоторого момента времени t, происходит изменение характера динамики изучаемого показателя, что приводит к изменению параметров тренда, описывающего эту динамику.

Момент t сопровождается значительными изменениями ряда факторов, оказывающих сильное воздействие на изучаемый показатель Моделирование тенденции временного ряда при наличии структурных изменений.. Чаще всего эти изменения вызваны изменениями в общеэкономической ситуации или событиями глобального характера, приведшими к изменению структуры экономики. Если исследуемый временной ряд включает в себя соответствующий момент времени, то одной из задач его изучения становится выяснение вопроса о том, значительно ли повлияли общие структурные изменения на характер этой тенденции.

Если это влияние значимо, то для моделирования тенденции данного временного ряда следует использовать кусочно-линейные модели регрессии, т.е. разделить исходную совокупность на 2 подсовокупности (до момента времени t и после) и строить отдельно по каждой подсовокупности уравнения линейной регрессии.

Если структурные изменения незначительно повлияли на характер тенденции ряда Моделирование тенденции временного ряда при наличии структурных изменений., то ее можно писать с помощью единого для всей совокупности данных уравнения тренда.

Каждый из описанных выше подходов имеет свои положительные и отрицательные стороны. При построении кусочно-линейной модели снижается остаточная сумма квадратов по сравнению с единым для всей совокупности уравнением тренда. Но разделение совокупности на части ведет к потере числа наблюдений, и к снижению числа степеней свободы в каждом уравнении кусочно-линейной модели. Построение единого уравнения тренда позволяет сохранить число наблюдений исходной совокупности, но остаточная сумма квадратов по этому уравнению будет выше по сравнению с кусочно-линейной моделью. Очевидно, что выбор модели зависит от соотношения между снижением остаточной дисперсии и потерей числа степеней свободы при переходе от единого уравнения регрессии к кусочно-линейной модели.

38. Регрессионный анализ связных динамических рядов.

Многомерные временные ряды, показывающие зависимость результативного признака от одного или нескольких факторных, называютсвязными рядами динамики. Применение методов наименьших квадратов для обработки рядов динамики не требует выдвижения никаких предположений о законах распределения исходных данных. Однако при использовании метода наименьших квадратов для обработки связных рядов следует учитывать наличие автокорреляции (авторегрессии), которая не учитывалась при обработке одномерных рядов динамики, поскольку ее наличие способствовало более плотному и четкому выявлению тенденции развития рассматриваемого социально – экономического явления во времени.

Выявление автокорреляции в уровнях ряда динамики

В рядах динамики экономических процессов между уровнями, особенно близко расположенными, существует взаимосвязь. Ее удобно представить в виде корреляционной зависимости между рядами y1,y2,y3,…..yn h y1+h, y2+h,…, yn+h. Временное смещение L называется сдвигом,а само явление взаимосвязи – автокорреляцией.

Автокорреляционная зависимость особенно существенна между последующими и предшествующими уровнями ряда динамики.

Различают два вида автокорреляции:

Автокорреляция в наблюдениях за одной или более переменными;

Автокорреляция ошибок или автокорреляция в отклонениях от тренда.

Наличие последней приводит к искажению величин средних квадратических ошибок коэффициентов регрессии, что затрудняет построение доверительных интервалов для коэффициентов регрессии, а так же проверку их значимости.

Автокорреляцию измеряют при помощи циклического коэффициента автокорреляции, который может рассчитываться не только между соседними уровнями, т.е. сдвинутыми на один период, но и между сдвинутыми на любое число единиц времени (L). Этот сдвиг, именуемыйвременным лагом, определяет и порядок коэффициентов автокорреляции: первого порядка (при L=1), второго порядка (при L=2) и т.д. Однако наибольший интерес для исследования представляет вычисление нециклического коэффициента (первого порядка), так как наиболее сильные искажения результатов анализа возникают при корреляции между исходными уровнями ряда и теми же уровнями, сдвинутыми на одну единицу времени.

Для суждения о наличии или отсутствия автокорреляции в исследуемом ряду фактическое значение коэффициентов автокорреляции сопоставляется с табличным (критическим) для 5% - го или 1% - го уровня значимости.

Если фактическое значение коэффициента автокорреляции меньше табличного, то гипотеза об отсутствии автокорреляции в ряду может быть принята. Когда же фактическое значение больше табличного, можно сделать вывод о наличии автокорреляции в ряду динамики.

а) Методы выделения тренда. Анализ значимости тренда. Выделение остатков и их анализ.

Одним из важнейших понятий технического анализа является понятие тренда. Слово тренд - калька с английского trend (тенденция). Однако точного определения тренда в техническом анализе не дается. И это не случайно. Дело в том, что тренд или тенденция временного ряда - это несколько условное понятие. Под трендом понимают закономерную, неслучайную составляющую временного ряда (обычно монотонную, т.е. либо возрастающую, либо убывающую), которая может быть вычислена по вполне определенному однозначному правилу. Тренд реального временного ряда часто связан с действием природных (например, физических) законов или каких-либо других объективных закономерностей. Однако, вообще говоря, нельзя однозначно разделить случайный процесс или временной ряд на регулярную часть (тренд) и колебательную часть (остаток). Поэтому обычно предполагают, что тренд - это некоторая функция или кривая достаточно простого вида (линейная, квадратичная и т.п.), описывающая «среднее поведение» ряда или процесса. Если оказывается, что выделение такого тренда упрощает исследование, то предположение о выбранной форме тренда считается допустимым. B техническом анализе обычно предполагается, что тренд линеен (и его график - прямая линия) или кусочно линеен (и тогда его график - ломаная линия).

Предположим, что реализация временного ряда в моменты времени Т=t1, t2,...tN принимает значения X=x1,х2,...xN. Линейный тренд имеет уравнение x=at+b. Известны специальные методы нахождения коэффициентов а и b этого уравнения. В том техническом анализе, который описывается в большинстве книг, тренд находится некоторыми графическими или несложными приближенными приемами. Однако в современной практике широко используются компьютеры, которые за считанные секунды могут по заданному массиву данных выписать точное уравнения тренда заданного вида (в частности, линейного тренда).

Для временного ряда общее уравнение линейного тренда имеет вид:

Величина МТ - среднее значение моментов времени t1, t2,...tN. Выбирая подходящую единицу времени, мы всегда можем считать, что t1, t2... - это просто натуральные числа 1,2.... Например, так будет для ценового ряда, в котором цены на акции фиксируется ежедневно на момент начала торгов, если за единицу времени взять один день. В таком случае:

Величины от и о называются средними квадратичными отклонениями, они характеризуют разброс значений вокруг средних значений МТ и MX величин Т и X соответственно. Вычисление о вручную довольно утомительно, особенно для больших массивов данных. Однако все компьютерные программы, ориентированные на финансовые приложения, и даже такие универсальные программы, как Excel (не говоря уж о специальных статистических пакетах, таких как SPSS, Statistica, Statgraphics и др.) дают возможность мгновенно вычислить о для любого массива данных, который введен в память компьютера (и записан в некоторой определенной форме). Что касается величины от, то для случая ряда натуральных чисел она равна:

Величина г играет в формуле тренда ключевую роль. Она называется коэффициентом корреляции (другое название: нормированный коэффициент корреляции) и характеризует степень взаимосвязи переменных Х и Т. Коэффициент корреляции принимает значения в промежутке от - 1 до +1. Если он близок к нулю, то это значит, что нет возможности выделить значимый линейный тренд. Если он положителен, то есть тенденция роста изучаемого индекса, причем, чем ближе г к единице, тем эта тенденция становится все более определенной. При отрицательном г имеем тенденцию к убыванию.

Вычисление г весьма громоздко, но современный компьютер делает это практически мгновенно.

При r>0 говорят о положительном тренде (с течением времени значения временного ряда имеет тенденцию возрастать), при r

Знаете ли Вы, что: самые успешные в Рунете управляющие ПАММ-счетами осуществляют свою деятельность через компанию Альпари: рейтинг ПАММ-счетов ; рейтинг готовых портфелей ПАММ-счетов .

После вычисления линейного тренда нужно выяснить, насколько он значим. Это делается с помощью анализа коэффициента корреляции. Дело в том, что отличие коэффициента корреляции от нуля и тем самым наличие тренда (положительного или отрицательного) может оказаться случайным, связанным со спецификой рассматриваемого отрезка временного ряда. Иначе говоря, при анализе другого набора экспериментальных данных (для того же временного ряда) может оказаться, что полученная при этом оценка величины г намного ближе к нулю, чем исходная (и, возможно, даже имеет другой знак), и говорить о реальном, выраженном тренде тут уже становится трудно.

Для проверки значимости тренда в математической статистике разработаны специальные методики. Одна из них основана на проверке равенства г = 0 с помощью распределения Стьюдента (Стьюдент - это псевдоним английского статистика У.Госсета).

Предположим, что имеется набор экспериментальных данных - значения х1, х2,...xN временного ряда в равноотстоящие моменты времени t1, t2...tN. С помощью специальных программ (см. выше) по этим данным можно вычислить приближение г* к точному значению г коэффициента корреляции (это приближение называют оценкой). Назовем это значение г* экспериментальным. Общая идея метода статистической проверки гипотез такова. Выдвигается некоторая гипотеза, в нашем случае это гипотеза о равенстве нулю коэффициента корреляции. Далее, задается некоторый уровень вероятности а. Смысл этой величины заключается в том, что она является вероятностной мерой допустимой ошибки. А именно, мы допускаем, что сделанный нами вывод о справедливости или несправедливости гипотезы на основании заданного массива экспериментальных данных может оказаться ошибочным, ибо абсолютно точного вывода на основании лишь частичной информации ожидать, конечно, не стоит. Однако мы можем потребовать, чтобы вероятность этой ошибки не превосходила некоторой заранее выбранной величины а (уровня вероятности). Обычно берут ее значение равным 0.05 (т.е. 5%) или 0.10, иногда прут и 0.01. Событие, вероятность которого меньше, чем а, считается настолько редким, что мы берем на себя смелость им пренебрегать. Для временных рядов разной природы эту величину выбирают по-разному. Если речь идет о ряде цен на акции какой-то небольшой фирмы, то риск ошибиться не несет катастрофических последствий (для независимых от этой фирмы участников торгов) и потому а можно взять не очень маленьким. Если же речь идет о крупной сделке, то последствия ошибки могут быть очень тяжелыми и значение а берут поменьше.

Можно доказать, что при достаточно больших значениях N эта величина Uэкс (тоже являющаяся случайной) очень похожа на одну из стандартных случайных величин, используемых в математической статистике или, как говорят в математической статистике, близка к распределению Стьюдента с числом степеней свободы k (так называется параметр, задающий распределение Стьюдента), равным N-2, где N-число экспериментальных данных.

Для распределения Стьюдента имеются подробные таблицы, в которых для заданного уровня вероятности а и числа степеней свободы k указывается критическое значение Икр. Критическим или граничным оно называется потому, что ограничивает двустороннюю (учитывающую и положительные и отрицательные значения) область, вне которой значения случайной величины могут оказаться достаточно редко, с вероятностью не большей, чем а. Точнее, при условии г = 0 имеет место равенство:

В настоящее время значение Uкр можно находить не только из таблиц (где оно приводится только лишь для некоторых отдельных значений уровня вероятности - см. Табл. 2 ниже). Любая современная статистическая программа для компьютера дает возможность мгновенно вычислить Uкр для произвольного заданного уровня вероятности. Как нетрудно понять, с ростом величины а значения Uкр тоже растут.

Далее рассуждают следующим образом. Предположим, что число N достаточно велико. Тогда случайная величина 0зкс распределена приблизительно по закону Стьюдента. Если г = 0, то с большой (т.е. близкой к 1) вероятностью, равной 1 - а, значение Uэкс должно по модулю не превосходить Uкр, т.е. лежать между - кр и Uкр. А вот выходить за пределы отрезка [-Uкр, Uкр] величина Uзкс может только с вероятностью а (которую мы согласились считать малой). Поэтому если I Uзкс I > Uкр, то делают заключение о том, что гипотеза г = 0 экспериментальными данными не подтверждается, т.е. г значимо отличен от нуля и потому тренд является выраженным. Вероятность ошибки такого заключения не превосходит заданного уровня вероятности а. Если же | Uзкс | Например, пусть г*= 0.20 и N= 20. Тогда вычисление дает Uэкс = 0.87. Для уровня вероятности 5% находим из таблицы распределения Стьюдента Uкр = 2.10. Сравнивая Uэкс и Uкр, видим, что тут гипотезу о равенстве нулю коэффициента корреляции отвергать нет основания. Тренд здесь не является выраженным.

Если в результате исследования выяснилось, что тренд является выраженным, то только тогда можно этот тренд использовать для прогнозирования временного ряда. Вычислив коэффициенты а и b уравнения линейного тренда, указанные выше, получаем линейную зависимость, которая на некотором промежутке времени приблизительно описывает тенденцию динамики временного ряда. Графиком является прямая линия, продолжив которую в будущее, мы можем делать предположения о том, каковы будут значения временного ряда в будущем. Однако тенденции имеют свойства меняться, поэтому в какой-то момент времени в поведении временного ряда наступает перелом, после которого старое уравнение тренда уже не может описывать адекватно временной ряд. Сложность заключается в том, что уловить этот переломный момент очень непросто. Исследование линейного тренда ничего не говорит о наличии в будущем точек поворота, так что при их поиске приходится использовать совсем другие методы. О некоторых из них будет сказано ниже.

Кроме линейного тренда, приходится рассматривать и тренды более сложной структуры. В техническом анализе в таких случаях говорят о замедлении или ускорении линейного тренда, как бы признавая, что он утратил свою линейность. При этом заранее указать ту функцию, с помощью которой можно описать этот тренд, обычно не представляется реальным. Поэтому часто на практике просто перебирают несколько простых функциональных зависимостей (которые могут содержать несколько параметров) и для каждой из них оценивают, насколько успешно функцией того или иного вида можно описать тенденцию рассматриваемого временного ряда. При наличии компьютера эти вычисления не занимают много времени, а иногда могут проводиться даже в автоматическом режиме, выделяющем среди нескольких заданных видов трендов оптимальный. Однако далеко не всегда среди рассмотренных функций есть та, которая действительно достаточно эффективно описывает тенденцию развития заданного временного ряда. В этом случае приходится идти другими путями. Так, часто в подобной ситуации производят различные преобразования членов временного ряда (логарифмирование, «дифференцирование» - образование разностей соседних членов ряда, «интегрирование» - суммирование последовательных членов ряда и др.) для того, чтобы попытаться получить временной ряд с ясно выраженным линейным трендом. Если это удается, то к полученному ряду применяют методы вычисления тренда, описанные выше, а потом обратным преобразованием возвращаются к исходному ряду.

б) Методы выявления скрытых зависимостей. Корреляционный анализ временных рядов. Спектральный анализ и его применения.

После того, как выявлен тренд, остается задача описать те колебания, которые временной ряд совершает вокруг этого тренда. Ведь ясно, что тренд - это просто тенденция, на ней основывать прогнозы рискованно, так как в разные промежутки времени реальная ситуация может отклоняться, причем весьма значительно, от тренда в ту или иную сторону. При этом отклонение в одну сторону может принести прибыль, а в другую - убытки. В техническом анализе в этом случае говорят об осцилляторах. Методика анализа осцилляторов до самого недавнего времени находилась на очень низком, практически на доматематическом уровне. Только в последние годы с приходом вычислительной техники и специалистов, имеющих хорошее математическое образование (они до сих пор реализовывали его в оборонной промышленности, которая во всем мире сейчас находится в упадке) при анализе осцилляторов стали использоваться достаточно современные методы (основанные на гармоническом и спектральном анализе).

Колебания вокруг тренда разделяют на регулярные (являющиеся комбинацией нескольких синусоидальных или близких к ним колебаний, имеющих разные частоты) и случайные. Для выделения регулярных колебаний (их еще иногда называют скрытыми закономерностями) в математике по "заказам" большого числа прикладных наук разработано множество разных методов. Даже просто перечислить их нет никакой возможности. Однако все эти методы принадлежат обычно к одной из двух больших групп.

В первой группе - методы, своим происхождением обязанные математической статистике, а точнее - теории корреляции. Теория корреляции изучает связи между случайными величинами, а также связи между отдельными значениями временных рядов, разделенных определенным промежутком времени (лагом). Если оказывается, например, что имеется тесная связь между значениями временного ряда, разделенными промежутком времени в 12 единиц, то это можно рассматривать как указание на то, что мы обнаружили колебательную компоненту (не обязательно точно синусоидальную) с периодом в 12 единиц времени. Практически такой анализ производят с помощью специальных программ, которые производят вычисление кореллограммы - оценки для функции корреляции (которая описывает корреляцию между значениями временного ряда, взятыми через всевозможные интервалы времени - лаги).

Вторая группа методов пришла из техники - там при анализе сигналов давно и с успехом используется спектральный анализ. С помощью специальных методов (разложения в тригонометрические ряды и интегралы Фурье) производится выделение наиболее значимых гармоник, которые и дают регулярную часть колебаний вокруг тренда. Здесь вычисления еще более громоздкие, чем в корреляционном анализе. однако ныне об этих сложностях можно совершенно забыть (компьютер производит все необходимые расчеты за несколько секунд). Поэтому настало время учиться анализировать те данные, которые предоставляет спектральный анализ и строить на основании этих данных прогнозы. Эти методы довольно чувствительны к погрешностям в задании исходных данных и потому иногда приводят к заключениям о наличии закономерностей в изучаемом процессе, которых на самом деле нет.

в) Стохастическое прогнозирование (модели ARIMA).

Стохастическое прогнозирование - построение прогнозов на основе разного рода стохастических моделей. Стохастическим модели - это такие модели, которые сконструированы с помощью понятий и методов теории случайных процессов. В частности, среди этих моделей имеются те, в которых будущие значения вычисляются с помощью формул, выражающих эти значения через несколько предыдущих (т.е. соответствующих предшествующим моментам времени) значений. Такого рода модели называют авторегрессионными. Есть модели и другого рода - в них процесс моделируется комбинацией нескольких абсолютно случайных процессов (называемых белым шумом). Эти модели называют моделями скользящего среднего. Понятие скользящего среднего в техническом анализе является одним из основных инструментов, Огромное число прогностических методик основано на различных комбинациях скользящих средних разных порядков" (соответствующих разным временным отрезкам - 7, 14 дней и др.). В инженерной практике сходный метод называется фи-" льтрацией сигнала. Наиболее эффективные модели используют оба указанных метода. Одна из самых распространенных. комбинированных моделей такого рода - это ARIMA. По-русски это звучит, как АРПСС и расшифровывается как Авто-Регрессия и Проинтегрированное Скользящее Среднее. Мы не будем здесь входить в подробности построения этих моделей - они достаточно сложны. Для тех, кто хочет всерьез ознакомиться с этим, самым эффективным классом стохастических моделей, рекомендуем обратиться к книге "Статистический анализ данных на компьютере" . Непосредственные вычисления в ARIAL производятся только с применением компьютера, так как они очень громоздки. Метод ARIMA является наиболее распространенным общим методом стохастического моделирования во многих областях, в том числе и при серьезном подходе к анализу данных и прогнозированию финансовой деятельности. После построения стохастической модели ее можно использовать для прогнозирования. Однако следует отметить, что прогноз в этой (как и во всех других математических моделях) выдается с указанными границами, в пределах которых возможна ошибка.

На приведенной диаграмме (она построена с помощью программы Statgraphics) указан прогноз, получаемый с помощью стохастической модели. Он состоит из основной линии и двух граничных, между которыми с заданной степенью уверенности (называемой доверительной вероятностью, она обычно равна 95%) будут находиться члены исследуемого временного ряда (например, ряда цен) в ближайшем будущем.

г) Использование чисел Фибоначчи. Методы Ганна.

Использование чисел Фибоначчи в техническом анализе имеет довольно давнюю историю. Сами зти числа были введены математиком Леонардо Пизанским (его называли Фибоначчи, - т.е. сын Боначчо, а Боначчо - добродушный - было прозвищем его отца) в его "Книге абака" в 1228 году, где он их использовал для вычисления роста потомства у Кроликов. На самом деле этот ряд чисел был известен еще в древнем Египте. В книге Фибоначчи приведены первые 14 чисел этого бесконечного ряда чисел.

Каждое число в этой последовательности равно сумме двух предыдущих. Первыми двумя числами берутся 1 и 1, а се последующие однозначно определяются с помощью указанного выше правила. Числа Фибоначчи особенно хорошо известны в развлекательной части математики, а также в некоторых разделах современной математики (издается даже международный математический журнал Fibonacci Quarterly, посвященный числам Фибоначчи и их применениям). Можно доказать, что отношение каждого числа Фибоначчи к последующему с ростом порядкового номера этого числа стремится к числу 0.618... - к знаменитому числу золотого сечения. Это число пользовалось огромной популярностью еще в средние века, а сейчас ему придается чуть ли не фундаментальное значение во многих областях искусства и науки. Однако очень часто на самом деле оказывается, что важную роль играет не само это число, а близкое к нему число 2/3 = 0.666666... Число 2/3 действительно фундаментально, оно символизирует троичное деление, а вот число золотого сечения часто используется просто "для красоты".

В техническом анализе есть несколько методов, которые связаны с использованием числа золотого сечения и нескольких производных от него чисел. Прежде всего можно отметить, что продолжительности отдельных элементов (волн) в волновой теории Р.Эллиотта (о которой будет рассказано ниже) связываются между собой именно с помощью этого числа. Кстати, само разделение цикла на 8=5+3 этапов в волновой теории указывает на числа Фибоначчи 3,5,8.

В техническом анализе для делений (вертикальными и наклонными прямыми) чарта используют число 0.618... и производные от него числа (например (0.61 8...] = 1-0.61 8...= 0382...). Например, строится сетка, соотношение сторон которой равно числу золотого сечения или отношению чисел Фибоначчи (что, как мы уже знаем, примерно одно и то же). Относительно этой сетки и изучаются отдельные элементы чарта (линии сопротивления и поддержки, точки поворота и другие характерные точки). Вертикальные линии этой сетки задают периоды Фибоначчи (причем в литературе рекомендуется игнорировать первые две-три линии этого разбиения). Можно также строить отдельные наклонные линии, тоже задаваемые числами Фибоначчи. Эти линии проводятся от ключевых точек графика (например, от точек поворота). Считается, что линии Фибоначчи сохраняют свое действие некоторое время и после изменения тренда, что позволяет использовать эти линии для прогнозирования. Однако во всех этих случаях можно просто использовать число 2/3 и получить ничуть не худшие результаты (хотя, может быть и не столь эффектно оформленные, как при использовании золотого сечения). С помощью таких делений иногда удается весьма эффективно описать движения цен. Однако при резком развороте рынка приходится заново перерисовывать все линии Фибоначчи.

Подробную систему графического анализа чартов разработал Уильям Ганн (1878-1955), который одним из первых стал использовать в техническом анализе геометрические методы. Он строил наклонные линии (линии Ганна), задаваемые числами 1/8, 1/4, 1/3, 3/8, 1/2, 5/8, 2/3, 3/4, 7/8, и использовал их, в частности, для нахождения линий сопротивления и поддержки - фундаментальных линий в графическом техническом анализе. При приближении к этим линиям Ценовой ряд прекращает рост (для линии сопротивления) или падение (для линий поддержки) или, по крайней мере, сильно замедляет их. При некотором желании среди этих чисел можно найти такие, которые приближенно выражаются через число золотого сечения и на этом основании сделать вывод, что это замечательное число и здесь играет основную роль. Однако идея Ганна была намного проще - он просто выписал последовательность тех чисел в отрезке , которые задаются достаточно простыми дробями.

Ганн строил лучи, исходящие их характерных точек чарта (обычно из точек поворота), чтобы получать линии сопротивления и поддержки. Самое трудное здесь - правильно выбрать исходную точку линий Ганна. Можно комбинировать сетку Фибоначчи и линии Ганна. Эти методы реализованы во многих программах технического анализа (таких, как, например, MetaStock).

Кривые роста, описывающие закономерности развития явлений во времени – это результат аналитического выравнивания динамических рядов. Выравнивание ряда с помощью тех или иных функций в большинстве случаев оказывается удобным средством описания эмпирических данных. Это средство при соблюдении ряда условий можно применить и для прогнозирования. Процесс выравнивания состоит из следующих основных этапов:

Выбора типа кривой, форма которой соответствует характеру изменения динамического ряда;

Определения численных значений (оценка) параметров кривой;

Апостериорного контроля качества выбранного тренда.

В современных ППП все перечисленные этапы реализуются одновременно, как правило, в рамках одной процедуры.

Аналитическое сглаживание с использованием той или иной функции позволяет получить выровненные, или, как их иногда не вполне правомерно называют, теоретические значения уровней динамического ряда, т. е. уровни, которые наблюдались бы, если бы динамика явления полностью совпадала с кривой. Эта же функция с некоторой корректировкой или без нее, применяется в качестве модели для экстраполяции (прогноза).

Вопрос о выборе типа кривой является основным при выравнивании ряда. При всех прочих равных условиях ошибка в решении этого вопроса оказывается более значимой по своим последствиям (особенно для прогнозирования), чем ошибка, связанная со статистическим оцениванием параметров.

Поскольку форма тренда объективно существует, то при выявлении ее следует исходить из материальной природы изучаемого явления, исследуя внутренние причины его развития, а также внешние условия и факторы на него влияющие. Только после глубокого содержательного анализа можно переходить к использованию специальных приемов, разработанных статистикой.

Весьма распространенным приемом выявления формы тренда является графическое изображение временного ряда. Но при этом велико влияние субъективного фактора, даже при отображении выровненных уровней.

Наиболее надежные методы выбора уравнения тренда основаны на свойствах различных кривых, применяемых при аналитическом выравнивании. Такой подход позволяет увязать тип тренда с теми или иными качественными свойствами развития явления. Нам представляется, что в большинстве случаев практически приемлемым является метод, который основывается на сравнении характеристик изменения приростов исследуемого динамического ряда с соответствующими характеристиками кривых роста. Для выравнивания выбирается та кривая, закон изменения прироста которой наиболее близок к закономерности изменения фактических данных.

При выборе формы кривой надо иметь в виду еще одно обстоятельство. Рост сложности кривой в целом ряде случаев может действительно увеличить точность описания тренда в прошлом, однако в связи с тем, что более сложные кривые содержат большее число параметров и более высокие степени независимой переменной, их доверительные интервалы будут, в общем, существенно шире, чем у более простых кривых при одном и том же периоде упреждения.

В настоящее время, когда использование специальных программ без особых усилий позволяет одновременно строить несколько видов уравнений, широко эксплуатируются формальные статистические критерии для определения лучшего уравнения тренда.

Из сказанного выше, по-видимому, можно сделать вывод о том, что выбор формы кривой для выравнивания представляет собой задачу, которая не решается однозначно, а сводится к получению ряда альтернатив. Окончательный выбор не может лежать в области формального анализа, тем более, если предполагается с помощью выравнивания не только статистически описать закономерность поведения уровня в прошлом, но и экстраполировать найденную закономерность в будущее. Вместе с тем различные статистические приемы обработки данных наблюдения могут принести существенную пользу, по крайней мере, с их помощью можно отвергнуть заведомо непригодные варианты и тем самым существенно ограничить поле выбора.

Рассмотрим наиболее используемые типы уравнений тренда:

1. Линейная форма тренда:

где – уровень ряда, полученный в результате выравнивания по прямой; – начальный уровень тренда; – средний абсолютный прирост, константа тренда.

Для линейной формы тренда характерно равенство так называемых первых разностей (абсолютных приростов) и нулевые вторые разности, т. е. ускорения.

2. Параболическая (полином 2-ой степени) форма тренда:

(3.6)

Для данного типа кривой постоянными являются вторые разности (ускорение), а нулевыми – третьи разности.

Параболическая форма тренда соответствует ускоренному или замедленному изменению уровней ряда с постоянным ускорением. Если < 0 и > 0, то квадратическая парабола имеет максимум, если > 0 и < 0 – минимум. Для отыскания экстремума первую производную параболы по t приравнивают 0 и решают уравнение относительно t .

3. Логарифмическая форма тренда:

, (3.7)

где – константа тренда.

Логарифмическим трендом может быть описана тенденция, проявляющаяся в замедлении роста уровней ряда динамики при отсутствии предельно возможного значения. При достаточно большом t логарифмическая кривая становится мало отличимой от прямой линии.

4. Мультипликативная (степенная) форма тренда:

(3.8)

5. Полином 3-ей степени:

Естественно, кривых, описывающих основные тенденции, гораздо больше. Однако формат учебного пособия не позволяет описать все их многообразие. Показанные далее приемы построения моделей позволят пользователю самостоятельно использовать другие функции, в частности обратные.

Для решения поставленной задачи по аналитическому сглаживанию динамических рядов в системе STATISTICA нам потребуется создать дополнительную переменную на листе с исходными данными переменной «ВГ2001-2010», который следует сделать активным.

Нам предстоит построить уравнение тренда, которое по существу является уравнением регрессии, в котором в качестве фактора выступает «время». Создаем переменную «Т», содержащую интервалы времени, 10 годам (с 2001 по 2010). Переменная «Т» будет состоять из натуральных чисел от 1 до 10, соответствующих указанным годам.

В итоге получается следующий рабочий лист (рис. 3.6)

Рис. 3.6. Рабочий лист с созданной переменной времени

Далее рассмотрим процедуру, позволяющую строить регрессионные модели как линейного, так и нелинейного типа. Для этого выбираем: Statistics/Advanced Linear/Nonlinear Models/Nonlinear Estimation (рис. 3.7). В появившемся окне (рис. 3.8) выбираем функцию User-specified Regression, Least Squares (построение моделей регрессии пользователем вручную, параметры уравнения находятся по методу наименьших квадратов (МНК)).

В следующем диалоговом окне (рис. 3.9) нажимаем на кнопку Function to be estimated , чтобы попасть на экран для задания модели вручную (рис. 3.10).

Рис. 3.7. Запуск процедуры Statistics/Advanced Linear/

Nonlinear Models/Nonlinear Estimation

Рис. 3.8. Окно процедуры Nonlinear Estimation

Рис. 3.9ю Окно процедуры User-Specified Regression, Least Squares

Рис. 3.10. Окно для реализации процедуры

задания уравнения тренда вручную

В верхней части экрана находится поле для ввода функции, в нижней части располагаются примеры ввода функций для различных ситуаций.

Прежде чем сформировать интересующие нас модели, необходимо пояснить некоторые условные обозначения. Переменные уравнений задаются в формате «v №», где «v » обозначает переменную (от англ. «variable »), а «№» – номер столбца, в котором она расположена в таблице на рабочем листе с исходными данными. Если переменных очень много, то справа находится кнопка Review vars , позволяющая выбирать их из списка по названиям и просматривать их параметры с помощью кнопки Zoom (рис. 3.11).

Рис. 3.11. Окно выбора переменной с помощью кнопки Review vars

Параметры уравнений обозначаются любыми латинскими буквами, не обозначающими какое-либо математическое действие. Для упрощения работы предлагается обозначать параметры уравнения так, как в описании уравнений тренда – латинской буквой «а », последовательно присваивая им порядковые номера. Знаки математических действий (вычитания, сложения, умножения и пр.) задаются в обычном для Windows -приложений формате. Пробелы между элементами уравнения не требуются.

Итак, рассмотрим первую модель тренда – линейную, .

Следовательно, после набора она будет выглядеть следующим образом:

,

где v 1 – это столбец на листе с исходными данными, в котором находятся значения исходного динамического ряда; а 0 и а 1 – параметры уравнения; v 2 – столбец на листе с исходными данными, в котором находятся значения интервалов времени (переменная Т) (рис. 3.12).

После этого дважды нажимаем кнопку ОК .

Рис. 3.12. Окно процедуры задания уравнения линейного тренда

Рис. 3.13. Закладка Quick процедуры оценки уравнения тренда.

В появившемся окне (рис. 3.13) можно выбрать метод оценки параметров уравнения регрессии (Estimation method ), если это необходимо. В нашем случае нужно перейти к закладке Advanced и нажать на кнопку Start values (рис. 3.14). В этом диалоге задаются стартовые значения параметров уравнения для их нахождения по МНК, т.е. их минимальные значения. Изначально они заданы как 0,1 для всех параметров. В нашем случае можно оставить эти значения в том же виде, но если значения в наших исходных данных меньше единицы, то необходимо задать их в виде 0,001 для всех параметров уравнения тренда (рис. 3.15). Далее нажимаем кнопку ОК .

Рис. 3.14. Закладка Advanced процедуры оценки уравнения тренда

Рис. 3.15. Окно задания стартовыхзначений параметров уравнения тренда

Рис. 3.16. Закладка Quick окна результатов регрессионного анализа

На закладке Quick (рис.3.16) очень важным является значение строчки Proportion of variance accounted for , которое соответствует коэффициенту детерминации; это значение лучше записать отдельно, так как в дальнейшем оно выводиться не будет, и пользователю придется рассчитывать коэффициент вручную, при этом достаточно трех знаков после запятой. Далее нажимаем кнопку Summary: Parameter estimates для получения данных о параметрах линейного уравнения тренда (рис. 3.17).

Рис. 3.17. Результаты расчета параметров линейной модели тренда

Столбец Estimate – числовые значения параметров уравнения; Standard еrror – стандартная ошибка параметра; t-value – расчетное значение t -критерия; df – число степеней свободы (n -2); p-level – расчетный уровень значимости; Lo. Conf. Limit и Up. Conf. Limit – соответственно нижняя и верхняя граница доверительных интервалов для параметров уравнения с установленной вероятностью (указана как Level of Confidence в верхнем поле таблицы).

Соответственно уравнение линейно модели тренда имеет вид .

После этого возвращаемся к анализу и нажимаем на кнопку Analysis of Variance (дисперсионный анализ) на той же закладке Quick (см. рис. 3.16).

Рис. 3.18. Результаты дисперсионного анализа линейной модели тренда

В верхней заголовочной строке таблицы выдаются пять оценок:

Sum of Squares – сумма квадратов отклонений; df – число степеней свободы; Mean Squares – средний квадрат; F-value – критерий Фишера; p-value – расчетный уровень значимости F -критерия.

В левом столбце указывается источник вариации:

Regression – вариация, объясненная уравнением тренда; Residual – вариация остатков – отклонений фактических значений от выровненных (полученных по уравнению тренда); Total – общая вариация переменной.

На пересечении столбцов и строк получаем однозначно определенные показатели, расчетные формулы для которых представлены в табл. 3.2,

Таблица 3.2

Расчет показателей вариации трендовых моделей

Source df Sum of Squares Mean squares F-value
Regression m
Residual n-m
Total n
Corrected Total n-1
Regresion vs. Corrected Total m SSR MSR

где – выровненные значения уровней динамического ряда; – фактические значения уровней динамического ряда; – среднее значение уровней динамического ряда.

SSR (Regression Sum of Squares) – сумма квадратов прогнозных значений; SSE (Residual Sum of Squares) – сумма квадратов отклонений теоретических и фактических значений (для расчета остаточной, необъясненной дисперсии); SST (TotalSum of Squares) – сумма первой и второй строчки (сумма квадратов фактических значений); SSCT (Corrected TotalSum of Squares) – сумма квадратов отклонений фактических значений от средней величины (для расчета общей дисперсии); Regression vs. Corrected Total Sum of Squares – повторение первой строчки; MSR (Regression Mean Squares) – объясненная дисперсия; MSE (Residual Mean Squares) – остаточная, необъясненная дисперсия; MSCT (Mean Squares Corrected Total) – скорректированная общая дисперсия; Regression vs. Corrected Total Mean Squares – повторение первой строчки; Regression F-value – расчетное значение F -критерия; Regression vs. Corrected Total F-value – скорректированное расчетное значение F -критерия; n – число уровней ряда; m – число параметров уравнения тренда.

Далее опять же на закладке Quick (см. рис. 3.16) нажимаем кнопку Predicted values, Residuals, etc . После ее нажатия система строит таблицу, состоящую из трех столбцов (рис. 3.19).

Observed – наблюдаемые значения (то есть уровни исходного динамического ряда);


© 2024
artistexpo.ru - Про дарение имущества и имущественных прав