Monday, December 5, 2016

Difference Between Moving Average And Autoregressive Model

A RIMA significa Autoregressive Integrated Moving Average modelos. Univariada (vetor único) ARIMA é uma técnica de previsão que projeta os valores futuros de uma série baseada inteiramente em sua própria inércia. Sua principal aplicação é na área de previsão de curto prazo, exigindo pelo menos 40 pontos de dados históricos. Ele funciona melhor quando seus dados exibem um padrão estável ou consistente ao longo do tempo com uma quantidade mínima de outliers. Às vezes chamado Box-Jenkins (após os autores originais), ARIMA é geralmente superior às técnicas de suavização exponencial quando os dados são razoavelmente longos ea correlação entre as observações passadas é estável. Se os dados forem curtos ou altamente voláteis, então algum método de alisamento pode funcionar melhor. Se você não tiver pelo menos 38 pontos de dados, você deve considerar algum outro método que ARIMA. O primeiro passo na aplicação da metodologia ARIMA é verificar a estacionaridade. A estacionariedade implica que a série permanece a um nível razoavelmente constante ao longo do tempo. Se existe uma tendência, como na maioria das aplicações econômicas ou de negócios, os dados NÃO são estacionários. Os dados também devem mostrar uma variação constante em suas flutuações ao longo do tempo. Isto é facilmente visto com uma série que é fortemente sazonal e crescendo a um ritmo mais rápido. Nesse caso, os altos e baixos da sazonalidade se tornarão mais dramáticos ao longo do tempo. Sem que estas condições de estacionaridade sejam satisfeitas, muitos dos cálculos associados ao processo não podem ser calculados. Se um gráfico gráfico dos dados indica nonstationarity, então você deve diferenciar a série. A diferenciação é uma excelente maneira de transformar uma série não-estacionária em uma estacionária. Isto é feito subtraindo a observação no período atual do anterior. Se essa transformação é feita apenas uma vez para uma série, você diz que os dados foram primeiro diferenciados. Este processo elimina essencialmente a tendência se sua série está crescendo em uma taxa razoavelmente constante. Se ele está crescendo a uma taxa crescente, você pode aplicar o mesmo procedimento e diferença os dados novamente. Seus dados seriam então segundo diferenciados. Autocorrelações são valores numéricos que indicam como uma série de dados está relacionada a si mesma ao longo do tempo. Mais precisamente, ele mede quão fortemente os valores de dados em um número específico de períodos separados estão correlacionados entre si ao longo do tempo. O número de períodos separados é geralmente chamado de atraso. Por exemplo, uma autocorrelação no intervalo 1 mede como os valores 1 intervalo de tempo são correlacionados um ao outro ao longo da série. Uma autocorrelação no intervalo 2 mede como os dados dois períodos separados estão correlacionados ao longo da série. As autocorrelações podem variar de 1 a -1. Um valor próximo a 1 indica uma alta correlação positiva, enquanto um valor próximo de -1 implica uma correlação negativa elevada. Essas medidas são mais frequentemente avaliadas através de gráficos gráficos chamados correlagramas. Um correlagram traça os valores de autocorrelação para uma dada série em diferentes defasagens. Isto é referido como a função de autocorrelação e é muito importante no método ARIMA. A metodologia ARIMA tenta descrever os movimentos em séries temporais estacionárias como uma função do que são chamados parâmetros auto-regressivos e de média móvel. Estes são referidos como parâmetros AR (autoregessive) e parâmetros MA (média móvel). Um modelo AR com apenas 1 parâmetro pode ser escrito como. X (t) A (1) X (t-1) E (t) onde X (t) séries temporais sob investigação A (1) o parâmetro autorregressivo de ordem 1 X (t-1) (T) o termo de erro do modelo Isto simplesmente significa que qualquer valor dado X (t) pode ser explicado por alguma função de seu valor anterior, X (t-1), mais algum erro aleatório inexplicável, E (t). Se o valor estimado de A (1) fosse .30, então o valor atual da série estaria relacionado a 30 de seu valor 1 período atrás. Naturalmente, a série poderia estar relacionada a mais do que apenas um valor passado. Por exemplo, X (t) A (1) X (t-1) A (2) X (t-2) E (t) Isso indica que o valor atual da série é uma combinação dos dois valores imediatamente anteriores, X (t-1) e X (t-2), mais algum erro aleatório E (t). Nosso modelo é agora um modelo autorregressivo de ordem 2. Modelos de média móvel: Um segundo tipo de modelo Box-Jenkins é chamado de modelo de média móvel. Embora estes modelos parecem muito semelhantes ao modelo AR, o conceito por trás deles é bastante diferente. Os parâmetros de média móvel relacionam o que acontece no período t apenas aos erros aleatórios que ocorreram em períodos de tempo passados, isto é, E (t-1), E (t-2), etc., em vez de X (t-1), X T-2), (Xt-3) como nas abordagens autorregressivas. Um modelo de média móvel com um termo MA pode ser escrito da seguinte forma. O termo B (1) é chamado de MA de ordem 1. O sinal negativo na frente do parâmetro é usado apenas para convenção e normalmente é impresso Automaticamente pela maioria dos programas de computador. O modelo acima diz simplesmente que qualquer valor dado de X (t) está diretamente relacionado somente ao erro aleatório no período anterior, E (t-1) e ao termo de erro atual, E (t). Como no caso dos modelos autorregressivos, os modelos de média móvel podem ser estendidos a estruturas de ordem superior cobrindo diferentes combinações e comprimentos médios móveis. A metodologia ARIMA também permite a construção de modelos que incorporem parâmetros de média móvel e autorregressiva. Estes modelos são frequentemente referidos como modelos mistos. Embora isso torne uma ferramenta de previsão mais complicada, a estrutura pode de fato simular melhor a série e produzir uma previsão mais precisa. Modelos puros implicam que a estrutura consiste apenas de AR ou MA parâmetros - não ambos. Os modelos desenvolvidos por esta abordagem são geralmente chamados de modelos ARIMA porque eles usam uma combinação de auto-regressão (RA), integração (I) - referindo-se ao processo inverso de diferenciação para produzir as operações de previsão e de média móvel (MA). Um modelo ARIMA é geralmente indicado como ARIMA (p, d, q). Isso representa a ordem dos componentes autorregressivos (p), o número de operadores de diferenciação (d) e a ordem mais alta do termo médio móvel. Por exemplo, ARIMA (2,1,1) significa que você tem um modelo autorregressivo de segunda ordem com um componente de média móvel de primeira ordem cuja série foi diferenciada uma vez para induzir a estacionaridade. Escolhendo a Especificação Direita: O principal problema no clássico Box-Jenkins está tentando decidir qual especificação ARIMA usar - i. e. Quantos parâmetros AR e / ou MA devem ser incluídos. Isto é o que muito de Box-Jenkings 1976 foi dedicado ao processo de identificação. Ela dependia da avaliação gráfica e numérica das funções de autocorrelação da amostra e autocorrelação parcial. Bem, para os seus modelos básicos, a tarefa não é muito difícil. Cada um tem funções de autocorrelação que parecem uma certa maneira. No entanto, quando você subir em complexidade, os padrões não são tão facilmente detectados. Para tornar as questões mais difíceis, seus dados representam apenas uma amostra do processo subjacente. Isto significa que os erros de amostragem (outliers, erro de medição, etc.) podem distorcer o processo de identificação teórica. É por isso que a modelagem ARIMA tradicional é uma arte ao invés de uma ciência. Há uma série de abordagens para a modelagem de séries temporais. Descrevemos algumas das abordagens mais comuns abaixo. Tendência, Decomposições Sazonais, Residuais Uma abordagem consiste em decompor as séries temporais em uma componente tendencial, sazonal e residual. Triplo exponencial suavização é um exemplo desta abordagem. Outro exemplo, denominado loess sazonal, é baseado em mínimos quadrados ponderados localmente e é discutido por Cleveland (1993). Não discutimos o loess sazonal neste manual. Métodos baseados em freqüência Outra abordagem, comumente usada em aplicações científicas e de engenharia, é analisar as séries no domínio da freqüência. Um exemplo desta abordagem na modelagem de um conjunto de dados de tipo sinusoidal é mostrado no estudo de caso de deflexão de feixe. O gráfico espectral é a principal ferramenta para a análise de freqüência de séries temporais. Modelos Autoregressivos (AR) Uma abordagem comum para a modelagem de séries temporais univariadas é o modelo autorregressivo (AR): Xt delta phi1 X phi2 X cdots phip X Em, onde (Xt) é a série temporal, (At) é ruído branco e delta Esquerda (1 - soma p phii direita) mu. Com (mu) denotando a média do processo. Um modelo autorregressivo é simplesmente uma regressão linear do valor atual da série contra um ou mais valores prévios da série. O valor de (p) é chamado a ordem do modelo AR. Os modelos AR podem ser analisados ​​com um dos vários métodos, incluindo técnicas de mínimos quadrados lineares padrão. Eles também têm uma interpretação direta. Modelos de média móvel (MA) Outra abordagem comum para a modelagem de modelos de séries temporais univariadas é o modelo de média móvel (MA): Xt mu At - theta1 A - theta2 A - cdots - thetaq A, onde (Xt) é a série temporal ) É a média da série, (A) são termos de ruído branco, e (theta1,, ldots,, thetaq) são os parâmetros do modelo. O valor de (q) é chamado de ordem do modelo MA. Isto é, um modelo de média móvel é conceitualmente uma regressão linear do valor actual da série contra o ruído branco ou choques aleatórios de um ou mais valores anteriores da série. Os choques aleatórios em cada ponto são assumidos como provenientes da mesma distribuição, tipicamente uma distribuição normal, com localização em zero e escala constante. A distinção neste modelo é que estes choques aleatórios são propogated aos valores futuros das séries de tempo. Ajustar as estimativas MA é mais complicado do que com modelos AR porque os termos de erro não são observáveis. Isto significa que procedimentos de montagem não-linear iterativos precisam ser usados ​​em vez de mínimos quadrados lineares. Os modelos MA também têm uma interpretação menos óbvia do que os modelos AR. Às vezes, o ACF e PACF sugerem que um modelo de MA seria uma melhor escolha de modelo e às vezes tanto AR e MA termos devem ser utilizados no mesmo modelo (ver Secção 6.4.4.5). Observe, entretanto, que os termos de erro após o ajuste do modelo devem ser independentes e seguir as premissas padrão para um processo univariável. Box e Jenkins popularizaram uma abordagem que combina a média móvel e as abordagens autorregressivas no livro Análise de Séries Temporais: Previsão e Controle (Box, Jenkins e Reinsel, 1994). Embora as abordagens de média móvel e autorregressiva fossem já conhecidas (e originalmente investigadas por Yule), a contribuição de Box e Jenkins foi no desenvolvimento de uma metodologia sistemática para identificar e estimar modelos que poderiam incorporar ambas as abordagens. Isso torna Box-Jenkins modelos uma poderosa classe de modelos. As próximas seções discutirão esses modelos detalhadamente. Antes de 1970, econometristas e analistas de séries temporais usaram métodos muito diferentes para modelar uma série de tempo. As séries temporais modeladas por econometristas são uma regressão linear padrão com variáveis ​​explicativas sugeridas pela teoria / intuição econômica para explicar os movimentos em dados de séries temporais. Eles assumiram que as séries cronológicas não-estacionárias (aumento das horas extras) não tiveram efeito sobre sua análise empírica. Os analistas de séries temporais, por outro lado, ignoraram essa análise econométrica tradicional. Eles modelaram uma série de tempo como uma função de seus valores passados. Eles trabalharam em torno do problema da não-estacionariedade diferenciando os dados para torná-lo estacionário. Em seguida, Clive Granger e Paul Newbold aconteceu 1. Os econometristas foram forçados a prestar atenção aos métodos de analistas de séries temporais, o mais famoso dos quais foi a abordagem BoxJenkins desenvolvido por George P Box e Gwilym Jenkins e publicado em sua lendária monografia Time Series Analysis : Previsão e Controle 2. Box e Jenkins alegaram (com sucesso) que os dados não-estacionários podem ser feitos estacionários diferenciando a série. Esta série, mathY / math é a entrada na análise de Box-Jenkins. O modelo geral para mathY / math é escrito como, mathYphi1Y phi2Y. PhipY epsilonttheta1epsilon theta2epsilon. Thetaqepsilon / math onde mathphi / math e maththeta / math são parâmetros desconhecidos e matemática / matemática são termos de erro identicamente distribuídos independentes com média zero. Aqui, mathY / math é apenas expressa em termos de seus valores passados ​​e os valores atuais e passados ​​de termos de erro. Este modelo é denominado Média Movente Integrada Autorestrada ou mathARIMA (p, d, q) / modelo matemático de mathY. p / math é o número de valores defasados ​​de mathY / math que representa a natureza autorregressiva (AR) do modelo, mathq / math É o número de valores defasados ​​do termo de erro que representa a natureza da média móvel (MA) do modelo e mathd / math é o número de vezes que mathY / math tem que ser diferenças para produzir o mathY / math estacionário. O termo integrado implica que, a fim de obter uma previsão de mathY / math. Temos de resumir (ou integrar) os valores de mathY / math porque mathY / math são os valores diferenciados da série original mathY. / Math Se não houver diferenciação está envolvido, este modelo é chamado de média automarregível MathARMA (p, q) / math com mathp / math e mathq / math mantendo seu significado original e nenhum mathd. / Math O termo mathARIMA / math ou mathARMA / math é muito confuso porque ambos, os componentes mathAR / math e mathMA / math têm a mesma forma matemática. São ambas combinações lineares de valores presentes e passados ​​de variáveis ​​aleatórias. O componente mathAR / math é a combinação linear de valores observáveis ​​de mathY / math enquanto o componente mathMA / math é a combinação linear dos termos de perturbação de ruído branco não observáveis. Esta é apenas uma daquelas trivialidades que você se acostumaria com o tempo. Econometricians ignorou a abordagem Box-Jenkins no início, mas foram obrigados a prestar atenção a eles quando ele mathARIMA / previsões de matemática começou consistentemente superando as previsões baseadas em modelagem econométrica padrão. A falta de uma teoria econômica sólida por trás do mathARIMA / matemática era preocupante para econometricians para aceitar. Eles responderam desenvolvendo uma outra classe de modelos que incorporaram os componentes auroregressivos e móveis da abordagem Box-Jenkins com a abordagem das variáveis ​​explicativas da econometria padrão. O mais simples de tais modelos é o mathARIMAX / matemática que é apenas um mathARIMA / matemática com variáveis ​​explicativas adicionais fornecidas pela teoria econômica. Um mathARIMAX / matemática padrão seria escrito como, mathYbeta. X phi1Y phi2Y. PhipY epsilonttheta1epsilon theta2epsilon. Thetaqepsilon / math onde mathX / math pode ser qualquer variável econômica. 3k Vistas middot Ver Upvotes middot Não é para Reprodução Olhe para este link: 8 Modelos ARIMA OTexts Este é o capítulo dedicado aos modelos ARIMA a partir de um livre fantástico livre on-line sobre a previsão de séries temporais de Rob J Hyndman P ordem da parte autorregressiva . Esse é o número de termos desconhecidos que multiplicam seu sinal em tempos passados ​​(tantas vezes passadas como seu valor p) D grau de primeira diferença envolvida. Número de vezes que você tem que diferenciar sua série de tempo para ter uma ordem Q estacionária da parte da média móvel. Esse é o número de termos desconhecidos que multiplicam seus erros de previsão em tempos passados ​​(tantas vezes passadas quanto seu valor q) Existem boas técnicas para estimar todos esses parâmetros (com base nas funções de autocorrelação - ACF - e autocorrelação parcial - PACF): People. duke. edu/ E o processo pode ser complexo e demorado, ainda mais se você tiver muitas séries de tempo para lidar com. Em R há uma função chamada auto. arima no pacote de previsão que avalia automaticamente todos esses parâmetros, mesmo a parte de sazonalidade (valores adicionais para calcular caso haja sazonalidade em sua série de tempo). 1.8k Vistas middot Ver Upvotes middot Não para reprodução Modelos ARMA e ARIMA (Box-Jenkins) Modelos ARMA e ARIMA (Box-Jenkins) Nas seções anteriores vimos como o valor de uma série temporal univariada no tempo t. X t. Pode ser modelado usando uma variedade de expressões de média móvel. Mostramos também que componentes como tendências e periodicidade nas séries temporais podem ser explicitamente modelados e / ou separados, com os dados sendo decompostos em componentes tendência, sazonais e residuais. Mostramos também, nas discussões anteriores sobre autocorrelação. Que os coeficientes de autocorrelação total e parcial são extremamente úteis na identificação e padrões de modelagem em séries temporais. Esses dois aspectos da análise e modelagem de séries temporais podem ser combinados em um quadro de modelagem geral mais geral e muitas vezes muito efetivo. Em sua forma básica, esta abordagem é conhecida como modelagem ARMA (média móvel autorregressiva), ou quando a diferenciação é incluída no procedimento, ARIMA ou Box-Jenkins modelagem, após os dois autores que foram centrais para o seu desenvolvimento (ver Box amp Jenkins, 1968 BOX1 e Box, Jenkins amp Reinsel, 1994 BOX2). Não há uma regra fixa quanto ao número de períodos de tempo necessários para um exercício de modelagem bem-sucedido, mas para modelos mais complexos e para maior confiança nos procedimentos de ajuste e validação, são freqüentemente recomendadas séries com 50 etapas de tempo. Os modelos ARMA combinam os métodos de autocorrelação (AR) e as médias móveis (MA) em um modelo composto da série temporal. Antes de considerar como esses modelos podem ser combinados, examinamos cada um separadamente. Já vimos que os modelos de média móvel (MA) podem ser usados ​​para fornecer um bom ajuste para alguns conjuntos de dados, e as variações nesses modelos que envolvem o suavização exponencial dupla ou tripla podem lidar com componentes tendenciais e periódicos nos dados. Além disso, esses modelos podem ser usados ​​para criar previsões que imitam o comportamento de períodos anteriores. Uma forma simples de tais modelos, baseada em dados anteriores, pode ser escrita como: Onde os termos beta i são os pesos aplicados a valores anteriores na série temporal, e é usual definir beta i 1, sem perda de generalidade. Assim, para um processo de primeira ordem, q 1 e temos o modelo: isto é, o valor da média móvel é estimado como uma média ponderada dos valores passados ​​atuais e imediatos. Este processo de média é, em certo sentido, um mecanismo pragmático de suavização sem uma ligação directa a um modelo estatístico. No entanto, podemos especificar um modelo estatístico (ou estocástico) que abrace os procedimentos de médias móveis em conjunto com processos aleatórios. Se formos um conjunto de variáveis ​​aleatórias independentes e identicamente distribuídas (um processo aleatório) com média zero e variância fixa conhecida, então podemos escrever o processo como uma média móvel de ordem q em termos de: Claramente o valor esperado de xt sob Este modelo é 0, portanto o modelo só é válido se o xt já tiver sido ajustado para ter uma média zero ou se uma constante fixa (a média do xt) é adicionada à soma. É também evidente que a variância de xt é simplesmente: A análise acima pode ser estendida para avaliar a covariância, cov (x t. Xtk), que encontramos rendimentos: Note-se que nem o valor médio, nem a covariância (ou autocovariância) A lag k é uma função do tempo, t. Então o processo é de segunda ordem estacionário. A expressão acima permite obter uma expressão para a função de autocorrelação (acf): Se k 0 rho k 1, e para k gt q rho k 0. Além disso, o acf é simétrico e rho k rho - k. O acf pode ser calculado para um processo MA de primeira ordem: O componente autorregressivo ou AR de um modelo ARMA pode ser escrito na forma: onde os termos em são coeficientes de autocorrelação em lags 1,2. P e zt é um termo de erro residual. Observe que este termo de erro se refere especificamente ao período de tempo atual, t. Assim, para um processo de primeira ordem, p 1 e temos o modelo: Estas expressões afirmam que o valor estimado de x no tempo t é determinado pelo valor imediatamente anterior de x (isto é, no tempo t -1) multiplicado por uma medida, alfa . Da extensão em que os valores de todos os pares de valores em períodos de tempo com intervalo 1 de intervalo estão correlacionados (isto é, a sua autocorrelação), mais um termo de erro residual, z. No tempo t. Mas esta é precisamente a definição de um Processo de Markov. Assim, um Processo de Markov é um processo autorregressivo de primeira ordem. Se alfa 1 o modelo afirma que o próximo valor de x é simplesmente o valor anterior mais um termo de erro aleatório, e, portanto, é uma simples caminhada aleatória 1D. Se forem incluídos mais termos, o modelo estima o valor de x no tempo t por uma soma ponderada destes termos mais uma componente de erro aleatório. Se substituirmos a segunda expressão acima na primeira, temos: e a aplicação repetida dessa substituição rende: Agora, se alfa lt1 ek é grande, esta expressão pode ser escrita na ordem inversa, com termos decrescentes e com contribuição do termo Em x no lado direito da expressão tornando-se cada vez mais pequeno, então temos: Como o lado direito desta expressão modela xt como a soma de um conjunto ponderado de valores anteriores, neste caso termos de erro aleatório, fica claro que Este modelo AR é, de fato, uma forma de modelo MA. E se assumimos que os termos de erro têm média zero e variância constante, então como no modelo MA temos o valor esperado do modelo como também 0, assumindo que o xt foi ajustado para fornecer uma média zero, com variância: Agora como Assim como com o modelo de MA acima, esta análise pode ser estendida para avaliar a covariância, cov (x t. X tk) de a Para a alfa lt1 esta soma é finita e é simplesmente alpha k / (1- alpha 2), então temos: Isto demonstra que para um modelo autorregressivo de primeira ordem a função de autocorrelação (acf) é Simplesmente definida por potências sucessivas da autocorrelação de primeira ordem,, com a condição alfa lt1. Para alfa gt0 isto é simplesmente uma potência que diminui rapidamente ou curva de tipo exponencial, tendendo para zero, ou para lt0 é uma curva oscilatória de amortecimento, tendendo novamente para zero. Se uma suposição for feita de que a série de tempo é estacionária, a análise acima pode ser estendida para autocorrelações de segundo e maior ordem. Para ajustar um modelo AR a um conjunto de dados observado, procuramos minimizar a soma de erros quadrados (um ajuste de mínimos quadrados) usando o menor número de termos que proporcionam um ajuste satisfatório aos dados. Modelos deste tipo são descritos como auto-regressivos. E pode ser aplicado a séries de tempo e conjuntos de dados espaciais (ver modelos de autorregressão espacial adicionais). Embora, teoricamente, um modelo autorregressivo possa fornecer um bom ajuste a um conjunto de dados observado, geralmente exigiria a remoção prévia de componentes tendenciais e periódicos e, mesmo assim, pode precisar de um grande número de termos para fornecer um bom ajuste aos dados. No entanto, combinando os modelos AR com modelos MA, podemos produzir uma família de modelos mistos que podem ser aplicados em uma ampla gama de situações. Estes modelos são conhecidos como modelos ARMA e ARIMA e são descritos nas subsecções seguintes. Nas duas subseções anteriores, introduzimos o modo MA de ordem q: eo modelo AR de ordem p: Podemos combinar esses dois modelos simplesmente adicionando-os juntos como um modelo de ordem (p, q), onde temos p AR termos E q Termos MA: Em geral, esta forma de modelo ARMA combinado pode ser usada para modelar uma série temporal com menos termos em geral do que um modelo MA ou AR por si mesmos. Exprime o valor estimado no tempo t como a soma de q termos que representam a variação média de variação aleatória sobre q períodos anteriores (a componente MA), mais a soma dos termos p AR que calculam o valor actual de x como a soma ponderada Dos p valores mais recentes. No entanto, esta forma de modelo assume que a série de tempo é estacionário, o que raramente é o caso. Na prática, tendências e periodicidade existem em muitos conjuntos de dados, por isso há uma necessidade de remover esses efeitos antes de aplicar tais modelos. A remoção é tipicamente levada a cabo incluindo no modelo uma fase de diferenciação inicial, tipicamente uma, duas ou três vezes, até que a série seja pelo menos aproximadamente estacionária - não exibindo tendências ou periodicidades óbvias. Como nos processos MA e AR, o processo de diferenciação é descrito pela ordem de diferenciação, por exemplo, 1, 2, 3. Coletivamente, esses três elementos constituem um triplo: (p, q) que define o tipo de modelo aplicado. Nesta forma, o modelo é descrito como um modelo ARIMA. A letra I em ARIMA refere-se ao fato de que o conjunto de dados foi inicialmente diferenciado (ver diferenciação) e quando a modelagem é completa os resultados então têm que ser somados ou integrados para produzir as estimativas finais e previsões. A modelagem ARIMA é discutida abaixo. Conforme observado na subseção anterior, combinar a diferenciação de uma série temporária não-estacionária com o modelo ARMA fornece uma poderosa família de modelos que podem ser aplicados em uma ampla gama de situações. O desenvolvimento desta forma estendida de modelo é em grande parte devido a G E P Box e G M Jenkins, e como resultado modelos ARIMA também são conhecidos como Box-Jenkins modelos. O primeiro passo no procedimento Box-Jenkins é diferenciar a série temporal até que ela fique estacionária, garantindo assim que a tendência e os componentes sazonais sejam removidos. Em muitos casos, uma ou duas etapas de diferenciação são suficientes. A série diferenciada será menor do que a série de origem por c intervalos de tempo, onde c é o intervalo da diferenciação. Um modelo ARMA é então ajustado para a série de tempo resultante. Porque os modelos de ARIMA têm três parâmetros há muitas variações aos modelos possíveis que poderiam ser cabidos. No entanto, a decisão sobre o que esses parâmetros devem ser pode ser guiada por uma série de princípios básicos: (i) o modelo deve ser tão simples quanto possível, ou seja, conter o menor número de termos possível, o que significa que os valores de p e q Deve ser pequeno (ii) o ajuste aos dados históricos deve ser o melhor possível, ou seja, o tamanho das diferenças quadradas entre o valor estimado em qualquer período de tempo passado eo valor real, deve ser minimizado (princípio mínimos quadrados) - os resíduos Do modelo selecionado pode então ser examinado para ver se quaisquer resíduos restantes são significativamente diferentes de 0 (ver adiante, abaixo) (iii) a autocorrelação parcial medida nos intervalos 1, 2, 3. Deve fornecer uma indicação da ordem da componente AR, ou seja, o valor escolhido para q (iv) o gráfico da forma da função de autocorrelação (acf) pode sugerir o tipo de modelo ARIMA requerido - a tabela abaixo (do NIST) fornece orientação sobre Interpretando a forma do acf em termos de seleção de modelo. ARIMA Seleção do tipo de modelo usando a forma de acf A série não é estacionária. Padrão ARIMA modelos são muitas vezes descritos pelo triplo: (p. d.q), conforme observado acima. Estes definem a estrutura do modelo em termos da ordem de AR, diferenciação e MA modelos a serem utilizados. Também é possível incluir parâmetros semelhantes para sazonalidade nos dados, embora tais modelos sejam mais complexos para se ajustar e interpretar - o tripé (P. D. Q) é geralmente usado para identificar esses componentes do modelo. Na captura de tela do SPSS mostrada abaixo, é exibida a caixa de diálogo para selecionar manualmente elementos estruturais não sazonais e sazonais (instalações similares estão disponíveis em outros pacotes integrados, como SAS / ETS). Como pode ser visto, o diálogo também permite que os dados sejam transformados (normalmente para auxiliar na estabilização de variância) e para permitir que os usuários incluam uma constante no modelo (o padrão). Esta ferramenta de software particular permite que os outliers sejam detectados, se necessário, de acordo com uma gama de procedimentos de detecção, mas em muitos casos os outliers terão sido investigados e ajustados ou removidos e substituir os valores estimados antes de qualquer análise. Modelador de séries temporais SPSS: modelagem ARIMA, modo especialista Um número de modelos ARIMA pode ser instalado nos dados, manualmente ou através de um processo automatizado (por exemplo, um processo passo a passo) e uma ou mais medidas usadas para avaliar qual é o melhor em termos de Ajuste e parcimônia. A comparação de modelos tipicamente faz uso de uma ou mais das medidas de teoria da informação descritas anteriormente neste manual - AIC, BIC e / ou MDL (a função R, arima (), fornece a medida AIC, enquanto SPSS fornece uma gama de medidas de ajuste, Incluiu uma versão da estatística BIC outras ferramentas variam nas medidas fornecidas - Minitab, que fornece uma gama de métodos TSA, não inclui estatísticas AIC / BIC tipo). Na prática, pode ser utilizada uma vasta gama de medidas (ou seja, para além das medidas baseadas nos mínimos quadrados, para avaliar a qualidade do modelo). Por exemplo, o erro absoluto médio eo erro absoluto máximo podem ser medidas úteis, uma vez que mesmo um Um bom ajuste de mínimos quadrados pode ainda ser pobre em alguns lugares. Uma série de pacotes de software também pode fornecer uma medida global da autocorrelação que pode permanecer nos resíduos após a montagem do modelo. Uma estatística freqüentemente aplicada é devido a Ljung e Box (1978 LJU1) , E é da forma: onde n é o número de amostras (valores de dados), ri é a autocorrelação da amostra com o lag i ek é o número total de defasagens sobre as quais o cálculo é realizado. Q k é aproximadamente distribuído como Uma distribuição de qui-quadrado com k-m graus de liberdade, onde m é o número de parâmetros utilizados na montagem do modelo, excluindo qualquer termo constante ou variáveis ​​de previsão (ou seja, incluindo o pd q triplos).Se a medida é estatisticamente significativa, Indica que os resíduos ainda contêm autocorrelação significativa após a instalação do modelo, sugerindo que um modelo melhorado deve ser buscado. Exemplo: Modelando o crescimento do número de passageiros das companhias aéreas A seguir, um exemplo de montagem automatizada, usando SPSS para os dados de teste Box-Jenkins-Reinsel dos números de passageiros REI1 fornecidos anteriormente neste Manual. Inicialmente, não foi especificada qualquer especificação das datas sendo meses dentro de anos. O modelo selecionado pelo processo automatizado foi um modelo ARIMA (0,1,12), ou seja, o processo identificou corretamente que a série exigia um nível de diferenciação e aplicava um modelo de média móvel com uma periodicidade de 12 e nenhum componente de autocorrelação para se ajustar ao dados. O ajuste do modelo produziu um valor R 2 de 0,966, que é muito alto, e um erro absoluto máximo (MAE) de 75. O ajuste visual do modelo para os dados parece excelente, mas o gráfico da autocorrelação residual após o ajuste e Ljung O teste de caixa mostra que a autocorrelação significativa permanece, indicando que um modelo melhorado é possível. Para um estudo mais aprofundado, foi instalado um modelo revisto, baseado na discussão deste conjunto de dados por Box e Jenkins (1968) e na edição atualizada do livro de Chatfields (1975 CHA1) em Que ele usa o Minitab para ilustrar sua análise (6ª edição, 2003). A série temporal foi definida como tendo uma periodicidade de 12 meses e um modelo ARIMA com componentes (0,1,1), (0,1,1). Graficamente, os resultados parecem muito semelhantes ao gráfico acima, mas com este modelo o R-quadrado é 0,991, o MAE41 ea estatística Ljung-Box não são mais significativos (12,6, com 16 graus de liberdade). O modelo é, portanto, uma melhoria na versão original (gerada automaticamente), sendo composta por uma MA não-sazonal e uma componente MA sazonal, sem componente autorregressivo e um nível de diferenciação para as estruturas sazonais e não sazonais. Se o ajuste for manual ou automatizado, um modelo ARIMA pode fornecer uma boa estrutura para modelar uma série de tempo, ou pode ser que modelos ou abordagens alternativas proporcionem um resultado mais satisfatório. Muitas vezes é difícil saber com antecedência o quão bom qualquer modelo de previsão é provável que seja, uma vez que é apenas à luz da sua capacidade de prever valores futuros da série de dados que pode ser verdadeiramente julgado. Muitas vezes, esse processo é aproximado ajustando o modelo a dados passados ​​excluindo períodos de tempo recentes (também conhecidos como amostras de hold-out) e, em seguida, usando o modelo para prever esses eventos futuros conhecidos, mas mesmo isso oferece confiança limitada em sua validade futura. Previsões a mais longo prazo podem ser extremamente pouco confiáveis ​​usando tais métodos. É óbvio que o modelo internacional de estatísticas de tráfego aéreo descrito acima não é capaz de prever corretamente o número de passageiros até a década de 1990 e mais além, nem a queda de 5 anos no número de passageiros das companhias aéreas internacionais nos EUA após o 11/9/2001. Da mesma forma, um modelo ARIMA pode ser ajustado a valores históricos de preços de ações ou valores de índice (por exemplo, os índices NYSE ou FTSE) e normalmente proporcionará um ajuste excelente aos dados (resultando em um valor R-quadrado melhor que 0,99), mas são Muitas vezes de pouca utilidade para prever valores futuros desses preços ou índices. Tipicamente os modelos ARIMA são usados ​​para previsão, particularmente no campo da modelagem macro e microeconômica. No entanto, eles podem ser aplicados em uma ampla gama de disciplinas, tanto na forma descrita aqui, ou aumentada com variáveis ​​preditor adicionais que se acredita para melhorar a confiabilidade das previsões feitas. Estes últimos são importantes porque toda a estrutura dos modelos ARMA discutidos acima depende de valores anteriores e eventos aleatórios independentes ao longo do tempo, e não em qualquer fatores explicativos ou causais. Assim, os modelos ARIMA só irão refletir e estender padrões passados, que podem precisar ser modificados nas previsões por fatores como o ambiente macroeconômico, mudanças tecnológicas ou mudanças de recursos e / ou ambientais de longo prazo. BOX1 Caixa G E P, Jenkins G M (1968). Alguns avanços recentes na previsão e controle. Estatística Aplicada, 17 (2), 91-109 BOX2 Caixa, G E P, Jenkins, G M, Reinsel G C (1994) Análise, Previsão e Controlo de Séries Temporais. 3a ed. Prentice Hall, falésias de Englewood, NJ CHA1 Chatfield C (1975) A análise da série dos tempos: Teoria e prática. Chapman e Hall, Londres (ver também, 6a ed. 2003) LJU1 Ljung G M, Caixa G E P (1978) Sobre uma medida de uma falta de ajuste em modelos de séries temporais. Biometrika, 65, 297303 NIST / SEMATECH e-Handbook of Statistical Methods, www. itl. nist. gov/div898/handbook/ Seção 6.4: Introdução às séries temporais. 2010 SPSS / PASW 17 (2008) AnalyseForecasting (Modelos de séries temporais) REI1 Reinsel GC Datasets para modelos de Box-Jenkins: www. stat. wisc. edu/Movendo modelos de suavização média e exponencial Como um primeiro passo para ir além dos modelos de média, Modelos e modelos de tendências lineares, padrões e tendências não sazonais podem ser extrapolados usando um modelo de média móvel ou suavização. A suposição básica por trás dos modelos de média e suavização é que a série temporal é localmente estacionária com uma média lentamente variável. Assim, tomamos uma média móvel (local) para estimar o valor atual da média e então usamos isso como a previsão para o futuro próximo. Isto pode ser considerado como um compromisso entre o modelo médio e o modelo aleatório-andar-sem-deriva. A mesma estratégia pode ser usada para estimar e extrapolar uma tendência local. Uma média móvel é muitas vezes chamado de uma versão quotsmoothedquot da série original, porque a média de curto prazo tem o efeito de suavizar os solavancos na série original. Ajustando o grau de suavização (a largura da média móvel), podemos esperar encontrar algum tipo de equilíbrio ótimo entre o desempenho dos modelos de caminhada média e aleatória. O tipo mais simples de modelo de média é o. Média Móvel Simples (igualmente ponderada): A previsão para o valor de Y no tempo t1 que é feita no tempo t é igual à média simples das observações m mais recentes: (Aqui e em outro lugar usarei o símbolo 8220Y-hat8221 para ficar Para uma previsão da série temporal Y feita o mais cedo possível antes de um determinado modelo). Esta média é centrada no período t (m1) / 2, o que implica que a estimativa da média local tenderá a ficar para trás Valor real da média local em cerca de (m1) / 2 períodos. Dessa forma, dizemos que a idade média dos dados na média móvel simples é (m1) / 2 relativa ao período para o qual a previsão é calculada: é a quantidade de tempo em que as previsões tendem a ficar atrás dos pontos de inflexão na dados. Por exemplo, se você estiver calculando a média dos últimos 5 valores, as previsões serão cerca de 3 períodos atrasados ​​em responder a pontos de viragem. Observe que se m1, o modelo de média móvel simples (SMA) é equivalente ao modelo de caminhada aleatória (sem crescimento). Se m é muito grande (comparável ao comprimento do período de estimação), o modelo SMA é equivalente ao modelo médio. Como com qualquer parâmetro de um modelo de previsão, é costume ajustar o valor de k para obter o melhor quotfitquot aos dados, isto é, os erros de previsão mais pequenos em média. Aqui está um exemplo de uma série que parece apresentar flutuações aleatórias em torno de uma média de variação lenta. Primeiro, vamos tentar ajustá-lo com um modelo de caminhada aleatória, o que equivale a uma média móvel simples de um termo: O modelo de caminhada aleatória responde muito rapidamente às mudanças na série, mas ao fazê-lo ele escolhe grande parte do quotnoisequot no Dados (as flutuações aleatórias), bem como o quotsignalquot (a média local). Se, em vez disso, tentarmos uma média móvel simples de 5 termos, obtemos um conjunto de previsões mais suaves: A média móvel simples de 5 períodos produz erros significativamente menores do que o modelo de caminhada aleatória neste caso. A idade média dos dados nessa previsão é de 3 ((51) / 2), de modo que ela tende a ficar atrás de pontos de viragem em cerca de três períodos. (Por exemplo, uma desaceleração parece ter ocorrido no período 21, mas as previsões não virar até vários períodos mais tarde.) Observe que as previsões de longo prazo do modelo SMA são uma linha reta horizontal, assim como na caminhada aleatória modelo. Assim, o modelo SMA assume que não há tendência nos dados. No entanto, enquanto as previsões do modelo de caminhada aleatória são simplesmente iguais ao último valor observado, as previsões do modelo SMA são iguais a uma média ponderada de valores recentes. Os limites de confiança calculados pela Statgraphics para as previsões de longo prazo da média móvel simples não se alargam à medida que o horizonte de previsão aumenta. Isto obviamente não é correto Infelizmente, não há nenhuma teoria estatística subjacente que nos diga como os intervalos de confiança devem se ampliar para este modelo. No entanto, não é muito difícil calcular estimativas empíricas dos limites de confiança para as previsões de longo prazo. Por exemplo, você poderia configurar uma planilha em que o modelo SMA seria usado para prever 2 passos à frente, 3 passos à frente, etc. dentro da amostra de dados históricos. Você poderia então calcular os desvios padrão da amostra dos erros em cada horizonte de previsão e, em seguida, construir intervalos de confiança para previsões de longo prazo adicionando e subtraindo múltiplos do desvio padrão apropriado. Se tentarmos uma média móvel simples de 9 termos, obtemos previsões ainda mais suaves e mais de um efeito retardado: A idade média é agora de 5 períodos ((91) / 2). Se tomarmos uma média móvel de 19 períodos, a idade média aumenta para 10: Observe que, na verdade, as previsões estão agora atrasadas por pontos de inflexão em cerca de 10 períodos. Qual a quantidade de suavização é melhor para esta série Aqui está uma tabela que compara suas estatísticas de erro, incluindo também uma média de 3-termo: Modelo C, a média móvel de 5-termo, rende o menor valor de RMSE por uma pequena margem sobre o 3 E médias de 9-termo, e suas outras estatísticas são quase idênticas. Assim, entre os modelos com estatísticas de erro muito semelhantes, podemos escolher se preferiríamos um pouco mais de resposta ou um pouco mais de suavidade nas previsões. O modelo de média móvel simples descrito acima tem a propriedade indesejável de tratar as últimas k observações igualmente e completamente ignora todas as observações anteriores. (Voltar ao início da página.) Marrons Simples Exponencial Suavização (exponencialmente ponderada média móvel) Intuitivamente, os dados passados ​​devem ser descontados de forma mais gradual - por exemplo, a observação mais recente deve ter um pouco mais de peso que a segunda mais recente, ea segunda mais recente deve ter um pouco mais de peso que a 3ª mais recente, e em breve. O modelo de suavização exponencial simples (SES) realiza isso. Vamos 945 denotar uma constante quotsmoothingquot (um número entre 0 e 1). Uma maneira de escrever o modelo é definir uma série L que represente o nível atual (isto é, o valor médio local) da série, conforme estimado a partir dos dados até o presente. O valor de L no tempo t é calculado recursivamente a partir de seu próprio valor anterior como este: Assim, o valor suavizado atual é uma interpolação entre o valor suavizado anterior e a observação atual, onde 945 controla a proximidade do valor interpolado para o mais recente observação. A previsão para o próximo período é simplesmente o valor suavizado atual: Equivalentemente, podemos expressar a próxima previsão diretamente em termos de previsões anteriores e observações anteriores, em qualquer uma das seguintes versões equivalentes. Na primeira versão, a previsão é uma interpolação entre previsão anterior e observação anterior: Na segunda versão, a próxima previsão é obtida ajustando a previsão anterior na direção do erro anterior por uma fração 945. é o erro feito em Tempo t. Na terceira versão, a previsão é uma média móvel exponencialmente ponderada (ou seja, descontada) com o fator de desconto 1- 945: A versão de interpolação da fórmula de previsão é a mais simples de usar se você estiver implementando o modelo em uma planilha: Célula única e contém referências de células que apontam para a previsão anterior, a observação anterior ea célula onde o valor de 945 é armazenado. Observe que se 945 1, o modelo SES é equivalente a um modelo de caminhada aleatória (sem crescimento). Se 945 0, o modelo SES é equivalente ao modelo médio, assumindo que o primeiro valor suavizado é definido igual à média. A idade média dos dados na previsão de suavização exponencial simples é de 1/945 em relação ao período para o qual a previsão é calculada. (Isso não é suposto ser óbvio, mas pode ser facilmente demonstrado através da avaliação de uma série infinita.) Portanto, a previsão média móvel simples tende a ficar para trás de pontos de viragem em cerca de 1/945 períodos. Por exemplo, quando 945 0,5 o atraso é 2 períodos quando 945 0,2 o atraso é de 5 períodos quando 945 0,1 o atraso é de 10 períodos, e assim por diante. Para uma dada idade média (isto é, a quantidade de atraso), a previsão de suavização exponencial simples (SES) é um pouco superior à previsão de média móvel simples (SMA) porque coloca relativamente mais peso na observação mais recente - i. e. É ligeiramente mais quotresponsivequot às mudanças que ocorrem no passado recente. Por exemplo, um modelo SMA com 9 termos e um modelo SES com 945 0,2 têm uma idade média de 5 para os dados nas suas previsões, mas o modelo SES coloca mais peso nos últimos 3 valores do que o modelo SMA e no modelo SMA. Uma outra vantagem importante do modelo SES sobre o modelo SMA é que o modelo SES usa um parâmetro de suavização que é continuamente variável, de modo que pode ser facilmente otimizado Usando um algoritmo quotsolverquot para minimizar o erro quadrático médio. O valor óptimo de 945 no modelo SES para esta série revela-se 0.2961, como mostrado aqui: A idade média dos dados nesta previsão é de 1 / 0.2961 3.4 períodos, que é semelhante ao de um 6-termo simples de movimento média. As previsões a longo prazo do modelo SES são uma linha reta horizontal. Como no modelo SMA eo modelo de caminhada aleatória sem crescimento. No entanto, note que os intervalos de confiança calculados por Statgraphics agora divergem de uma forma razoavelmente aparente, e que eles são substancialmente mais estreitos do que os intervalos de confiança para o modelo de caminhada aleatória. O modelo SES assume que a série é um tanto mais previsível do que o modelo de caminhada aleatória. Um modelo SES é realmente um caso especial de um modelo ARIMA. De modo que a teoria estatística dos modelos ARIMA fornece uma base sólida para o cálculo de intervalos de confiança para o modelo SES. Em particular, um modelo SES é um modelo ARIMA com uma diferença não sazonal, um termo MA (1) e nenhum termo constante. Também conhecido como um modelo quimétrico ARIMA (0,1,1) sem constantequot. O coeficiente MA (1) no modelo ARIMA corresponde à quantidade 1-945 no modelo SES. Por exemplo, se você ajustar um modelo ARIMA (0,1,1) sem constante à série aqui analisada, o coeficiente MA estimado (1) resulta ser 0,7029, que é quase exatamente um menos 0,2961. É possível adicionar a hipótese de uma tendência linear constante não-zero para um modelo SES. Para isso, basta especificar um modelo ARIMA com uma diferença não sazonal e um termo MA (1) com uma constante, ou seja, um modelo ARIMA (0,1,1) com constante. As previsões a longo prazo terão então uma tendência que é igual à tendência média observada ao longo de todo o período de estimação. Você não pode fazer isso em conjunto com o ajuste sazonal, porque as opções de ajuste sazonal são desativadas quando o tipo de modelo é definido como ARIMA. No entanto, você pode adicionar uma tendência exponencial de longo prazo constante a um modelo de suavização exponencial simples (com ou sem ajuste sazonal) usando a opção de ajuste de inflação no procedimento de Previsão. A taxa adequada de inflação (crescimento percentual) por período pode ser estimada como o coeficiente de declive num modelo de tendência linear ajustado aos dados em conjunto com uma transformação de logaritmo natural, ou pode basear-se em outra informação independente sobre as perspectivas de crescimento a longo prazo . (Retornar ao início da página.) Browns Linear (ie double) Suavização exponencial Os modelos SMA e SES assumem que não há tendência de qualquer tipo nos dados (o que geralmente é OK ou pelo menos não muito ruim para 1- Antecipadamente quando os dados são relativamente ruidosos) e podem ser modificados para incorporar uma tendência linear constante como mostrado acima. O que acontece com as tendências a curto prazo Se uma série exibe uma taxa variável de crescimento ou um padrão cíclico que se destaque claramente contra o ruído, e se houver uma necessidade de prever mais de um período à frente, a estimativa de uma tendência local também pode ser um problema. O modelo de suavização exponencial simples pode ser generalizado para obter um modelo de suavização exponencial linear (LES) que calcula estimativas locais de nível e tendência. O modelo de tendência de variação de tempo mais simples é o modelo de alisamento exponencial linear de Browns, que usa duas séries suavizadas diferentes que são centradas em diferentes pontos no tempo. A fórmula de previsão é baseada em uma extrapolação de uma linha através dos dois centros. (Uma versão mais sofisticada deste modelo, Holt8217s, é discutida abaixo.) A forma algébrica do modelo de suavização exponencial linear de Brown8217s, como a do modelo de suavização exponencial simples, pode ser expressa em um número de formas diferentes mas equivalentes. A forma quotstandard deste modelo é usualmente expressa da seguinte maneira: Seja S a série de suavização simples obtida pela aplicação de suavização exponencial simples à série Y. Ou seja, o valor de S no período t é dado por: (Lembre-se que, sob simples Exponencial, esta seria a previsão para Y no período t1.) Então deixe Squot denotar a série duplamente-alisada obtida aplicando a suavização exponencial simples (usando o mesmo 945) à série S: Finalmente, a previsão para Y tk. Para qualquer kgt1, é dada por: Isto produz e 1 0 (isto é, enganar um pouco e deixar a primeira previsão igual à primeira observação real) e e 2 Y 2 8211 Y 1. Após o que as previsões são geradas usando a equação acima. Isto produz os mesmos valores ajustados que a fórmula baseada em S e S se estes últimos foram iniciados utilizando S 1 S 1 Y 1. Esta versão do modelo é usada na próxima página que ilustra uma combinação de suavização exponencial com ajuste sazonal. Holt8217s Linear Exponential Smoothing Brown8217s O modelo LES calcula estimativas locais de nível e tendência ao suavizar os dados recentes, mas o fato de que ele faz isso com um único parâmetro de suavização coloca uma restrição nos padrões de dados que é capaz de ajustar: o nível ea tendência Não são permitidos variar em taxas independentes. Holt8217s modelo LES aborda esta questão, incluindo duas constantes de alisamento, um para o nível e um para a tendência. Em qualquer momento t, como no modelo Brown8217s, existe uma estimativa L t do nível local e uma estimativa T t da tendência local. Aqui eles são calculados recursivamente a partir do valor de Y observado no tempo t e as estimativas anteriores do nível e tendência por duas equações que aplicam alisamento exponencial para eles separadamente. Se o nível estimado ea tendência no tempo t-1 são L t82091 e T t-1. Respectivamente, então a previsão para Y tshy que teria sido feita no tempo t-1 é igual a L t-1 T t-1. Quando o valor real é observado, a estimativa atualizada do nível é computada recursivamente pela interpolação entre Y tshy e sua previsão, L t-1 T t-1, usando pesos de 945 e 1-945. A mudança no nível estimado, Nomeadamente L t 8209 L t82091. Pode ser interpretado como uma medida ruidosa da tendência no tempo t. A estimativa actualizada da tendência é então calculada recursivamente pela interpolação entre L t 8209 L t82091 e a estimativa anterior da tendência, T t-1. Usando pesos de 946 e 1-946: A interpretação da constante de suavização de tendência 946 é análoga à da constante de alisamento de nível 945. Modelos com valores pequenos de 946 assumem que a tendência muda apenas muito lentamente ao longo do tempo, enquanto modelos com Maior 946 supor que está mudando mais rapidamente. Um modelo com um 946 grande acredita que o futuro distante é muito incerto, porque os erros na tendência-estimativa tornam-se completamente importantes ao prever mais de um período adiante. As constantes de suavização 945 e 946 podem ser estimadas da maneira usual, minimizando o erro quadrático médio das previsões de 1 passo à frente. Quando isso é feito em Statgraphics, as estimativas se tornam 945 0,3048 e 946 0,008. O valor muito pequeno de 946 significa que o modelo assume muito pouca mudança na tendência de um período para o outro, então basicamente este modelo está tentando estimar uma tendência de longo prazo. Por analogia com a noção de idade média dos dados que é usada na estimativa do nível local da série, a idade média dos dados que é usada na estimativa da tendência local é proporcional a 1/946, embora não exatamente igual a isto. Neste caso, isto é 1 / 0.006 125. Este número é muito preciso, na medida em que a precisão da estimativa de 946 é realmente de 3 casas decimais, mas é da mesma ordem geral de magnitude que o tamanho da amostra de 100 , Assim que este modelo está calculando a média sobre bastante muita história em estimar a tendência. O gráfico de previsão abaixo mostra que o modelo LES estima uma tendência local ligeiramente maior no final da série do que a tendência constante estimada no modelo SEStrend. Além disso, o valor estimado de 945 é quase idêntico ao obtido pelo ajuste do modelo SES com ou sem tendência, de modo que este é quase o mesmo modelo. Agora, eles parecem previsões razoáveis ​​para um modelo que é suposto estar estimando uma tendência local Se você 8220eyeball8221 esse enredo, parece que a tendência local virou para baixo no final da série O que aconteceu Os parâmetros deste modelo Foram estimados minimizando o erro quadrático das previsões de um passo à frente, e não as previsões a mais longo prazo, caso em que a tendência não faz muita diferença. Se tudo o que você está olhando são 1-passo-frente erros, você não está vendo a imagem maior de tendências sobre (digamos) 10 ou 20 períodos. A fim de obter este modelo mais em sintonia com a nossa extrapolação do globo ocular dos dados, podemos ajustar manualmente a tendência de suavização constante para que ele usa uma linha de base mais curto para a estimativa de tendência. Por exemplo, se escolhemos definir 946 0,1, então a idade média dos dados usados ​​na estimativa da tendência local é de 10 períodos, o que significa que estamos fazendo uma média da tendência ao longo dos últimos 20 períodos aproximadamente. Here8217s o que o lote de previsão parece se ajustarmos 946 0.1 mantendo 945 0.3. Isso parece intuitivamente razoável para esta série, embora seja provavelmente perigoso para extrapolar esta tendência mais de 10 períodos no futuro. E sobre as estatísticas de erro Aqui está uma comparação de modelos para os dois modelos mostrados acima, bem como três modelos SES. O valor ótimo de 945 para o modelo SES é de aproximadamente 0,3, mas resultados semelhantes (com ligeiramente mais ou menos responsividade, respectivamente) são obtidos com 0,5 e 0,2. (A) Holts linear exp. Alisamento com alfa 0,3048 e beta 0,008 (B) Holts linear exp. Alisamento com alfa 0,3 e beta 0,1 (C) Alisamento exponencial simples com alfa 0,5 (D) Alisamento exponencial simples com alfa 0,3 (E) Alisamento exponencial simples com alfa 0,2 Suas estatísticas são quase idênticas, então realmente não podemos fazer a escolha com base De erros de previsão de 1 passo à frente dentro da amostra de dados. Temos de recorrer a outras considerações. Se acreditarmos firmemente que faz sentido basear a estimativa de tendência atual sobre o que aconteceu nos últimos 20 períodos, podemos fazer um caso para o modelo LES com 945 0,3 e 946 0,1. Se quisermos ser agnósticos quanto à existência de uma tendência local, então um dos modelos SES pode ser mais fácil de explicar e também fornecerá mais previsões de médio-caminho para os próximos 5 ou 10 períodos. Evidências empíricas sugerem que, se os dados já tiverem sido ajustados (se necessário) para a inflação, então pode ser imprudente extrapolar os resultados lineares de curto prazo Muito para o futuro. As tendências evidentes hoje podem afrouxar no futuro devido às causas variadas tais como a obsolescência do produto, a competição aumentada, e os abrandamentos cíclicos ou as ascensões em uma indústria. Por esta razão, a suavização exponencial simples geralmente desempenha melhor fora da amostra do que poderia ser esperado, apesar da sua extrapolação de tendência horizontal quotnaivequot. Modificações de tendência amortecida do modelo de suavização exponencial linear também são freqüentemente usadas na prática para introduzir uma nota de conservadorismo em suas projeções de tendência. O modelo LES com tendência a amortecimento pode ser implementado como um caso especial de um modelo ARIMA, em particular, um modelo ARIMA (1,1,2). É possível calcular intervalos de confiança em torno de previsões de longo prazo produzidas por modelos exponenciais de suavização, considerando-os como casos especiais de modelos ARIMA. A largura dos intervalos de confiança depende de (i) o erro RMS do modelo, (ii) o tipo de suavização (simples ou linear) (iii) o valor (S) da (s) constante (s) de suavização e (iv) o número de períodos que você está prevendo. Em geral, os intervalos se espalham mais rapidamente à medida que o 945 se torna maior no modelo SES e eles se espalham muito mais rápido quando se usa linear ao invés de alisamento simples. Este tópico é discutido mais adiante na seção de modelos ARIMA das notas. (Voltar ao topo da página.)


No comments:

Post a Comment