Monday, February 20, 2017

Autoregressive Mobile Moyenne Expliquée

Objectif: Contrôler l'aléatoire Les courbes d'autocorrélation (Box et Jenkins, p. 28-32) sont un outil couramment utilisé pour vérifier le caractère aléatoire dans un ensemble de données. Ce caractère aléatoire est déterminé en calculant des autocorrélations pour des valeurs de données à différents décalages temporels. Si elles sont aléatoires, ces autocorrélations devraient être proches de zéro pour toutes les séparations temporelles. Si elle n'est pas aléatoire, une ou plusieurs des autocorrélations seront significativement non nulles. De plus, les diagrammes d'autocorrélation sont utilisés dans le modèle d'identification des modèles auto-régressifs de Box-Jenkins, modèles de séries temporelles mobiles. L'autocorrélation est une seule mesure de l'aléa Notez que non corrélée ne signifie pas nécessairement aléatoire. Les données qui ont une autocorrélation significative n'est pas aléatoire. Cependant, les données qui ne montrent pas d'autocorrélation significative peuvent encore présenter un caractère non aléatoire d'autres façons. L'autocorrélation n'est qu'une mesure du hasard. Dans le contexte de la validation de modèle (qui est le type primaire de hasard que nous décrivons dans le Manuel), la vérification de l'autocorrélation est généralement un test de hasard suffisant puisque les résidus d'un mauvais modèle d'ajustement ont tendance à afficher un aléatoire non subtil. Cependant, certaines applications nécessitent une détermination plus rigoureuse du caractère aléatoire. Dans ces cas, une batterie de tests, qui peuvent inclure la vérification de l'autocorrélation, sont appliqués puisque les données peuvent être non aléatoires de nombreuses façons différentes et souvent subtiles. Un exemple de l'endroit où un contrôle plus rigoureux pour le hasard est nécessaire serait dans le test des générateurs de nombres aléatoires. Exemple de tracé: Les autocorrélations devraient être proches de zéro pour le hasard. Ce n'est pas le cas dans cet exemple et donc l'hypothèse de hasard échoue. Cet exemple de graphique d'autocorrélation montre que la série chronologique n'est pas aléatoire, mais présente plutôt un degré élevé d'autocorrélation entre des observations adjacentes et presque adjacentes. Définition: r (h) versus h Les tracés d'autocorrélation sont formés par l'axe vertical: Coefficient d'autocorrélation où C h est la fonction d'autocovariance et C 0 est la fonction de variance Notez que R h est compris entre -1 et 1. Notez que certaines sources peuvent utiliser le Formule suivante pour la fonction d'autocovariance Bien que cette définition ait moins de biais, la formulation (1 N) présente certaines propriétés statistiques souhaitables et est la forme la plus couramment utilisée dans la littérature statistique. Voir les pages 20 et 49-50 dans Chatfield pour plus de détails. Axe horizontal: Décalage h (h 1, 2, 3.) La ligne ci-dessus contient également plusieurs lignes de référence horizontales. La ligne médiane est à zéro. Les quatre autres lignes sont 95 et 99 bandes de confiance. Notez qu'il existe deux formules distinctes pour générer les bandes de confiance. Si le graphe d'autocorrélation est utilisé pour tester le caractère aléatoire (c'est-à-dire qu'il n'y a pas de dépendance temporelle dans les données), on recommande la formule suivante: où N est la taille de l'échantillon, z est la fonction de distribution cumulative de la distribution normale normale et ) Est le niveau de signification. Dans ce cas, les bandes de confiance ont une largeur fixe qui dépend de la taille de l'échantillon. C'est la formule qui a servi à générer les bandes de confiance dans le graphique ci-dessus. Les diagrammes d'autocorrélation sont également utilisés dans l'étape d'identification du modèle pour l'ajustement des modèles ARIMA. Dans ce cas, un modèle de moyenne mobile est supposé pour les données et les bandes de confiance suivantes doivent être générées: où k est le lag, N est la taille de l'échantillon, z est la fonction de distribution cumulative de la distribution normale standard et (alpha) est Le niveau de signification. Dans ce cas, les bandes de confiance augmentent à mesure que le décalage augmente. Le diagramme d'autocorrélation peut fournir des réponses aux questions suivantes: Les données aléatoires Est-ce une observation liée à une observation adjacente Est-ce une observation liée à une observation à deux reprises (etc.) Est la série chronologique observée le bruit blanc Est-ce que la série chronologique observée est sinusoïdale Est-ce que la série chronologique observée est autorégressive Qu'est-ce qu'un modèle approprié pour les séries temporelles observées? Le modèle est-il valable et suffisant? La formule s sqqt est-elle valide? L'une des quatre hypothèses qui sous-tendent généralement tous les processus de mesure. L'hypothèse du hasard est d'une importance critique pour les trois raisons suivantes: La plupart des tests statistiques standard dépendent du caractère aléatoire. La validité des conclusions du test est directement liée à la validité de l'hypothèse de randomisation. De nombreuses formules statistiques couramment utilisées dépendent de l'hypothèse de randomisation, la formule la plus courante étant la formule pour déterminer l'écart-type de la moyenne de l'échantillon: où s est l'écart-type des données. Bien que fortement utilisé, les résultats de l'utilisation de cette formule n'ont aucune valeur à moins que l'hypothèse de l'aléatoire tient. Pour les données univariées, le modèle par défaut est Si les données ne sont pas aléatoires, ce modèle est incorrect et non valide, et les estimations pour les paramètres (comme la constante) deviennent non-sens et non valides. En bref, si l'analyste ne vérifie pas le caractère aléatoire, la validité de nombreuses conclusions statistiques devient suspecte. Le diagramme d'autocorrélation est un excellent moyen de vérifier l'existence d'un tel aléa. Un modèle RIMA signifie Autoregressive Integrated Moving Average. Univariée (vecteur unique) ARIMA est une technique de prévision qui projette les valeurs futures d'une série basée entièrement sur sa propre inertie. Sa principale application est dans le domaine de la prévision à court terme nécessitant au moins 40 points de données historiques. Il fonctionne mieux lorsque vos données présentent un modèle stable ou cohérent avec le temps avec un minimum de valeurs aberrantes. Parfois appelé Box-Jenkins (après les auteurs originaux), ARIMA est généralement supérieur aux techniques de lissage exponentiel quand les données sont raisonnablement longues et la corrélation entre les observations passées est stable. Si les données sont courtes ou très volatiles, une méthode de lissage peut avoir un meilleur rendement. Si vous n'avez pas au moins 38 points de données, vous devriez considérer une autre méthode que ARIMA. La première étape de l'application de la méthodologie ARIMA est de vérifier la stationnarité. La stationnarité implique que la série reste à un niveau relativement constant dans le temps. Si une tendance existe, comme dans la plupart des applications économiques ou commerciales, vos données ne sont PAS stationnaires. Les données devraient également montrer une variance constante de ses fluctuations dans le temps. Cela se voit facilement avec une série qui est fortement saisonnière et croissant à un rythme plus rapide. Dans un tel cas, les hauts et les bas de la saisonnalité deviendront plus dramatiques avec le temps. Sans ces conditions de stationnarité rencontrées, un grand nombre des calculs associés au procédé ne peuvent pas être calculés. Si une représentation graphique des données indique la non-stationnalité, alors vous devez faire une différence entre les séries. La différence est un excellent moyen de transformer une série non stationnaire en stationnaire. Ceci est fait en soustrayant l'observation dans la période courante de la précédente. Si cette transformation n'est effectuée qu'une seule fois dans une série, vous dites que les données ont été différenciées pour la première fois. Ce processus élimine essentiellement la tendance si votre série croît à un taux assez constant. Si elle croît à un rythme croissant, vous pouvez appliquer la même procédure et la différence les données à nouveau. Vos données seraient ensuite secondées. Les autocorrélations sont des valeurs numériques qui indiquent comment une série de données est liée à elle-même dans le temps. Plus précisément, elle mesure à quel point les valeurs de données à un certain nombre de périodes séparées sont corrélées les unes aux autres dans le temps. Le nombre de périodes d'intervalle est généralement appelé le décalage. Par exemple, une autocorrélation au décalage 1 mesure comment les valeurs 1 période séparées sont corrélées les unes aux autres tout au long de la série. Une autocorrélation au décalage 2 mesure comment les données deux périodes séparées sont corrélées tout au long de la série. Les autocorrélations peuvent varier de 1 à -1. Une valeur proche de 1 indique une corrélation positive élevée alors qu'une valeur proche de -1 implique une corrélation négative élevée. Ces mesures sont le plus souvent évaluées par des parcelles graphiques appelées corrélagrammes. Un corrélogramme trace les valeurs d'autocorrélation pour une série donnée à différents décalages. Ceci est appelé la fonction d'autocorrélation et est très important dans la méthode ARIMA. La méthodologie ARIMA tente de décrire les mouvements d'une série temporelle stationnaire en fonction de ce que l'on appelle les paramètres autorégressifs et de moyenne mobile. Ceux-ci sont appelés paramètres AR (autoregessive) et MA (moyennes mobiles). Un modèle AR avec un seul paramètre peut être écrit comme. X (t) A (1) X (t-1) E (t) où X (t) séries temporelles sous enquête A (1) le paramètre autorégressif d'ordre 1 X (t-1) (T) le terme d'erreur du modèle Cela signifie simplement que toute valeur donnée X (t) peut être expliquée par une fonction de sa valeur précédente, X (t-1), plus une erreur aléatoire inexplicable, E (t). Si la valeur estimée de A (1) était de 0,30, alors la valeur actuelle de la série serait liée à 30 de sa valeur il y a une période. Bien sûr, la série pourrait être liée à plus d'une valeur passée. Par exemple, X (t) A (1) X (t-1) A (2) X (t-2) E (t) Cela indique que la valeur courante de la série est une combinaison des deux valeurs immédiatement précédentes, X (t-1) et X (t-2), plus une erreur aléatoire E (t). Notre modèle est maintenant un modèle autorégressif de l'ordre 2. Modèles de moyenne mobile: Un deuxième type de modèle de Box-Jenkins est appelé un modèle de moyenne mobile. Bien que ces modèles semblent très semblables au modèle AR, le concept derrière eux est tout à fait différent. Les paramètres de la moyenne mobile rapportent ce qui se produit dans la période t seulement aux erreurs aléatoires qui se sont produites dans des périodes passées, c'est-à-dire E (t-1), E (t-2), etc. plutôt que X (t-1) T-2), (Xt-3) comme dans les approches autorégressives. Un modèle de moyenne mobile avec un terme MA peut s'écrire comme suit. X (t) - B (1) E (t-1) E (t) Le terme B (1) est appelé MA d'ordre 1. Le signe négatif devant le paramètre est utilisé uniquement pour la convention et est habituellement imprimé Automatiquement par la plupart des programmes informatiques. Le modèle ci-dessus dit simplement que toute valeur donnée de X (t) est directement liée uniquement à l'erreur aléatoire de la période précédente, E (t-1), et au terme d'erreur courant E (t). Comme dans le cas des modèles autorégressifs, les modèles de moyenne mobile peuvent être étendus à des structures d'ordre supérieur couvrant différentes combinaisons et des longueurs moyennes mobiles. La méthodologie ARIMA permet également de construire des modèles intégrant à la fois des paramètres autorégressifs et des paramètres de la moyenne mobile. Ces modèles sont souvent appelés modèles mixtes. Bien que cela constitue un outil de prévision plus compliqué, la structure peut en effet simuler la série mieux et produire une prévision plus précise. Les modèles purs impliquent que la structure ne se compose que de paramètres AR ou MA - pas les deux. Les modèles développés par cette approche sont habituellement appelés modèles ARIMA car ils utilisent une combinaison d'auto-régression (AR), d'intégration (I) - se référant au processus inverse de différenciation pour produire les opérations de prévision et de moyenne mobile (MA). Un modèle ARIMA est habituellement déclaré comme ARIMA (p, d, q). Cela représente l'ordre des composantes autorégressives (p), le nombre d'opérateurs de différenciation (d) et l'ordre le plus élevé du terme moyen mobile. Par exemple, ARIMA (2,1,1) signifie que vous avez un modèle autorégressif de second ordre avec une composante moyenne mobile de premier ordre dont la série a été différenciée une fois pour induire la stationnarité. Picking the Right Specification: Le principal problème dans le classique Box-Jenkins est d'essayer de décider quelle spécification ARIMA à utiliser - i. e. Combien de paramètres AR et / ou MA à inclure. C'est ce que beaucoup de Box-Jenkings 1976 a été consacré au processus d'identification. Elle dépend de l'éva - luation graphique et numérique des fonctions d'autocorrélation et d'autocorrélation partielle. Eh bien, pour vos modèles de base, la tâche n'est pas trop difficile. Chacun a des fonctions d'autocorrélation qui ont une certaine apparence. Cependant, lorsque vous montez en complexité, les motifs ne sont pas facilement détectés. Pour rendre les choses plus difficiles, vos données ne représentent qu'un échantillon du processus sous-jacent. Cela signifie que les erreurs d'échantillonnage (valeurs aberrantes, erreurs de mesure, etc.) peuvent fausser le processus d'identification théorique. C'est pourquoi la modélisation ARIMA traditionnelle est un art plutôt que d'une science. Autoregressive moyenne mobile intégré - ARIMA DEFINITION de Moyenne mobile intégrée autorégressive - ARIMA Un modèle d'analyse statistique qui utilise des données de séries chronologiques pour prédire les tendances futures. C'est une forme d'analyse de régression qui cherche à prédire les mouvements futurs le long de la marche apparemment aléatoire prise par les stocks et le marché financier en examinant les différences entre les valeurs dans la série au lieu d'utiliser les valeurs des données réelles. Lags des séries différenciées sont appelés autorégressifs et les décalages dans les données prévues sont appelés moyenne mobile. Rupture descendante Moyenne mobile auto-régressive - ARIMA Ce type de modèle est généralement appelé ARIMA (p, d, q), les entiers se rapportant à l'autorégressif. Intégrées et mobiles de l'ensemble de données, respectivement. La modélisation ARIMA peut prendre en compte les tendances, la saisonnalité. Cycles, erreurs et aspects non stationnaires d'un ensemble de données lors de la réalisation de prévisions.


No comments:

Post a Comment