Théorie économétrique Corrélation des données Il existe des temps, en particulier dans les séries chronologiques, que l'hypothèse CLR de c o r r (t. T 1) 0, epsilon) 0 est rompue. Ceci est connu dans l'économétrie comme corrélation sérielle ou autocorrélation. Cela signifie que c o r r (t. T 1) 0, epsilon) neq 0 et il existe un modèle à travers les termes d'erreur. Les termes d'erreur ne sont alors pas répartis indépendamment entre les observations et ne sont pas strictement aléatoires. Exemples d'édition d'autocorrélation Lorsque le terme d'erreur est lié au terme d'erreur précédent, il peut être écrit dans une équation algébrique. T t 1 u r epsilon u où est le coefficient d'autocorrélation entre les deux termes de perturbation, et u est le terme de perturbation pour l'autocorrélation. C'est ce qu'on appelle un processus autorégressif. 1 lt c o r r (t. T 1) lt 1, epsilon) lt1 Le u est nécessaire dans l'équation parce que bien que le terme d'erreur soit moins aléatoire, il a encore un léger effet aléatoire. Corrélation en série du Nième ordre Modification Autoregressive Modification Process Autoregressive de premier ordre, AR (1). T t 1 u t rho epsilon u Ceci est connu sous le nom d'autorégression de premier ordre, en raison du terme d'erreur uniquement en fonction du terme d'erreur précédent. Nème ordre Processus Autoregressif, AR (n). La notation MA (q) se réfère au modèle de moyenne mobile d'ordre q: X tti 1 qiti mu varepsilon somme theta varepsilon, où le 1 . Q sont les paramètres du modèle, est l'attente de X t (souvent supposé égal à 0), et le t. T 1. Sont de nouveau, les termes d'erreur de bruit blanc. Le modèle de la moyenne mobile est essentiellement un filtre de réponse impulsionnelle finie avec une interprétation supplémentaire placée sur elle. Autoregressivemoving-average model Modifier La notation ARMA (p. Q) se réfère au modèle avec p termes autorégressifs et q termes de moyenne mobile. Ce modèle contient les modèles AR (p) et MA (q), X t c t i 1 p i X t i i 1 q i t i. Cvarepsilon sum varphi X somme theta varepsilon., Causes de l'autocorrelation Edit c o r r (t. T 1) 0, epsilon) neq 0 L'autocorrélation spatiale se produit lorsque les deux erreurs sont spécialement ou géographiquement liées. En termes plus simples, ils sont à côté de chacun. Exemples: La ville de St. Paul a un pic de criminalité et donc ils embauchent police supplémentaire. L'année suivante, ils ont constaté que le taux de criminalité a diminué de manière significative. Étonnamment, la ville de Minneapolis, qui n'avait pas ajusté sa force de police, constate qu'ils ont une augmentation du taux de criminalité sur la même période. Note: ce type d'Autocorrélation se produit sur des échantillons transversaux. InertiaTime to Adjust Cela se produit souvent dans Macro, données de séries chronologiques. Le taux d'intérêt américain augmente de façon inattendue et il y a donc une variation des taux de change avec d'autres pays. Atteindre un nouvel équilibre pourrait prendre du temps. Influences prolongées Il s'agit là encore d'une série de séries chronologiques traitant des chocs économiques. Il est maintenant prévu que le taux d'intérêt américain augmentera. Les taux de change associés s'ajusteront lentement jusqu'à l'annonce de la Réserve fédérale et peuvent dépasser l'équilibre. Data SmoothingManipulation L'utilisation de fonctions pour lisser les données entraînera l'autocorrélation dans les termes de perturbation Misspecification Une régression montrera souvent des signes d'autocorrélation quand il y a des variables omises. Puisque la variable indépendante manquante existe maintenant dans le terme de perturbation, on obtient un terme de perturbation qui ressemble à: t 2 X 2 ut beta X u lorsque la spécification correcte est Y t 0 1 X 1 2 X 2 ut beta bêta X bêta X u Conséquences de l'autocorrélation Modifier Le problème principal de l'autocorrélation est qu'il peut rendre un modèle meilleur que ce qu'il est réellement. Liste des conséquences Les coefficients sont toujours impartiaux E (t) 0. c o v (X t. U t) 0) cov (X, u) 0 La variance vraie de est augmentée par la présence d'autocorrélations. La variance estimée de est plus petite en raison de l'autocorrélation (biaisée vers le bas). Une diminution de s e ()) et une augmentation de la statistique t ce résultat dans l'estimateur regardant plus précis que ce qu'il est réellement. R devient gonflé. Tous ces problèmes entraînent l'invalidation des tests d'hypothèse. Autocorrélation des données. 2, mais le vrai MCO, que nous n'aurions jamais trouvé, se trouve quelque part au milieu. Test pour l'édition d'autocorrélation Bien qu'il ne soit pas concluant, on peut obtenir une impression en affichant un graphique de la variable dépendante par rapport au terme d'erreur (à savoir, un diagramme de dispersion résiduel). Test de Durbin-Watson: Supposons que tt 1 ut epsilon rho u Test H (0): 0 (pas AC) contre H (1): gt 0 (test unilatéral) Test statistique DW (tt 1) 2 2 2 2 - epsilon ) 2-2rho Toute valeur sous D (L) (dans la table DW) rejette l'hypothèse nulle et AC existe. Toute valeur entre D (L) et D (W) nous laisse sans conclusion de AC. Toute valeur supérieure à D (W) accepte l'hypothèse nulle et AC n'existe pas. Notez, il s'agit d'un test de queue. Obtenir l'autre queue. (P, d, q) Modèles pour l 'analyse des séries chronologiques Dans les ensembles d' articles précédents (parties 1, 2 et 3), nous avons analysé de façon significative le RA P), MA (q) et ARMA (p, q) modèles de séries chronologiques linéaires. Nous avons utilisé ces modèles pour générer des ensembles de données simulées, des modèles adaptés pour récupérer les paramètres et ensuite appliqué ces modèles aux données sur les actions financières. Dans cet article, nous allons discuter d'une extension du modèle ARMA, à savoir le modèle de moyenne mobile intégrée Autoregressive, ou ARIMA (p, d, q). Nous verrons qu'il est nécessaire de considérer le modèle ARIMA lorsque nous avons des séries non stationnaires. Ces séries se produisent en présence de tendances stochastiques. Récapitulatif et prochaines étapes Nous avons étudié les modèles suivants (les liens vous amèneront aux articles appropriés): Nous avons constamment développé notre compréhension des séries chronologiques avec des concepts tels que la corrélation en série, la stationnarité, la linéarité, les résidus, les corrélogrammes, La simulation, l'ajustement, la saisonnalité, l'hétéroscédasticité conditionnelle et les tests d'hypothèses. À ce jour, nous n'avons pas effectué de prévision ou de prévision à partir de nos modèles et nous n'avons donc eu aucun mécanisme pour produire un système de négociation ou une courbe de capitaux propres. Une fois que nous avons étudié ARIMA (dans cet article), ARCH et GARCH (dans les prochains articles), nous serons en mesure de construire une stratégie de base à long terme de négociation basée sur la prévision des rendements de l'indice boursier. Malgré le fait que je suis entré dans beaucoup de détails sur les modèles que nous savons ne sera finalement pas avoir de grandes performances (AR, MA, ARMA), nous sommes maintenant bien versé dans le processus de modélisation de séries chronologiques. Cela signifie que, lorsque nous étudierons des modèles plus récents (et même ceux qui sont actuellement dans la littérature de recherche), nous aurons une base de connaissances importante sur laquelle nous pouvons tirer, afin d'évaluer efficacement ces modèles, au lieu de les traiter comme une clé Prescription ou boîte noire. Plus important encore, il nous donnera la confiance pour les étendre et les modifier par nous-mêmes et comprendre ce que nous faisons quand nous le faisons. Je tiens à vous remercier d'être patient jusqu'à présent, car il semblerait que ces articles sont loin de L'action réelle de la négociation réelle. Cependant, la véritable recherche commerciale quantitative est soigneuse, mesurée et prend beaucoup de temps pour obtenir la bonne. Il n'y a pas de solution rapide ou d'obtenir un régime riche en trading quanti. Nous étions presque prêts à considérer notre premier modèle commercial, qui sera un mélange d'ARIMA et de GARCH, il est donc impératif que nous passions un peu de temps à comprendre le modèle ARIMA bien Une fois que nous avons construit notre premier modèle commercial, nous allons envisager plus Des modèles avancés tels que les processus à mémoire longue, les modèles d'espace d'état (c'est-à-dire le filtre de Kalman) et les modèles vectoriels autorégressifs (VAR), qui nous mèneront à d'autres stratégies de négociation plus sophistiquées. Moyenne mobile autorégressive intégrée (ARIMA) Les modèles d'ordre p, d, q sont utilisés car ils peuvent réduire une série non stationnaire à une série stationnaire en utilisant une séquence d'étapes de différenciation. On peut se rappeler, à partir de l'article sur le bruit blanc et les randonnées aléatoires, que si l'on applique l'opérateur différence à une série aléatoire de marche (une série non stationnaire), on reste avec le bruit blanc (une série stationnaire): begin nabla xt xt - x wt Fin ARIMA effectue essentiellement cette fonction, mais le fait à plusieurs reprises, d fois, afin de réduire une série non-stationnaire à un stationnaire. Pour gérer d'autres formes de non-stationnarité au-delà des tendances stochastiques, des modèles supplémentaires peuvent être utilisés. Les effets de saisonnalité (tels que ceux qui se produisent dans les prix des matières premières) peuvent être abordés avec le modèle saisonnier ARIMA (SARIMA), mais nous ne discuterons pas SARIMA beaucoup dans cette série. Les effets hétéroscédastiques conditionnels (comme avec le regroupement de la volatilité dans les indices d'actions) peuvent être abordés avec ARCHGARCH. Dans cet article, nous examinerons les séries non stationnaires avec des tendances stochastiques et adaptons les modèles ARIMA à ces séries. Nous allons enfin produire des prévisions pour notre série financière. Définitions Avant de définir les processus ARIMA nous devons discuter le concept d'une série intégrée: Série intégrée d'ordre d Une série temporelle est intégrée de l'ordre d. I d), si: begin nablad xt wt end C'est-à-dire que si nous différencions la série d fois nous recevons une série discrète de bruit blanc. Autrement dit, en utilisant l'opérateur de décalage vers l'arrière une condition équivalente est: Maintenant que nous avons défini une série intégrée, nous pouvons définir le processus ARIMA lui-même: Moyenne mobile auto-régressive Modèle d'ordre p, d, q Une série chronologique est un modèle de moyenne mobile autorégressif intégré D'ordre p, d, q. ARIMA (p, d, q). Si nablad xt est une moyenne mobile autorégressive d'ordre p, q, ARMA (p, q). C'est-à-dire, si la série est différenciée d fois, et qu'elle suit alors un processus ARMA (p, q), alors il s'agit d'une série ARIMA (p, d, q). Si nous utilisons la notation polynomiale de la partie 1 et la partie 2 de la série ARMA, un processus ARIMA (p, d, q) peut être écrit en termes d'opérateur de décalage vers l'arrière. : Où wt est une série de bruit blanc discrète. Il ya quelques points à noter sur ces définitions. Puisque la marche aléatoire est donnée par xt x wt on peut voir que I (1) est une autre représentation, puisque nabla1 xt wt. Si nous soupçonnons une tendance non linéaire, nous pourrions être en mesure d'utiliser la différenciation répétée (c'est-à-dire d gt 1) pour réduire une série au bruit blanc stationnaire. Dans R, nous pouvons utiliser la commande diff avec des paramètres supplémentaires, p. Ex. Diff (x, d3) pour effectuer des différences répétées. Simulation, corrélogramme et adaptation de modèle Comme nous avons déjà utilisé la commande arima. sim pour simuler un processus ARMA (p, q), la procédure suivante sera similaire à celle effectuée dans la partie 3 de la série ARMA. La principale différence est que nous allons maintenant d1, c'est-à-dire que nous allons produire une série temporelle non stationnaire avec une composante de tendance stochastique. Comme avant, nous allons adapter un modèle ARIMA à nos données simulées, essayer de récupérer les paramètres, créer des intervalles de confiance pour ces paramètres, produire un corrélogramme des résidus du modèle ajusté et enfin effectuer un test Ljung-Box pour établir si nous avons un bon ajustement. Nous allons simuler un modèle ARIMA (1,1,1), avec le coefficient autorégressif alpha0,6 et le coefficient moyen mobile β-0,5. Voici le code R pour simuler et tracer une telle série: Maintenant que nous avons notre série simulée, nous allons essayer d'y adapter un modèle ARIMA (1,1,1). Comme nous connaissons l'ordre, nous le spécifierons simplement dans l'ajustement: Les intervalles de confiance sont calculés comme suit: Les deux estimations de paramètres se situent dans les intervalles de confiance et sont proches des vraies valeurs de paramètres de la série ARIMA simulée. Par conséquent, nous ne devrions pas être surpris de voir les résidus ressemblant à une réalisation de bruit blanc discret: Enfin, nous pouvons exécuter un test Ljung-Box pour fournir des preuves statistiques d'un bon ajustement: On voit que la valeur p est significativement plus grande que 0,05 et, en tant que tels, nous pouvons affirmer qu'il existe de fortes preuves que le bruit blanc discret convient bien aux résidus. Par conséquent, le modèle ARIMA (1,1,1) est un bon ajustement, comme prévu. Données financières et prévisions Dans cette section, nous allons adapter les modèles ARIMA à Amazon, Inc. (AMZN) et à l'indice SampP500 US Equity Index (GPSC, dans Yahoo Finance). Nous utiliserons la bibliothèque de prévisions, écrite par Rob J Hyndman. Laisse aller de l'avant et installe la bibliothèque dans R: Maintenant, nous pouvons utiliser quantmod pour télécharger la série de prix quotidienne d'Amazon depuis le début de 2013. Comme nous aurons déjà pris les différences de premier ordre de la série, l'ARIMA ajustement effectué prochainement Ne requiert pas d gt 0 pour la composante intégrée: Comme dans la partie 3 de la série ARMA, nous allons maintenant boucler les combinaisons de p, d et q, pour trouver le modèle ARIMA optimal (p, d, q). Par optimal, nous entendons la combinaison d'ordre qui minimise le critère d'information Akaike (AIC): On peut voir qu'un ordre de p4, d0, q4 a été sélectionné. Si nous traçons le corrélogramme des résidus, nous pouvons voir si nous avons des preuves pour une série de bruit blanc discret: Il ya deux pics significatifs, à savoir à k15 et k21, bien que nous devrions S'attendent à voir des pics statistiquement significatifs simplement en raison de la variation d'échantillonnage 5 du temps. Laisser effectuer un test Ljung-Box (voir l'article précédent) et voir si nous avons des preuves pour un bon ajustement: Comme nous pouvons le voir la valeur p est supérieure à 0,05 et donc nous avons des preuves pour un bon ajustement au niveau 95. Nous pouvons maintenant utiliser la prévision de la bibliothèque de prévisions pour prévoir 25 jours pour la série retours d'Amazon: Nous pouvons voir les prévisions de points pour les 25 prochains jours avec 95 (bleu foncé) et 99 (bleu clair) bandes d'erreur . Nous utiliserons ces prévisions dans notre première stratégie de série chronologique lorsque nous arriverons à combiner ARIMA et GARCH. Laissez la même procédure pour le SampP500. Nous obtenons les données de quantmod et nous les convertissons en flux journalier: Nous adaptons un modèle ARIMA en bouclant les valeurs de p, d et q: L'AIC nous dit que le meilleur modèle est l'ARIMA (2,0, 1) modèle. Notons une fois de plus que d0, comme nous avons déjà pris les différences de premier ordre de la série: Nous pouvons tracer les résidus du modèle ajusté pour voir si nous avons des preuves de bruit blanc discret: Le corrélogramme semble prometteur, donc la prochaine étape est de courir Le test de Ljung-Box et de confirmer que nous avons un modèle bon ajustement: Comme la valeur p est supérieure à 0,05, nous avons des preuves d'un ajustement bon modèle. Pourquoi est-ce que dans l'article précédent notre Ljung-Box test pour le SampP500 a montré que l'ARMA (3,3) était un mauvais ajustement pour le journal quotidien des retours Remarque que j'ai sciemment tronqué les données SampP500 à partir de 2013 dans cet article , Ce qui exclut commodément les périodes volatiles autour de 2007-2008. Par conséquent, nous avons exclu une grande partie du SampP500 où nous avions un regroupement de volatilité excessif. Ceci a un impact sur la corrélation sérielle de la série et a donc pour effet de rendre la série plus stationnaire qu'elle ne l'était dans le passé. C'est un point très important. Lors de l'analyse des séries chronologiques, nous devons faire très attention aux séries hétéroscédasiques conditionnelles, comme les indices boursiers. En finance quantitative, essayer de déterminer des périodes de volatilité différente est souvent connu sous le nom de détection de régime. C'est l'une des tâches les plus difficiles à réaliser. Bien discuter longuement de ce point dans l'article suivant lorsque nous étudierons les modèles ARCH et GARCH. Permet maintenant de tracer une prévision pour les 25 prochains jours des retours journaliers SampP500: Maintenant que nous avons la capacité d'ajuster et de prévoir des modèles tels que ARIMA, étaient très proches de pouvoir créer des indicateurs de stratégie pour le commerce. Prochaines étapes Dans le prochain article, nous allons jeter un coup d'oeil au modèle généralisé d'autoréductivité conditionnelle hétérocédasticité (GARCH) et l'utiliser pour expliquer plus de la corrélation sérielle dans certaines séries d'actions et d'indice d'équité. Une fois que nous avons discuté de GARCH, nous serons en mesure de le combiner avec le modèle ARIMA et de créer des indicateurs de signal et donc une stratégie quantitative de négociation de base. Cliquez ci-dessous pour en savoir plus. L'information contenue sur ce site web est l'opinion des auteurs individuels basée sur leur observation personnelle, leur recherche et leurs années d'expérience. L'éditeur et ses auteurs ne sont pas des conseillers en placement, des avocats, des CPA ou d'autres professionnels des services financiers enregistrés et ne rendent pas de conseils juridiques, fiscaux, comptables, de placement ou autres services professionnels. L'information offerte par ce site Web est seulement l'éducation générale. Parce que chaque situation factuelle des individus est différente, le lecteur devrait chercher son conseiller personnel. Ni l'auteur ni l'éditeur n'assument aucune responsabilité ou responsabilité pour des erreurs ou omissions et n'a aucune responsabilité ni responsabilité envers une personne ou une entité à l'égard des dommages causés ou prétendument causés directement ou indirectement par les informations contenues sur ce site. À utiliser à vos risques et périls. En outre, ce site Web peut recevoir une compensation financière des sociétés mentionnées par la publicité, les programmes d'affiliation ou autrement. Les tarifs et offres des annonceurs affichés sur ce site Web changent fréquemment, parfois sans préavis. Alors que nous nous efforçons de maintenir des informations exactes et en temps opportun, les détails de l'offre peuvent être périmés. Les visiteurs doivent donc vérifier les modalités de ces offres avant de participer à ces offres. L'auteur et son éditeur déclinent toute responsabilité quant à la mise à jour de l'information et déclinent toute responsabilité concernant le contenu, les produits et les services de tiers, y compris lorsqu'ils sont accessibles par l'entremise d'hyperliens et / ou d'annonces sur ce site. Modèle AR: Un mode autorégression est une régression de la variable contre elle-même Valeurs de la variable de prévision). Un modèle autorégressif d'ordre p, AR (p) peut être écrit comme y tc 1 y t 1 2 y t 2 p y t p e t. Où c est une constante et e t est un bruit blanc. Modèle MA: Contrairement au modèle AR, un modèle de moyenne mobile utilise les erreurs de prévision passées dans un modèle de type régression. Un modèle de moyenne mobile d'ordre q, MA (q) peut être écrit comme y t c e t 1 e t 1 2 e t 2 q e t q. Où e t est le bruit blanc. Dans les deux cas, le terme d'erreur est le bruit blanc. Et à partir de la formule ci-dessus, nous pouvons voir clairement comment les termes d'erreur sont modélisés différemment dans les deux modèles. Dans un modèle AR, les valeurs décalées de y t sont des prédicteurs. Et le terme d'erreur e t dans le modèle est comme le terme d'erreur dans une régression linéaire multiple. Dans un modèle MA, les erreurs de prévision passées sont des prédicteurs. Une chose à noter est qu'il est possible d'écrire n'importe quel modèle AR (p) stationnaire comme un modèle MA infini, et un (inversible) MA (p) peut être écrit comme un AR infini. FYI, vous pouvez trouver des descriptions de concepts détaillées dans www2.sasproceedingssugi28252-28.pdf et la relation entre le modèle AR stationnaire et le modèle MA dans otexts. orgfpp84.
No comments:
Post a Comment