Sunday 19 November 2017

Fordeler Og Begrensninger Of The Bevegelig Gjennomsnitt Metode For Trend Sittende


Fremgangsmåte ved å velge en prognosemodell Din prognosemodell skal inneholde funksjoner som fanger opp alle viktige kvalitative egenskapene til dataene: variasjonsmønstre i nivå og trend, effekter av inflasjon og sesongmessighet, korrelasjoner mellom variabler, osv. Videre er antagelsene som ligger til grunn for din valgt modell bør være enig med din intuisjon om hvordan serien ser ut til å oppføre seg i fremtiden. Når du bruker en prognosemodell, har du noen av følgende valg: Disse alternativene er kort beskrevet nedenfor. Se det medfølgende prognostiseringsdiagrammet for en bildevisning av modellspesifikasjonsprosessen, og referer tilbake til Statgraphics Model Specification-panelet for å se hvordan modellegenskapene er valgt i programvaren. Deflation Hvis serien viser inflasjonær vekst, vil deflasjon bidra til å regne for vekstmønsteret og redusere heteroscedasticitet i residualene. Du kan enten (i) deflater de forrige dataene og gjenopplate de langsiktige prognosene med en konstant antatt hastighet, eller (ii) deflater de siste dataene med en prisindeks som KPI, og deretter kvittere med å reinflate de langsiktige prognosene ved å bruke en prognose av prisindeksen. Alternativ (i) er det enkleste. I Excel kan du bare opprette en kolonne med formler for å dele de opprinnelige verdiene med de relevante faktorene. For eksempel, hvis dataene er månedlige og du vil deflate med en hastighet på 5 per 12 måneder, vil du dele med en faktor (1.05) (k12) hvor k er radindeksen (observasjonsnummer). RegressIt og Statgraphics har innebygde verktøy som gjør dette automatisk for deg. Hvis du går denne ruten, er det vanligvis best å angi antatt inflasjonsrate som det beste estimatet av dagens rente, spesielt hvis du skal prognose mer enn en periode framover. Hvis du i stedet velger valgmulighet (ii), må du først lagre deflaterte prognosene og konfidensgrensene i dataregnearket ditt, og deretter generere og lagre en prognose for prisindeksen, og til slutt multiplisere de tilhørende kolonnene sammen. (Tilbake til toppen av siden.) Logaritme transformasjon Hvis serien viser sammensatt vekst og et multipliserende sesongmønster, kan en logaritme transformasjon være nyttig i tillegg til eller i stedet for deflasjon. Logging av dataene vil ikke flate et inflasjonsvækstmønster, men det vil rette det ut slik at det kan monteres av en lineær modell (for eksempel en tilfeldig tur eller ARIMA-modell med konstant vekst eller en lineær eksponensiell utjevningsmodell). Logging vil også konvertere multiplikative sesongmønstre til additivmønstre, slik at hvis du utfører sesongjustering etter logging, bør du bruke additiv typen. Logging handler om inflasjon på en implisitt måte hvis du vil at inflasjonen skal modelleres eksplisitt - dvs. Hvis du vil at inflasjonsraten skal være en synlig parameter for modellen, eller hvis du vil se plott av deflaterte data - så skal du deflate i stedet for å logge. En annen viktig bruk for logtransformasjonen er linearisering av relasjoner mellom variabler i en regresjonsmodus l. For eksempel, hvis den avhengige variabelen er en multiplikativ snarere enn additiv funksjon av de uavhengige variablene, eller hvis forholdet mellom avhengige og uavhengige variabler er lineært i forhold til prosentvise endringer i stedet for absolutte endringer, så bruker man en logtransformasjon til en eller flere variabler kan være hensiktsmessig, som i ølsalgseksemplet. (Tilbake til toppen av siden.) Sesongjustering Hvis serien har et sterkt sesongmessig mønster som antas å være konstant fra år til år, kan sesongjustering være en passende måte å estimere og ekstrapolere mønsteret på. Fordelen med sesongjustering er at den eksplisitt modellerer sesongmønsteret, og gir deg muligheten til å studere sesongindeksene og de sesongjusterte dataene. Ulempen er at det krever estimering av et stort antall tilleggsparametere (spesielt for månedlige data), og det gir ingen teoretisk begrunnelse for beregningen av kvotekvoterte konfidensintervaller. Validering utenfor prøven er spesielt viktig for å redusere risikoen for overpassing av tidligere data gjennom sesongjustering. Hvis dataene er sterkt sesongmessige, men du ikke velger sesongjustering, er alternativene å enten (i) bruke en sesongbasert ARIMA-modell. som implisitt prognoser sesongmønsteret ved hjelp av sesongmessige lag og forskjeller, eller (ii) bruker Winters sesongmessige eksponensielle utjevningsmodell, som anslår tidsvarierende sesongindekser. (Gå tilbake til toppen av siden.) QuotIndependentquot variabler Hvis det finnes andre tidsserier som du mener har forklarende kraft i forhold til din serie av interesser (f. eks. Ledende økonomiske indikatorer eller policyvariabler som pris, reklame, kampanjer, etc.) kan ønske å vurdere regresjon som modelltype. Uansett om du velger regresjon, må du likevel vurdere mulighetene som er nevnt ovenfor for å omdanne variablene dine (deflasjon, logg, sesongjustering - og kanskje også differensiering) for å utnytte tidsdimensjonen og / eller linearisere relasjonene. Selv om du ikke velger regresjon på dette tidspunktet, kan du kanskje vurdere å legge til regressorer senere til en tidsseriemodell (for eksempel en ARIMA-modell) hvis residualene viser seg å ha signifikante krysskorrelasjoner med andre variabler. (Tilbake til toppen av siden.) Utjevning, gjennomsnittlig eller tilfeldig spasertur Hvis du har valgt å justere dataene sesongmessig - eller hvis dataene ikke er sesongmessige til å begynne med - kan du kanskje bruke en gjennomsnittlig eller utjevningsmodell til passe det ikke-soneformede mønsteret som forblir i dataene på dette punktet. En enkel glidende gjennomsnitt eller enkel eksponensiell utjevningsmodell beregner bare et lokalt gjennomsnitt av data på slutten av serien, under forutsetning av at dette er det beste estimatet av gjeldende middelverdien rundt hvilken dataene varierer. (Disse modellene antar at gjennomsnittet av serien varierer langsomt og tilfeldig uten vedvarende trender.) Enkel eksponensiell utjevning foretrekkes normalt for et enkelt bevegelige gjennomsnitt, fordi dets eksponentielt vektede gjennomsnitt gjør en mer fornuftig jobb med å diskontere de eldre dataene, fordi dens utjevningsparameter (alfa) er kontinuerlig og kan lett optimaliseres, og fordi den har et underliggende teoretisk grunnlag for beregning av konfidensintervall. Hvis utjevning eller gjennomsnitt ikke ser ut til å være nyttig - det vil si. hvis den beste prediktoren for den neste verdien av tidsseriene bare er dens tidligere verdi - så er en tilfeldig gangmodell angitt. Dette er tilfellet for eksempel hvis det optimale antall vilkår i det enkle glidende gjennomsnittet viser seg å være 1, eller hvis den optimale verdien av alfa i enkel eksponensiell utjevning viser seg å være 0.9999. Browns lineær eksponensiell utjevning kan brukes til å passe en serie med sakte tidsvarierende lineære trender, men vær forsiktig med å ekstrapolere slike trender veldig langt inn i fremtiden. (De raskt utvidede konfidensintervaller for denne modellen vitner for usikkerheten om den fjerne fremtid.) Huller lineær utjevning anslår også tidsvarierende trender, men bruker separate parametere for å jevne ut nivå og trend, som vanligvis gir bedre passform til dataene enn Brown8217s modell. Q uadratisk eksponensiell utjevning forsøker å estimere tidsvarierende kvadratiske trender, og bør nesten aldri brukes. (Dette vil korrespondere med en ARIMA-modell med tre ordrer av ikke-soneforskjeller.) Linjær eksponensiell utjevning med en dempet trend (det vil si en trend som flater ut i fjerne horisonter) anbefales ofte i situasjoner der fremtiden er svært usikker. De ulike eksponensielle utjevningsmodellene er spesielle tilfeller av ARIMA-modeller (beskrevet nedenfor) og kan utstyres med ARIMA-programvare. Spesielt er den enkle eksponensielle utjevningsmodellen en ARIMA (0,1,1) modell. Holt8217s lineær utjevningsmodell er en ARIMA (0,2,2) modell, og den dempede trendmodellen er en ARIMA (1,1,2 ) modell. Et godt sammendrag av ligningene i de ulike eksponentielle utjevningsmodeller finnes på denne siden på SAS nettside. (SAS-menyene for å spesifisere tidsseriemodeller vises også der de er lik de som er i Statgraphics.) Lineære, kvadratiske eller eksponentielle trendlinjemodeller er andre alternativer for ekstrapolering av en desesasonalisert serie, men de går sjelden utover tilfeldig gange, utjevning eller ARIMA modeller på forretningsdata. (Tilbake til toppen av siden.) Vinter Sesongmessig eksponensiell utjevning Vinter Sesonglig utjevning er en utvidelse av eksponensiell utjevning som samtidig estimerer tidsvarierende nivå, trend og sesongfaktorer ved bruk av rekursive ligninger. (Hvis du bruker denne modellen, vil du ikke først justere dataene sesongmessig.) Winters sesongfaktorer kan enten være multiplikativ eller additiv: normalt bør du velge multiplikasjonsalternativet med mindre du har logget inn dataene. Selv om Winters-modellen er smart og rimelig intuitiv, kan det være vanskelig å bruke i praksis: det har tre utjevningsparametere - alfa, beta og gamma - for å utjevne nivå, trend og sesongfaktorer separat, som må estimeres samtidig. Bestemmelse av startverdier for sesongindeksene kan gjøres ved å bruke forholdsmessige gjennomsnittlige metode for sesongjustering til deler eller hele serien andor ved tilbakekalling. Estimeringsalgoritmen som Statgraphics bruker for disse parametrene, feiler noen ganger ikke sammen, og gir verdier som gir bizarre prognoser og konfidensintervaller, så jeg vil anbefale forsiktighet når du bruker denne modellen. (Tilbake til toppen av siden.) ARIMA Hvis du ikke velger sesongjustering (eller hvis dataene ikke er sesongbaserte), kan du ønske å bruke ARIMA-modellrammen. ARIMA-modeller er en svært generell klasse av modeller som inkluderer tilfeldig gange, tilfeldig trend, eksponensiell utjevning og autoregressive modeller som spesielle tilfeller. Den konvensjonelle visdommen er at en serie er en god kandidat til en ARIMA-modell hvis (i) den kan stasjonæriseres ved en kombinasjon av differensiering og andre matematiske transformasjoner som logging, og (ii) du har en betydelig mengde data for å jobbe med : minst 4 fulle årstider når det gjelder sesongdata. (Hvis serien ikke kan stasjoneres på riktig måte ved differensiering - f. eks. Hvis den er svært uregelmessig eller synes å kvalitativt endre sin oppførsel over tid - eller hvis du har færre enn 4 årstider, kan du bli bedre med en modell som bruker sesongjustering og noen form for enkel gjennomsnitt eller utjevning.) ARIMA-modeller har en spesiell navngivningskonvensjon innført av Box og Jenkins. En ikke-sasonlig ARIMA-modell er klassifisert som en ARIMA-modell (p, d, q), hvor d er antall ikke-sekundære forskjeller, p er antall autoregressive termer (lag av differensierte serier) og q er antall flyttbare - gjennomsnittlige termer (lags av prognosefeilene) i prediksjonsligningen. En sesongbasert ARIMA-modell er klassifisert som en ARIMA (p, d, q) x (P, D, Q). hvor D, P og Q er henholdsvis antall sesongmessige forskjeller, sesongbaserte autoregressive termer (lags av differensierte serier ved multiplene av sesongperioden) og sesongmessige glidende gjennomsnittlige termer (lags av prognosefeilene ved flere ganger av sesongens periode). Det første trinnet i å montere en ARIMA-modell er å bestemme riktig rekkefølge for differensiering som trengs for å stasjonere serien og fjerne bruttoegenskapene til sesongmessigheten. Dette tilsvarer å avgjøre hvilken kvotestilling som tilfeldigvis eller tilfeldig trendmodell gir det beste utgangspunktet. Ikke forsøk å bruke mer enn 2 forskjellige ordrer av differensiering (sesongbasert og sesongbasert kombinert), og bruk ikke mer enn 1 sesongmessig forskjell. Det andre trinnet er å avgjøre om det skal inkluderes en konstant term i modellen: Vanligvis inkluderer du en konstant term hvis total rekkefølgen av differensiering er 1 eller mindre, ellers gjør du det ikke. I en modell med en ordre av differensiering representerer den konstante sikt den gjennomsnittlige trenden i prognosene. I en modell med to differensordrer, er trenden i prognosene bestemt av lokal trenden observert i slutten av tidsserien, og den konstante sikt representerer trend-i-trenden, dvs. krumningen av langvarig langsiktige prognoser. Normalt er det farlig å ekstrapolere trender i trender, slik at du undertrykker kontantperioden i dette tilfellet. Det tredje trinnet er å velge antall autoregressive og bevegelige gjennomsnittsparametere (p, d, q, P, D, Q) som er nødvendige for å eliminere autokorrelasjon som forblir i gjenstander av naivmodellen (dvs. enhver korrelasjon som gjenstår etter bare differensiering). Disse tallene bestemmer antall lags av differenced series andor lags av prognosefeilene som inngår i prognosekvasjonen. Hvis det ikke er noen signifikant autokorrelasjon i residualene på dette punktet, så STOP, du er ferdig: Den beste modellen er en naiv modell Hvis det er betydelig autokorrelasjon ved lags 1 eller 2, bør du prøve å sette q1 hvis ett av følgende gjelder: ( i) det er en sesongmessig forskjell i modellen, (ii) lag 1-autokorrelasjonen er negativ. andor (iii) gjenværende autokorrelasjonsplott er renere utseende (færre, mer isolerte pigger) enn den gjenværende partielle autokorrelasjonsplottet. Hvis det ikke er noen sesongmessig forskjell i modellen, og er lag 1-autokorrelasjonen positiv, og den resterende partielle autokorrelasjonsplottet ser renere ut, så prøv p1. (Noen ganger er disse reglene for å velge mellom p1 og q1 konflikt med hverandre, i så fall gjør det sannsynligvis ikke stor forskjell som du bruker. Prøv dem begge og sammenlign.) Hvis det er autokorrelasjon ved lag 2 som ikke fjernes ved å sette p1 eller q1, kan du prøve p2 eller q2, eller noen ganger p1 og q1. Mer sjelden kan du oppleve situasjoner der p2 eller 3 og q1, eller omvendt, gir de beste resultatene. Det anbefales sterkt at du ikke bruker pgt1 og qgt1 i samme modell. Generelt, når du monterer ARIMA-modeller, bør du unngå å øke modellkompleksiteten for å oppnå bare små ytterligere forbedringer i feilstatistikken eller utseendet til ACF - og PACF-plottene. I en modell med både pgt1 og qgt1 finnes det også en god mulighet for redundans og ikke-unikhet mellom AR - og MA-siden av modellen, som forklart i notatene om den matematiske strukturen til ARIMA-modellen s. Det er vanligvis bedre å fortsette i en fremad trinnvis snarere enn bakover trinnvis måte når du tilpasser modellspesifikasjonene: Start med enklere modeller og legg bare til flere vilkår hvis det er et klart behov. De samme regler gjelder for antall sesongbaserte autoregressive termer (P) og antall sesongmessige glidende gjennomsnittlige betingelser (Q) med hensyn til autokorrelasjon i sesongperioden (for eksempel lag 12 for månedlige data). Prøv Q1 dersom det allerede er en sesongmessig forskjell i modellen, og hvis sesongens autokorrelasjon er negativ, og hvis gjenværende autokorrelasjonsplott ser renere ut i nærheten av sesongslaget, ellers kan du prøve P1. (Hvis det er logisk for serien å vise sterk sesongmessighet, må du bruke en sesongmessig forskjell, ellers vil sesongmønsteret fade ut når du gjør langsiktige prognoser.) Noen ganger kan du prøve å P2 og Q0 eller vice v ersa, eller PQ1. Det anbefales imidlertid sterkt at PQ aldri burde være større enn 2. Sesongmønstre har sjelden den typen perfekt regelmessighet over et stort antall årstider som vil gjøre det mulig å pålitelig identifisere og anslå at mange parametere. Også tilbakekallingsalgoritmen som brukes i parameterestimering, vil trolig gi upålitelige (eller til og med galte) resultater når antall sesonger av data ikke er vesentlig større enn PDQ. Jeg vil anbefale ikke mindre enn PDQ2 hele årstider, og mer er bedre. Igjen, når du monterer ARIMA-modeller, bør du være forsiktig med å unngå overpassing av dataene, til tross for at det kan være mye moro når du får tak i det. Viktige spesielle tilfeller: Som angitt ovenfor er en ARIMA (0,1,1) modell uten konstant identisk med en enkel eksponensiell utjevningsmodell, og det antar et flytende nivå (det vil si ingen vesentlig reversering), men med null langsiktig trend. En ARIMA (0,1,1) modell med konstant er en enkel eksponensiell utjevningsmodell med en ikke-lineær trendkategori inkludert. En ARIMA (0,2,1) eller (0,2,2) modell uten konstant er en lineær eksponensiell utjevningsmodell som muliggjør en tidsvarierende trend. En ARIMA (1,1,2) modell uten konstant er en lineær eksponensiell utjevningsmodell med fuktet trend, det vil si en trend som til slutt flater ut i langsiktige prognoser. De vanligste sesongbaserte ARIMA-modellene er ARIMA-modellen (0,1,1) x (0,1,1) uten konstant og ARIMA-modellen (1,0,1) x (0,1,1) med konstant. Den tidligere av disse modellene bruker i utgangspunktet eksponensiell utjevning til både de ikke-sesongmessige og sesongmessige komponentene i mønsteret i dataene, samtidig som det tillates en tidsvarierende trend, og sistnevnte modell er noe lik, men antar en konstant lineær trend og derfor litt lengre tidsforutsigbarhet. Du bør alltid inkludere disse to modellene blant ditt utvalg av mistenkte når du monterer data med konsekvent sesongmessige mønstre. En av dem (kanskje med en mindre variasjon som øker p eller q med 1 ogor setting P1 så vel som Q1) er ganske ofte det beste. (Tilbake til toppen av siden.) Forecasting by Smoothing Techniques Dette nettstedet er en del av JavaScript E-Labs læringsobjekter for beslutningstaking. Annet JavaScript i denne serien er kategorisert under forskjellige områder av applikasjoner i MENU-delen på denne siden. En tidsserie er en sekvens av observasjoner som bestilles i tide. Inherent i samlingen av data tatt over tid er noen form for tilfeldig variasjon. Det finnes metoder for å redusere avbryte effekten på grunn av tilfeldig variasjon. Utbredte teknikker er utjevning. Disse teknikkene, når de brukes riktig, tydeliggjør de underliggende trenderne tydeligere. Skriv inn tidsseriene Row-wise i rekkefølge, starter fra venstre øverste hjørne, og parameteren (e), og klikk deretter på Calculate-knappen for å få fram en prognose for en periode fremover. Blank bokser er ikke inkludert i beregningene, men nuller er. Når du legger inn dataene dine for å flytte fra celle til celle i datamatrixen, bruker du Tab-tasten ikke pil eller tast inn taster. Funksjoner av tidsserier, som kan avsløres ved å undersøke grafen. med de prognostiserte verdiene, og residualens oppførsel, betinget prognosemodellering. Flytte gjennomsnitt: Flytte gjennomsnittlig rangering blant de mest populære teknikkene for preprocessing av tidsserier. De brukes til å filtrere tilfeldig hvit støy fra dataene, for å gjøre tidsseriene jevnere eller til og med å understreke visse informative komponenter som finnes i tidsseriene. Eksponensiell utjevning: Dette er et veldig populært system for å produsere en glatt tidsserie. Mens i flytende gjennomsnitt blir de tidligere observasjonene veid likt, eksponentiell utjevning tilordner eksponentielt avtagende vekter som observasjonen blir eldre. Med andre ord blir de siste observasjonene gitt relativt mer vekt i prognoser enn de eldre observasjonene. Dobbelt eksponensiell utjevning er bedre å håndtere trender. Trippel eksponensiell utjevning er bedre å håndtere paraboltrender. Et eksponentielt vektet glidende gjennomsnitt med en utjevningskonstant a. korresponderer omtrent til et enkelt bevegelige gjennomsnitt av lengden (dvs. perioden) n, hvor a og n er relatert til: a 2 (n1) OR n (2 - a) a. For eksempel vil et eksponentielt vektet glidende gjennomsnitt med en utjevningskonstant lik 0,1 svare til et 19 dagers glidende gjennomsnitt. Og et 40-dagers enkelt glidende gjennomsnitt ville korrespondere omtrent til et eksponentielt vektet glidende gjennomsnitt med en utjevningskonstant lik 0,04878. Holter Lineær eksponensiell utjevning: Anta at tidsseriene er u sesongmessige, men viser trend. Holts metode estimerer både dagens nivå og dagens trend. Legg merke til at det enkle glidende gjennomsnittet er spesielt tilfelle av eksponensiell utjevning ved å angi perioden for glidende gjennomsnitt til heltaldelen av (2-alfa) alfa. For de fleste forretningsdata er en Alpha-parameter mindre enn 0,40 ofte effektiv. Det kan imidlertid utføres et rutenett for parameterrommet, med 0,1 til 0,9, med trinn på 0,1. Da har den beste alfa den minste Mean Absolute Error (MA Error). Slik sammenligner du flere utjevningsmetoder: Selv om det finnes numeriske indikatorer for å vurdere nøyaktigheten av prognoseteknikken, er det mest mulig å benytte visuell sammenligning av flere prognoser for å vurdere nøyaktigheten og velge blant de ulike prognosemetoder. I denne tilnærmingen må man plotte (ved hjelp av for eksempel Excel) på samme graf de opprinnelige verdiene for en tidsserievariabel og de forutsagte verdiene fra flere forskjellige prognosemetoder, og dermed lette en visuell sammenligning. Du kan gjerne bruke Past Forecasts ved utjevningsteknikker JavaScript for å oppnå tidligere prognosverdier basert på utjevningsteknikker som bare bruker én parameter. Holt og Winters metoder bruker henholdsvis to og tre parametere, derfor er det ikke en lett oppgave å velge den optimale, eller til og med nær optimale verdier ved prøving og feil for parametrene. Den enkle eksponensielle utjevningen understreker kortspektret perspektivet som setter nivået til den siste observasjonen og er basert på tilstanden at det ikke er noen trend. Den lineære regresjonen, som passer til en minste firkantlinje til de historiske dataene (eller transformerte historiske data), representerer lang rekkevidde, som er betinget av den grunnleggende trenden. Holts lineær eksponensiell utjevning fanger opp informasjon om nyere trend. Parametrene i Holts-modellen er nivåparameter som skal reduseres når mengden datavariasjon er stor, og trenderparameteren skal økes dersom den siste trendretningen støttes av årsakssammenhengene. Kortsiktig prognose: Legg merke til at alle JavaScript på denne siden gir en engangsforespørsel. For å få en to-trinns prognose. bare legg til den prognostiserte verdien til slutten av dine tidsseriedata og klikk deretter på den samme Beregn-knappen. Du kan gjenta denne prosessen for noen få ganger for å oppnå de nødvendige kortsiktige prognosene. Flytte gjennomsnitt og eksponensielle utjevningsmodeller Som et første skritt i å bevege seg utover gjennomsnittlige modeller, kan tilfeldige gåmodeller og lineære trendmodeller, ikke-sone-mønstre og trender bli ekstrapolert ved hjelp av en flytende gjennomsnitt eller utjevningsmodell. Den grunnleggende forutsetningen bak gjennomsnittlige og utjevningsmodeller er at tidsserien er lokalt stasjonær med et sakte varierende middel. Derfor tar vi et flytende (lokalt) gjennomsnitt for å anslå dagens verdi av gjennomsnittet, og deretter bruke det som prognosen for nær fremtid. Dette kan betraktes som et kompromiss mellom den gjennomsnittlige modellen og den tilfeldige-walk-uten-drift-modellen. Den samme strategien kan brukes til å estimere og ekstrapolere en lokal trend. Et glidende gjennomsnitt kalles ofte en quotsmoothedquot-versjon av den opprinnelige serien, fordi kortsiktig gjennomsnittsverdi medfører utjevning av støtene i den opprinnelige serien. Ved å justere graden av utjevning (bredden på det bevegelige gjennomsnittet), kan vi håpe å finne en slags optimal balanse mellom ytelsen til de gjennomsnittlige og tilfeldige turmodellene. Den enkleste typen gjennomsnittlig modell er. Enkel (likevektet) Flytende gjennomsnitt: Værvarselet for verdien av Y på tidspunktet t1 som er laget på tidspunktet t, er det enkle gjennomsnittet av de nyeste m-observasjonene: (Her og andre steder vil jeg bruke symbolet 8220Y-hat8221 til å stå for en prognose av tidsserien Y som ble gjort så tidlig som mulig ved en gitt modell.) Dette gjennomsnittet er sentrert ved period-t (m1) 2, noe som innebærer at estimatet av det lokale middel vil ha en tendens til å ligge bak den sanne verdien av det lokale gjennomsnittet med ca. (m1) 2 perioder. Således sier vi at gjennomsnittsalderen for dataene i det enkle glidende gjennomsnittet er (m1) 2 i forhold til den periode prognosen beregnes for: Dette er hvor lang tid prognosene vil ha til å ligge bak vendepunkter i dataene . For eksempel, hvis du er i gjennomsnitt de siste 5 verdiene, vil prognosene være ca 3 perioder sent i å svare på vendepunkter. Merk at hvis m1, den enkle glidende gjennomsnittlige (SMA) modellen er lik den tilfeldige turmodellen (uten vekst). Hvis m er veldig stor (sammenlignbar med lengden på estimeringsperioden), svarer SMA-modellen til den gjennomsnittlige modellen. Som med hvilken som helst parameter i en prognosemodell, er det vanlig å justere verdien av k for å oppnå den beste kvote kvoten til dataene, dvs. de minste prognosefeilene i gjennomsnitt. Her er et eksempel på en serie som ser ut til å vise tilfeldige svingninger rundt et sakte varierende middel. Først kan vi prøve å passe den med en tilfeldig walk-modell, noe som tilsvarer et enkelt bevegelige gjennomsnitt på 1 sikt: Den tilfeldige turmodellen reagerer veldig raskt på endringer i serien, men i så måte velger den mye av kvotenivået i data (tilfeldige svingninger) samt quotsignalquot (det lokale gjennomsnittet). Hvis vi i stedet prøver et enkelt glidende gjennomsnitt på 5 termer, får vi et smidigere sett med prognoser: Det 5-tiden enkle glidende gjennomsnittet gir betydelig mindre feil enn den tilfeldige turmodellen i dette tilfellet. Gjennomsnittsalderen for dataene i denne prognosen er 3 ((51) 2), slik at den har en tendens til å ligge bak vendepunktene med om lag tre perioder. (For eksempel ser det ut til at en nedtur har skjedd i perioden 21, men prognosene vender seg ikke til flere perioder senere.) Legg merke til at de langsiktige prognosene fra SMA-modellen er en horisontal rettlinje, akkurat som i tilfeldig gang modell. Således antar SMA-modellen at det ikke er noen trend i dataene. Mens prognosene fra den tilfeldige turmodellen ganske enkelt er lik den siste observerte verdien, er prognosene fra SMA-modellen lik et veid gjennomsnitt av de siste verdiene. De konfidensgrenser som beregnes av Statgraphics for de langsiktige prognosene for det enkle glidende gjennomsnittet, blir ikke større da prognoseperioden øker. Dette er åpenbart ikke riktig. Dessverre er det ingen underliggende statistisk teori som forteller oss hvordan konfidensintervallene skal utvide seg for denne modellen. Det er imidlertid ikke så vanskelig å beregne empiriske estimater av konfidensgrensene for lengre horisontprognoser. For eksempel kan du sette opp et regneark der SMA-modellen skulle brukes til å prognose 2 trinn foran, 3 trinn fremover, etc. i den historiske dataprøven. Du kan deretter beregne utvalgsstandardavvikene til feilene i hver prognosehorisont, og deretter konstruere konfidensintervaller for langsiktige prognoser ved å legge til og trekke ut multipler av riktig standardavvik. Hvis vi prøver et 9-sikt enkelt glidende gjennomsnitt, får vi enda jevnere prognoser og mer av en bremseeffekt: Gjennomsnittsalderen er nå 5 perioder (91) 2). Hvis vi tar et 19-årig glidende gjennomsnitt, øker gjennomsnittsalderen til 10: Legg merke til at prognosene nå faller bakom vendepunkter med ca 10 perioder. Hvilken mengde utjevning er best for denne serien Her er et bord som sammenligner feilstatistikken sin, også et gjennomsnitt på tre sikt: Modell C, 5-års glidende gjennomsnitt, gir den laveste verdien av RMSE med en liten margin over 3 term og 9-sikt gjennomsnitt, og deres andre statistikker er nesten identiske. Så, blant modeller med svært like feilstatistikk, kan vi velge om vi foretrekker litt mer respons eller litt mer glatt i prognosene. (Tilbake til toppen av siden.) Browns Simple Exponential Smoothing (eksponentielt vektet glidende gjennomsnitt) Den enkle glidende gjennomsnittsmodellen beskrevet ovenfor har den uønskede egenskapen som den behandler de siste k-observasjonene, like og fullstendig ignorerer alle foregående observasjoner. Intuitivt bør tidligere data diskonteres på en mer gradvis måte - for eksempel bør den siste observasjonen få litt mer vekt enn 2. siste, og den 2. siste skal få litt mer vekt enn den 3. siste, og så videre. Den enkle eksponensielle utjevning (SES) - modellen oppnår dette. La 945 betegne en quotsmoothing constantquot (et tall mellom 0 og 1). En måte å skrive modellen på er å definere en serie L som representerer dagens nivå (dvs. lokal middelverdi) av serien som estimert fra data til nå. Verdien av L på tidspunktet t beregnes rekursivt fra sin egen tidligere verdi slik: Således er den nåværende glattede verdien en interpolering mellom den forrige glattede verdien og den nåværende observasjonen, hvor 945 styrer nærheten til den interpolerte verdien til den nyeste observasjon. Forventningen for neste periode er bare den nåværende glatte verdien: Tilsvarende kan vi uttrykke neste prognose direkte i forhold til tidligere prognoser og tidligere observasjoner, i en hvilken som helst av de tilsvarende versjoner. I den første versjonen er prognosen en interpolasjon mellom forrige prognose og tidligere observasjon: I den andre versjonen blir neste prognose oppnådd ved å justere forrige prognose i retning av den forrige feilen med en brøkdel av 945. Er feilen gjort ved tid t. I den tredje versjonen er prognosen et eksponentielt vektet (dvs. nedsatt) glidende gjennomsnitt med rabattfaktor 1-945: Interpolasjonsversjonen av prognoseformelen er den enkleste å bruke hvis du implementerer modellen på et regneark: det passer inn i en enkeltcelle og inneholder cellehenvisninger som peker på forrige prognose, forrige observasjon og cellen der verdien av 945 er lagret. Merk at hvis 945 1 er SES-modellen tilsvarer en tilfeldig turmodell (uten vekst). Hvis 945 0 er SES-modellen ekvivalent med den gjennomsnittlige modellen, forutsatt at den første glattede verdien er satt lik gjennomsnittet. (Gå tilbake til toppen av siden.) Gjennomsnittsalderen for dataene i prognosen for enkel eksponensiell utjevning er 1 945 i forhold til perioden for prognosen beregnes. (Dette skal ikke være åpenbart, men det kan enkelt vises ved å vurdere en uendelig serie.) Derfor har den enkle, glidende gjennomsnittlige prognosen en tendens til å ligge bak vendepunktene med rundt 1 945 perioder. For eksempel, når 945 0,5 lag er 2 perioder når 945 0.2 lag er 5 perioder når 945 0,1 lag er 10 perioder, og så videre. For en gitt gjennomsnittlig alder (det vil si mengden lag), er prognosen for enkel eksponensiell utjevning (SES) noe bedre enn SMA-prognosen (Simple Moving Average) fordi den legger relativt mer vekt på den siste observasjonen - dvs. det er litt mer quotresponsivequot for endringer som oppstod i den siste tiden. For eksempel har en SMA-modell med 9 vilkår og en SES-modell med 945 0,2 begge en gjennomsnittlig alder på 5 for dataene i prognosene, men SES-modellen legger mer vekt på de siste 3 verdiene enn SMA-modellen og ved Samtidig er det ikke 8220forget8221 om verdier som er mer enn 9 år gamle, som vist i dette diagrammet. En annen viktig fordel ved SES-modellen over SMA-modellen er at SES-modellen bruker en utjevningsparameter som er kontinuerlig variabel, slik at den lett kan optimaliseres ved å bruke en quotsolverquot-algoritme for å minimere den gjennomsnittlige kvadratfeilen. Den optimale verdien av 945 i SES-modellen for denne serien viser seg å være 0,2961, som vist her: Gjennomsnittsalderen for dataene i denne prognosen er 10,2961 3,4 perioder, noe som ligner på et 6-sikt enkelt glidende gjennomsnitt. De langsiktige prognosene fra SES-modellen er en horisontal rett linje. som i SMA-modellen og den tilfeldige turmodellen uten vekst. Vær imidlertid oppmerksom på at konfidensintervallene som beregnes av Statgraphics, divergerer nå på en rimelig måte, og at de er vesentlig smalere enn konfidensintervallene for den tilfeldige turmodellen. SES-modellen antar at serien er noe mer forutsigbar enn den tilfeldige turmodellen. En SES-modell er faktisk et spesielt tilfelle av en ARIMA-modell. slik at den statistiske teorien om ARIMA-modeller gir et solid grunnlag for beregning av konfidensintervall for SES-modellen. Spesielt er en SES-modell en ARIMA-modell med en ikke-sesongforskjell, en MA (1) og ikke en konstant periode. ellers kjent som en quotARIMA (0,1,1) modell uten constantquot. MA (1) - koeffisienten i ARIMA-modellen tilsvarer mengden 1-945 i SES-modellen. For eksempel, hvis du passer på en ARIMA (0,1,1) modell uten konstant til serien analysert her, viser den estimerte MA (1) - koeffisienten seg å være 0,7029, som er nesten nøyaktig en minus 0,2961. Det er mulig å legge til antagelsen om en konstant lineær trend uten null som en SES-modell. For å gjøre dette oppgir du bare en ARIMA-modell med en ikke-sesongforskjell og en MA (1) - sikt med en konstant, dvs. en ARIMA-modell (0,1,1) med konstant. De langsiktige prognosene vil da ha en trend som er lik den gjennomsnittlige trenden observert over hele estimeringsperioden. Du kan ikke gjøre dette i forbindelse med sesongjustering, fordi sesongjusteringsalternativene er deaktivert når modelltypen er satt til ARIMA. Du kan imidlertid legge til en konstant langsiktig eksponensiell trend for en enkel eksponensiell utjevningsmodell (med eller uten sesongjustering) ved å bruke inflasjonsjusteringsalternativet i prognoseprosedyren. Den aktuelle kvoteringskvoten (prosentvekst) per periode kan estimeres som hellingskoeffisienten i en lineær trendmodell som er montert på dataene i forbindelse med en naturlig logaritme transformasjon, eller det kan være basert på annen uavhengig informasjon om langsiktige vekstutsikter . (Tilbake til toppen av siden.) Browns Lineær (dvs. dobbel) Eksponensiell utjevning SMA-modellene og SES-modellene antar at det ikke er noen trend av noe slag i dataene (som vanligvis er OK eller i det minste ikke altfor dårlig for 1- trinnvise prognoser når dataene er relativt støyende), og de kan modifiseres for å inkorporere en konstant lineær trend som vist ovenfor. Hva med kortsiktige trender Hvis en serie viser en varierende vekstnivå eller et syklisk mønster som skiller seg tydelig ut mot støyen, og hvis det er behov for å prognose mer enn 1 periode framover, kan estimering av en lokal trend også være et problem. Den enkle eksponensielle utjevningsmodellen kan generaliseres for å oppnå en lineær eksponensiell utjevning (LES) modell som beregner lokale estimater av både nivå og trend. Den enkleste tidsvarierende trendmodellen er Browns lineær eksponensiell utjevningsmodell, som bruker to forskjellige glatte serier som er sentrert på forskjellige tidspunkter. Forutsigelsesformelen er basert på en ekstrapolering av en linje gjennom de to sentrene. (En mer sofistikert versjon av denne modellen, Holt8217s, blir diskutert nedenfor.) Den algebraiske form av Brown8217s lineær eksponensiell utjevningsmodell, som den enkle eksponensielle utjevningsmodellen, kan uttrykkes i en rekke forskjellige, men liknende former. Denne standardmodellen er vanligvis uttrykt som følger: La S betegne den enkeltglattede serien som er oppnådd ved å anvende enkel eksponensiell utjevning til serie Y. Dvs. verdien av S ved period t er gitt av: (Husk at, under enkle eksponensiell utjevning, dette ville være prognosen for Y ved periode t1.) Lad deretter Squot betegne den dobbeltslettede serien oppnådd ved å anvende enkel eksponensiell utjevning (ved hjelp av samme 945) til serie S: Endelig prognosen for Y tk. for noe kgt1, er gitt av: Dette gir e 1 0 (det vil si lure litt, og la den første prognosen være den samme første observasjonen) og e 2 Y 2 8211 Y 1. hvoretter prognosene genereres ved å bruke ligningen ovenfor. Dette gir de samme monterte verdiene som formelen basert på S og S dersom sistnevnte ble startet med S 1 S 1 Y 1. Denne versjonen av modellen brukes på neste side som illustrerer en kombinasjon av eksponensiell utjevning med sesongjustering. Holt8217s Lineær eksponensiell utjevning Brown8217s LES-modell beregner lokale estimater av nivå og trend ved å utjevne de siste dataene, men det faktum at det gjør det med en enkelt utjevningsparameter, stiller en begrensning på datamønstrene som den kan passe: nivået og trenden er ikke tillatt å variere til uavhengige priser. Holt8217s LES-modellen løser dette problemet ved å inkludere to utjevningskonstanter, en for nivået og en for trenden. Til enhver tid t, som i Brown8217s modell, er det et estimat L t på lokalt nivå og et estimat T t av den lokale trenden. Her beregnes de rekursivt fra verdien av Y observert ved tid t og de forrige estimatene av nivået og trenden ved to likninger som gjelder eksponensiell utjevning til dem separat. Hvis estimert nivå og trend ved tid t-1 er L t82091 og T t-1. henholdsvis, da var prognosen for Y tshy som ville vært gjort på tidspunktet t-1, lik L t-1 T t-1. Når den faktiske verdien er observert, beregnes det oppdaterte estimatet av nivået rekursivt ved å interpolere mellom Y tshy og dens prognose, L t-1 T t 1, med vekt på 945 og 1- 945. Forandringen i estimert nivå, nemlig L t 8209 L t82091. kan tolkes som en støyende måling av trenden på tidspunktet t. Det oppdaterte estimatet av trenden beregnes deretter rekursivt ved å interpolere mellom L t 8209 L t82091 og det forrige estimatet av trenden, T t-1. ved bruk av vekter av 946 og 1-946: Fortolkningen av trend-utjevningskonstanten 946 er analog med den for nivåutjevningskonstanten 945. Modeller med små verdier på 946 antar at trenden bare endrer seg veldig sakte over tid, mens modeller med større 946 antar at det endrer seg raskere. En modell med en stor 946 mener at den fjerne fremtiden er veldig usikker, fordi feil i trendberegning blir ganske viktig når det regnes med mer enn en periode framover. (Tilbake til toppen av siden.) Utjevningskonstantene 945 og 946 kan estimeres på vanlig måte ved å minimere gjennomsnittlig kvadratfeil i de 1-trinns prognosene. Når dette gjøres i Statgraphics, viser estimatene seg å være 945 0.3048 og 946 0.008. Den svært små verdien av 946 betyr at modellen tar svært liten endring i trenden fra en periode til den neste, så i utgangspunktet prøver denne modellen å estimere en langsiktig trend. I analogi med begrepet gjennomsnittlig alder av dataene som brukes til å estimere det lokale nivået i serien, er gjennomsnittsalderen for dataene som brukes til estimering av lokal trenden, proporsjonal med 1 946, men ikke akkurat lik den . I dette tilfellet viser det seg å være 10 006 125. Dette er et svært nøyaktig tall, forutsatt at nøyaktigheten av estimatet av 946 er virkelig 3 desimaler, men det er av samme generelle størrelsesorden som prøvestørrelsen på 100, så denne modellen er i gjennomsnitt over ganske mye historie i estimering av trenden. Prognoseplanet nedenfor viser at LES-modellen anslår en litt større lokal trend i slutten av serien enn den konstante trenden som er estimert i SEStrend-modellen. Også den estimerte verdien på 945 er nesten identisk med den som oppnås ved å montere SES-modellen med eller uten trend, så dette er nesten den samme modellen. Nå ser disse ut som rimelige prognoser for en modell som skal estimere en lokal trend. Hvis du 8220eyeball8221 ser dette, ser det ut som om den lokale trenden har vendt nedover på slutten av serien. Hva har skjedd Parametrene til denne modellen har blitt estimert ved å minimere den kvadriske feilen på 1-trinns prognoser, ikke langsiktige prognoser, i hvilket tilfelle trenden gjør ikke en stor forskjell. Hvis alt du ser på er 1-trinns feil, ser du ikke det større bildet av trender over (si) 10 eller 20 perioder. For å få denne modellen mer i tråd med øyehals ekstrapoleringen av dataene, kan vi manuelt justere trendutjevningskonstanten slik at den bruker en kortere basislinje for trendestimering. Hvis vi for eksempel velger å sette 946 0,1, er gjennomsnittsalderen for dataene som brukes til å estimere den lokale trenden 10 perioder, noe som betyr at vi gjennomsnittsverdi trenden over de siste 20 perioder eller så. Here8217s hva prognosen tomten ser ut hvis vi setter 946 0,1 mens du holder 945 0.3. Dette ser intuitivt fornuftig ut på denne serien, selv om det er sannsynlig farlig å ekstrapolere denne trenden mer enn 10 perioder i fremtiden. Hva med feilstatistikken Her er en modell sammenligning for de to modellene vist ovenfor, samt tre SES-modeller. Den optimale verdien av 945. For SES-modellen er ca. 0,3, men tilsvarende resultater (med henholdsvis litt mer responstid) oppnås med 0,5 og 0,2. (A) Holts lineær eksp. utjevning med alfa 0,3048 og beta 0,008 (B) Holts lineær eksp. utjevning med alfa 0,3 og beta 0,1 (C) Enkel eksponensiell utjevning med alfa 0,5 (D) Enkel eksponensiell utjevning med alfa 0,3 (E) Enkel eksponensiell utjevning med alfa 0,2 Deres statistikk er nesten identisk, slik at vi virkelig kan velge på grunnlag av 1-trinns prognosefeil i dataprøven. Vi må falle tilbake på andre hensyn. Hvis vi sterkt tror at det er fornuftig å basere dagens trendoverslag på hva som har skjedd i løpet av de siste 20 perioder eller så, kan vi gjøre en sak for LES-modellen med 945 0,3 og 946 0,1. Hvis vi ønsker å være agnostiker om det er en lokal trend, kan en av SES-modellene være enklere å forklare, og vil også gi mer mid-of-the-road prognoser for de neste 5 eller 10 periodene. (Tilbake til toppen av siden.) Hvilken type trend-ekstrapolering er best: Horisontal eller lineær Empirisk bevis tyder på at hvis dataene allerede er justert (om nødvendig) for inflasjon, kan det være uhensiktsmessig å ekstrapolere kortsiktig lineær trender veldig langt inn i fremtiden. Trender som tyder på i dag, kan løsne seg i fremtiden på grunn av ulike årsaker som forverring av produkt, økt konkurranse og konjunkturnedganger eller oppgang i en bransje. Av denne grunn utfører enkle eksponensielle utjevning ofte bedre ut av prøven enn det ellers kunne forventes, til tross for sin kvadratiske kvadratiske horisontal trend-ekstrapolering. Dampede trendmodifikasjoner av den lineære eksponensielle utjevningsmodellen brukes også i praksis til å introdusere en konservatismeddel i sine trendprognoser. Den demonstrede LES-modellen kan implementeres som et spesielt tilfelle av en ARIMA-modell, spesielt en ARIMA-modell (1,1,2). Det er mulig å beregne konfidensintervall rundt langsiktige prognoser produsert av eksponentielle utjevningsmodeller, ved å betrakte dem som spesielle tilfeller av ARIMA-modeller. (Pass på: ikke alle programmer beregner konfidensintervaller for disse modellene riktig.) Bredden på konfidensintervaller avhenger av (i) RMS-feilen i modellen, (ii) type utjevning (enkel eller lineær) (iii) verdien (e) av utjevningskonstanten (e) og (iv) antall perioder fremover du forutsetter. Generelt sprer intervallene raskere da 945 blir større i SES-modellen, og de sprer seg mye raskere når lineær snarere enn enkel utjevning brukes. Dette emnet blir diskutert videre i ARIMA-modellene i notatene. (Gå tilbake til toppen av siden.)

No comments:

Post a Comment