Thursday 28 December 2017

Centrerad glidande medelvärde statistik


Flytta medelvärden Flytta medelvärden Med vanliga dataset är medelvärdet ofta det första och en av de mest användbara, sammanfattande statistiken att beräkna. När data är i form av en tidsserie är seriemärket en användbar åtgärd, men återspeglar inte dataens dynamiska natur. Medelvärden beräknade över korta perioder, antingen före den aktuella perioden eller centrerad under den aktuella perioden, är ofta mer användbara. Eftersom sådana medelvärden varierar eller flyttas, då den aktuella perioden går från tiden t 2, t 3. etc. är de kända som rörliga medelvärden (Mas). Ett enkelt glidande medelvärde är (vanligtvis) det obegripade medlet av k tidigare värden. Ett exponentiellt vägt rörligt medelvärde är väsentligen detsamma som ett enkelt rörligt medelvärde, men med bidrag till medelvärdet viktat av deras närhet till den aktuella tiden. Eftersom det inte finns en, men en hel serie glidande medelvärden för en given serie, kan satsen Mas själva plottas på diagram som analyseras som en serie och används vid modellering och prognoser. En rad modeller kan konstrueras med hjälp av glidande medelvärden, och dessa är kända som MA-modeller. Om sådana modeller kombineras med autoregressiva (AR) modeller är de resulterande kompositmodellerna kända som ARMA - eller ARIMA-modeller (jag är för integrerad). Enkla glidande medelvärden Eftersom en tidsserie kan betraktas som en uppsättning värden, kan t 1,2,3,4, n genomsnittet av dessa värden beräknas. Om vi ​​antar att n är ganska stor, och vi väljer ett heltal k som är mycket mindre än n. vi kan beräkna en uppsättning blockmedelvärden eller enkla rörliga medelvärden (i ordning k): Varje mätning representerar genomsnittet av datavärdena över ett intervall av k-observationer. Observera att den första möjliga MA i ordningen k gt0 är den för t k. Mer generellt kan vi släppa det extra abonnemanget i ovanstående uttryck och skriva: Detta säger att det uppskattade medelvärdet vid tiden t är det enkla genomsnittet av det observerade värdet vid tiden t och de föregående k -1-stegen. Om vikter appliceras som minskar bidraget från observationer som är längre bort i tiden, sägs det glidande medlet vara exponentiellt jämna. Flytta medelvärden används ofta som en form av prognoser, varigenom det uppskattade värdet för en serie vid tiden t 1, S t1. tas som MA för perioden fram till och med tiden t. t. ex. dagens uppskattning baseras på ett genomsnitt av tidigare registrerade värden fram till och med gårdagens (för dagliga data). Enkla glidande medelvärden kan ses som en form av utjämning. I det nedan angivna exemplet har luftföroreningens dataset som visas i introduktionen till detta ämne ökat med en 7-dagars glidande medelvärde (MA) - linje, som visas här i rött. Såsom kan ses, släpper MA-linjen ut topparna och trågarna i data och kan vara till stor hjälp när det gäller att identifiera trender. Standarden framåtberäkningsformeln innebär att de första k -1 datapunkterna inte har något MA-värde, men därefter sträcker sig beräkningarna till den slutliga datapunkten i serien. PM10 dagliga medelvärden, Greenwich källa: London Air Quality Network, londonair. org. uk En anledning till att beräkna enkla glidande medelvärden på det sätt som beskrivs är att det gör det möjligt att beräkna värden för alla tidsluckor från tid tk fram till idag, och När en ny mätning erhålls för tid t 1 kan MA för tid t 1 läggas till den redan beräknade uppsättningen. Detta ger ett enkelt förfarande för dynamiska dataset. Det finns emellertid vissa problem med detta tillvägagångssätt. Det är rimligt att hävda att medelvärdet under de senaste 3 perioderna skulle vara placerat vid tiden t -1, inte tiden t. och för en MA över ett jämnt antal perioder kanske det borde ligga mitt i punkten mellan två tidsintervaller. En lösning på denna fråga är att använda centrerade MA-beräkningar, där MA vid tid t är medelvärdet av en symmetrisk uppsättning värden runt t. Trots sina uppenbara meriter används inte denna metod generellt eftersom det krävs att data är tillgängliga för framtida händelser, vilket kanske inte är fallet. I fall där analysen helt och hållet består av en befintlig serie, kan användningen av centrerad Mas vara att föredra. Enkla glidande medelvärden kan betraktas som en form av utjämning, avlägsna några högfrekventa komponenter i en tidsserie och markera (men inte ta bort) trender på ett sätt som liknar den allmänna uppfattningen av digital filtrering. I själva verket är glidmedelvärden en form av linjärt filter. Det är möjligt att tillämpa en glidande medelberäkning till en serie som redan har slätts, dvs utjämning eller filtrering av en redan slätad serie. Till exempel, med ett glidande medelvärde av ordning 2 kan vi betrakta det som beräknat med vikter, så MA vid x 2 0,5 x 1 0,5 x 2. På samma sätt kan MA vid x 3 0,5 x 2 0,5 x 3. Om vi Applicera en andra nivå av utjämning eller filtrering, vi har 0,5 x 2 0,5 x 3 0,5 (0,5 x 2 0,5 x 3) 0,25 x 1 0,5 x 2 0,25 x 3 dvs 2-stegs filtrering process (eller convolution) har producerat ett variabelt viktat symmetriskt glidande medelvärde, med vikter. Flera omvälvningar kan producera ganska komplexa viktade glidmedel, av vilka vissa har visat sig vara speciellt användbara inom specialiserade områden, t. ex. i livförsäkringsberäkningar. Flyttande medelvärden kan användas för att avlägsna periodiska effekter om de beräknas med periodens längd som känd. Exempelvis kan säsongsvariationer ofta avlägsnas (om detta är målet) genom att tillämpa ett symmetriskt 12 månaders glidande medelvärde med alla månader viktade lika mycket, med undantag för det första och det sista som viktas med 12. Detta beror på att det kommer att var 13 månader i den symmetriska modellen (aktuell tid, t. - 6 månader). Totalen är dividerad med 12. Liknande procedurer kan antas för någon väldefinierad periodicitet. Exponentiellt vägda glidmedel (EWMA) Med den enkla glidande medelformeln: alla observationer är lika viktiga. Om vi ​​kallade dessa lika vikter, alfa t. var och en av k-vikterna skulle motsvara 1 k. så summan av vikterna skulle vara 1 och formeln skulle vara: Vi har redan sett att flera tillämpningar av denna process resulterar i vikterna varierande. Med exponentiellt viktade glidmedel är bidraget till medelvärdet från observationer som är mer borttagna i tiden minskat, vilket därmed understryker senare (lokala) händelser. I huvudsak introduceras en utjämningsparameter, 0lt al1l, och formeln revideras till: En symmetrisk version av denna formel skulle vara av formen: Om vikterna i den symmetriska modellen väljas som villkoren för villkoren för binomial expansion, (1212) 2q. de kommer att summera till 1, och när q blir stor kommer den att approximera normalfördelningen. Detta är en form av kärnviktning, med binomial som fungerar som kärnfunktionen. Den tvåstegsvalsning som beskrivs i föregående stycke är just detta arrangemang, med q 1, vilket ger vikterna. Vid exponentiell utjämning är det nödvändigt att använda en uppsättning vikter som summerar till 1 och som reducerar geometriskt i storlek. De använda vikterna är typiskt av formen: För att visa att dessa vikter summerar till 1, överväga utvidgningen av 1 som en serie. Vi kan skriva och expandera uttrycket i parentes med binomialformeln (1- x) p. där x (1-) och p -1, vilket ger: Detta ger då en form av viktat glidande medelvärde av formuläret: Denna summering kan skrivas som en återkommande relation: vilket förenklar beräkningen kraftigt och undviker problemet att viktningsregimen bör strängt vara oändlig för vikterna sammanlagt till 1 (för små värden av alfa. detta är vanligtvis inte fallet). Notationen som används av olika författare varierar. Vissa använder bokstaven S för att indikera att formeln i huvudsak är en jämn variabel och skriv: medan kontrollteori litteraturen ofta använder Z snarare än S för exponentiellt viktade eller jämnda värden (se exempelvis Lucas och Saccucci, 1990, LUC1 , och NIST-webbplatsen för mer detaljer och fungerade exempel). Formlerna som nämns ovan härstammar från Roberts arbete (1959, ROB1), men Hunter (1986, HUN1) använder ett uttryck av formen: vilket kan vara mer lämpligt för användning vid vissa kontrollförfaranden. Med alfa 1 är medelvärdet bara det uppmätta värdet (eller värdet av föregående dataobjekt). Med 0,5 är uppskattningen det enkla glidande medlet för nuvarande och tidigare mätningar. Vid prognosmodeller är värdet S t. används ofta som uppskattnings - eller prognosvärde för nästa tidsperiod, det vill säga som uppskattning för x vid tiden t 1. Således har vi: Detta visar att prognosvärdet vid tid t 1 är en kombination av det tidigare exponentiellt viktade glidande medeltalet plus en komponent som representerar det vägda prediktionsfelet, epsilon. vid tiden t. Antag att en tidsserie ges och en prognos krävs, ett värde för alfa krävs. Detta kan beräknas från befintliga data genom att utvärdera summan av kvadrerade prediktionsfel erhållna med varierande värden av alfa för varje t 2,3. inställning av den första uppskattningen som det första observerade datavärdet, x 1. I kontrollapplikationer är värdet av alfa viktigt eftersom det används vid bestämning av övre och nedre kontrollgränser och påverkar den genomsnittliga körlängden (ARL) som förväntas innan dessa kontrollgränser bryts (under antagandet att tidsserierna representerar en uppsättning slumpmässiga, identiskt distribuerade oberoende variabler med gemensam varians). Under dessa omständigheter är variansen av kontrollstatistiken: (Lucas och Saccucci, 1990): Kontrollgränser fastställs vanligtvis som fasta multiplar av denna asymptotiska varians, t. ex. - 3 gånger standardavvikelsen. Om exempelvis alfa 0,25 och de data som övervakas antas ha en Normalfördelning, N (0,1), när den är i kontroll, kommer kontrollgränserna att vara - 1,134 och processen kommer att nå en eller annan gräns i 500 steg i genomsnitt. Lucas och Saccucci (1990 LUC1) härleda ARL för ett brett spektrum av alfavärden och under olika antaganden med användning av Markov Chain-förfaranden. De tabulerar resultaten, inklusive att tillhandahålla ARL, när medelvärdet av kontrollprocessen har skiftats med en del multipel av standardavvikelsen. Till exempel, med ett 0,5 skift med alfa 0,25 är ARL mindre än 50 tidssteg. Tillvägagångssätten som beskrivs ovan är kända som enda exponentiell utjämning. som förfarandena tillämpas en gång till tidsserierna och sedan analyseras eller kontrollprocesser utförs på den resulterande släta datasetet. Om datasetet innehåller en trend och eller säsongsbetonade komponenter kan två - eller trestegs exponentiell utjämning användas för att undanröja (explicit modellering) dessa effekter (se vidare avsnittet Prognoser nedan och NIST-exemplet). CHA1 Chatfield C (1975) Analysen av Times Series: Theory and Practice. Chapman och Hall, London HUN1 Hunter J S (1986) Det exponentiellt vägda glidande medlet. J av Quality Technology, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) Exponentiellt viktade rörliga medelkontrollsystem: Egenskaper och förbättringar. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) Kontrolldiagramtester baserat på geometriska rörliga medelvärden. Technometrics, 1, 239-250Metod för rörliga medeltal Kommentarer är avstanna Anta att det finns tider som betecknas och motsvarande värden för variabel är. Först och främst måste vi bestämma perioden för glidande medelvärden. För korta tidsserier använder vi perioden med 3 eller 4 värden. För långtidsserier kan perioden vara 7, 10 eller mer. För kvartalsvisa serier räknar vi alltid medeltal på fyra fjärdedelar i taget. I månatliga tidsserier beräknas 12 månaders glidmedelvärden. Antag att den givna tidsserien är i år och vi har bestämt oss för att beräkna 3 års glidande medelvärde. De rörliga medelvärdena betecknas som nedan: David, Ja, MapReduce är avsedd att fungera på en stor mängd data. Och tanken är att i allmänhet ska kartan och minska funktionerna inte bryr sig om hur många mappers eller hur många reducerare det finns, det är bara optimering. Om du tänker noggrant på den algoritm som jag skrev upp kan du se att det spelar ingen roll vilken mappare får vilka delar av data som finns. Varje inmatningsrekord kommer att vara tillgänglig för varje reducerad operation som behöver den. ndash Joe K Sep 18 12 på 22:30 I bästa av mina förståelse är rörligt medelvärde inte snygga kartor till MapReduce-paradigmet eftersom dess beräkning väsentligen skjuter fönster över sorterade data, medan MR behandlar icke-skärmade intervall av sorterade data. Lösningen jag ser är som följer: a) Att implementera anpassad partitioner för att kunna skapa två olika partitioner i två körningar. I varje körning kommer dina reducerare att få olika dataområden och beräkna glidande medelvärde där det är lämpligt att jag ska försöka illustrera: I första omgången bör data för reduktionsmedel vara: R1: Q1, Q2, Q3, Q4 R2: Q5, Q6, Q7, Q8 . här kommer du att cacluate glidande medelvärde för några Qs. I nästa körning bör dina reducerare få data som: R1: Q1. Q6 R2: Q6. Q10 R3: Q10..Q14 Och caclulate resten av glidande medelvärden. Då måste du sammanställa resultaten. Idé av anpassad partitioner att det kommer att ha två olika sätt att fungera - varje gång dela i lika stora områden men med lite skift. I en pseudokod kommer det att se ut så här. partition (keySHIFT) (MAXKEYnumOfPartitions) där: SHIFT kommer att tas från konfigurationen. MAXKEY maximalt värde för nyckeln. Jag antar för enkelhet att de börjar med noll. RecordReader, IMHO är inte en lösning eftersom den är begränsad till specifik delning och kan inte glida över splitsgränsen. En annan lösning skulle vara att implementera anpassad logik för att dela in data (det är en del av InputFormat). Det kan göras att göra 2 olika bilder, liknar partitionering. svarat 17 sep 12 kl 8:59Moving Average: Vad det är och hur man beräknar det Se videoklippet eller läs artikeln nedan: Ett glidande medelvärde är en teknik för att få en övergripande bild av trenderna i en dataset, det är ett medelvärde av någon delmängd av siffror. Det rörliga genomsnittet är extremt användbart för att förutse långsiktiga trender. Du kan beräkna det under en viss tid. Om du till exempel har försäljningsdata för en tjugoårsperiod kan du beräkna ett femårigt glidande medelvärde, ett fyrårigt glidande medelvärde, ett treårigt glidande medelvärde och så vidare. Aktiemarknadsanalytiker brukar använda ett 50 eller 200 dagars glidande medelvärde för att hjälpa dem att se trender på aktiemarknaden och (förhoppningsvis) prognostisera var aktierna är på väg. Ett medelvärde representerar värdet 8220middling8221 av en uppsättning tal. Det rörliga genomsnittet är exakt detsamma, men genomsnittet beräknas flera gånger för flera delsatser av data. Om du till exempel vill ha ett tvåårigt glidande medelvärde för en dataset från 2000, 2001, 2002 och 2003, skulle du hitta medelvärden för delmängden 20002001, 20012002 och 20022003. Flyttvärdena är vanligtvis ritade och bäst visualiseras. Beräkning av ett femårigt rörligt medelvärde Exempel Exempelproblem: Beräkna ett femårigt glidande medelvärde från följande dataset: (4M 6M 5M 8M 9M) ​​5 6,4M Genomsnittlig försäljning för den andra delmängden om fem år (2004 8211 2008). centrerad runt 2006, är 6,6M: (6M 5M 8M 9M 5M) 5 6,6M Den genomsnittliga försäljningen för den tredje delmängden på fem år (2005 8211 2009). centrerad runt 2007, är 6,6M: (5M 8M 9M 5M 4M) 5 6,2M Fortsätt att beräkna varje femårsmedel tills du når slutet av uppsättningen (2009-2013). Detta ger dig en serie punkter (medelvärden) som du kan använda för att plotta ett diagram över glidande medelvärden. I följande Excel-tabell visas de glidande medelvärdena beräknade för 2003-2012 tillsammans med en scatterplot av data: Titta på videon eller läs stegen nedan: Excel har ett kraftfullt tillägg, Data Analysis Toolpak (hur man laddar data Analysis Toolpak) som ger dig många extra alternativ, inklusive en automatiserad glidande medelfunktion. Funktionen beräknar inte bara det glidande medlet för dig, det grafar också de ursprungliga uppgifterna samtidigt. vilket sparar dig en hel del tangenttryckningar. Excel 2013: Steg Steg 1: Klicka på 8220Data8221-fliken och klicka sedan på 8220Data Analysis.8221 Steg 2: Klicka på 8220Möter genomsnittet8221 och klicka sedan på 8220OK.8221 Steg 3: Klicka på rutan 8220Input Range8221 och välj sedan dina data. Om du inkluderar kolumnrubriker, se till att du markerar etiketterna i första raden. Steg 4: Skriv ett intervall i lådan. Ett intervall är hur många tidigare poäng du vill att Excel ska använda för att beräkna det rörliga genomsnittet. Till exempel skulle 822058221 använda de tidigare 5 datapunkterna för att beräkna medelvärdet för varje efterföljande punkt. Ju lägre intervall desto närmare är ditt glidande medelvärde till din ursprungliga dataset. Steg 5: Klicka i rutan 8220Output Range8221 och välj ett område på arbetsbladet där du vill att resultatet ska visas. Eller klicka på 8220New-kalkylbladet8221. Steg 6: Markera rutan 8220Chart Output8221 om du vill se ett diagram över din dataset (om du glömmer att göra det kan du alltid gå tillbaka och lägga till det eller välja ett diagram från fliken 8220Insert8221.8221 Steg 7: Tryck på 8220OK .8221 Excel kommer att returnera resultaten i det område du angav i steg 6. Titta på videon eller läs stegen nedan: Provproblem: Beräkna treårigt glidande medelvärde i Excel för följande försäljningsdata: 2003 (33M), 2004 (22M), 2005 (36M), 2006 (34M), 2007 (43M), 2008 (39M), 2009 (41M), 2010 (36M), 2011 (45M), 2012 (56M), 2013 (64M). 1: Skriv in data i två kolumner i Excel. Den första kolumnen ska ha år och andra kolumnen kvantitativa data (i det här exemplet problemet, försäljnings siffrorna). Se till att det inte finns några tomma rader i din celldata. : Beräkna det första treårsgenomsnittet (2003-2005) för data. För det här provproblemet, skriv 8220 (B2B3B4) 38221 i cell D3. Beräkna det första genomsnittet. Steg 3: Dra kvadraten längst ner till höger d egen att flytta formeln till alla celler i kolumnen. Detta beräknar medelvärden för efterföljande år (t ex 2004-2006, 2005-2007). Dra formeln. Kolla in vår YouTube-kanal för mer statistiks hjälp och tips. Flytta genomsnittet: Vad det är och hur man beräknar det var senast ändrat: 8 januari 2016 av Andale 22 tankar om ldquo Flyttande medelvärde: Vad det är och hur man beräknar det rdquo Detta är perfekt och enkelt att assimilera. Tack för arbetet Detta är mycket tydligt och informativt. Fråga: Hur räknar man med ett 4-årigt glidande medelvärde Vilket år skulle det 4-åriga glidande medelcentrumet på It centreras i slutet av det andra året (dvs. 31 december). Kan jag använda medelinkomst för att prognostisera framtida resultat Mycket tydligt och enkelt. Tack så mycket Hur man skapar ett glidande medelvärde Vänligen vägleda mig. Menar du en glidande genomsnittlig inventeringsmetod Var kommer jag att centrera min första prognos för en 2-årig SMA Skulle jag lägga den på andra eller tredje raden skulle jag lägga den på andra raden. Jag gillar det här är användbart Mycket bra Exempel Vad händer om det inte är något totalt? Se min kommentar ovan om 4 års glidande medel8230it skulle ligga i slutet av ett år. någon vet om centrerad medel snälla berätta om någon vet. Här anges det att vi måste överväga 5 år för att få det medelvärde som ligger i centrum. Då då om resten år om vi vill få medelvärdet av 20118230 så har vi inte ytterligare värden efter 2012, hur skulle vi beräkna det som du don8217t har mer info det skulle vara omöjligt att beräkna 5 år MA för 2011. Du kan få ett tvåårigt glidande medel men. Hej Tack för videon. En sak är emellertid oklart. Hur man gör en prognos för de kommande månaderna Videon visar prognosen för månaderna för vilka data redan är tillgängliga. Hej, Rå, I8217m arbetar med att utöka artikeln för att inkludera prognoser. Processen är lite mer komplicerad än att använda tidigare data. Ta en titt på denna Duke University artikel, som förklarar det i djupet. Hälsningar, Stephanie tack för en tydlig förklaring. Hej Det gick inte att hitta länken till den föreslagna Duke University-artikeln. Begär att skicka länken igen

No comments:

Post a Comment