Sunday, 29 October 2017

Unregelmäßiger Gleitender Durchschnitt


Ich habe eine große Anzahl von Dateien (1200), die jeweils eine große timeserie mit Daten über die Höhe des Grundwassers enthält. Das Startdatum und die Länge der Serie ist für jede Datei unterschiedlich. Es gibt große Datenlücken zwischen Daten, zum Beispiel (kleiner Teil einer solchen Datei): Ich möchte die durchschnittliche Höhe über 5 Jahre berechnen. Also, im Falle des Beispiels 14-1-1980 5 Jahre, 14-1-1985 5 Jahre. Die Anzahl der Datenpunkte ist für jede Berechnung des Durchschnitts unterschiedlich. Es ist sehr wahrscheinlich, dass das Datum 5 Jahre später nicht in der Datenmenge als Datenpunkt sein wird. Daher denke ich, muss ich sagen, R irgendwie, um einen Durchschnitt in einer bestimmten Zeitspanne zu nehmen. Ich suchte im Internet, aber nicht etwas, das meine Bedürfnisse passt. Viele nützliche Pakete wie uts, Zoo, lubridate und die Funktion aggregate vorbei. Statt der Lösung näher zu kommen, werde ich immer mehr verwirrt, welchen Ansatz das beste für mein Problem ist. Vielen Dank im voraus, um herauszufinden, einige Metriken, die auf, wie zuverlässig Clients eine Verbindung zu einem Dienst zu sehen. Die Rohdaten sind in Form von Client A, kam onlineoffline zum Zeitpunkt X. Die Verbindung ist sehr unzuverlässig, und ich möchte irgendeine Art von gleitenden Durchschnitt zu zeigen, ob die Verbindung verbessert oder nicht im Laufe der Zeit. Clients sind nicht immer verbunden, also einfach offline zu gehen bedeutet nicht, dass es ein Fehler ist. So weit, Ive genommen dann Daten und angewandt einige Annahmen, um es zu vereinfachen, nehme ich an, dass, wenn ein Client wieder innerhalb einer Minute der Trennung, dann ist das ein Fehler. Diese Ive modelliert als eine einfache impluses, dh. Client A hatte zum Zeitpunkt X Fehler. Der Teil Im, der kämpft, ist, wie man dieses Diagramm in einen gleitenden Durchschnitt umdreht (Im, das mit R spielt, um die Zahlen zu knacken). Ich glaube, ich sollte in der Lage, dies mit einem Tiefpassfilter tun, oder verwenden Sie das Zoo-Paket und Rollmean. Jedoch weiß ich nicht, wie man die Fälle behandelt, in denen der Klient einfach nicht wünschte, online. Moving Durchschnitt auf unregelmäßigen Zeitreihen gt zu sein ----- Ursprüngliche Mitteilung ----- gt Von: verborgene eMail gt mailto: verborgene eMail an Im Namen von Gustaf Rydevik gt Gesendet: Donnerstag, 3. Juni 2010 07:24 gt An: hidden email gt Thema: R gleitender Durchschnitt auf unregelmäßigen Zeitreihen gt gt Hallo all, gt gt gt Ich frage mich, ob es irgendeine Möglichkeit, ein zu berechnen Gleitenden Durchschnitt auf einer gt unregelmäßige Zeitreihe oder verwenden Sie die rollapply-Funktion in Zoo gt Ich habe eine Reihe von Daten, wo ich überprüfen möchten, ob es ein Ereignis gt 14 Tage vor jedem Zeitpunkt, um diese Zeitpunkte für gt markieren Entfernung, und cant herauszufinden, eine gute Möglichkeit, es zu tun. Gt gt Vielen Dank im Voraus gt gt Gustaf gt gt gt Beispieldaten: gt gt exDatalt-Struktur (Liste (Datumsstruktur (c (14476, 14569, gt 14576, 14621, gt 14627, 14632, 14661, 14671, 14705, 14715, Gt Ereignis c (TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, gt FALSE, FALSE, FALSE), gt Ereignis c (TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE) (Z. B. TRUE, TRUE, TRUE, FALSE, FALSE, FALSE, gt TRUE, FALSE, FALSE, FALSE)) Die Namen c (quotDatebeginquot, quotEventquot gt), row. names c (NA, 20L), Klasse quotdata. framequot) In diesem Beispiel ist die Zeile 18 ein Datum, das weniger als 14 Tage nach einem Ereignis gt liegt und zur Entfernung markiert werden sollte. Die folgende Funktion gibt die Anzahl der Tage seit dem letzten Ereignis zurück: f lt - function (data), wenn der Datensatz nach dem Zeitpunkt der Bestellung () - Aufrufe am Anfang und am Ende nicht benötigt würde. O lt - order (dataDatebegin) Daten lt-datao. Drop FALSE lastEventRow lt - which (dataEvent) cumsum (dataEvent) if (Länge (lastEventRow) lt Länge (o)) dh früheste Einträge sind keine Ereignisse lastEventRow lt - c (rep (NA, Länge (o) - Länge (lastEventRow)) , LastEventRow) timeSinceLastEvent lt - dataDatebegin - dataDatebeginlastEventRow timeSinceLastEventorder (o) Sie können tmp lt - f (exData) exDatatmpgt14 tmpEvent ausführen. DropFALSE, um die Ereignisse und die Nicht-Ereignisse mehr als zwei Wochen nach einem Ereignis auszuwählen. Bill Dunlap Spotfire, TIBCO Software wdunlap tibco gt gt - gt Gustaf Rydevik, M. Sci. Gt tel: 46 (0) 703 051 451 gt Essingetorget 40,112 66 Stockholm, gt sketch: gustafrydevik gt gt gt versteckte e-mail-mailingliste gt stat. ethz. chmailmanlistinfor-hilfe gt BITTE lesen Sie die Buchungsanleitung gt R-Projekt. Orgposting-guide. html gt und geben kommentierten, minimalen, in sich geschlossenen, reproduzierbaren Code. Gt Öffnen Sie diesen Beitrag in der threaded-Ansicht Bericht Inhalt als Unangemessen Re: gleitender Durchschnitt auf irreguläre Zeitreihen Antwort auf diesen Beitrag von Gustaf Rydevik Ersetzen Sie die Nicht-Ereignisse mit NA und verwenden Sie dann na. locf aus dem Zoo-Paket, um das letzte Ereignis Datum zu verschieben Bis zu lastEvent. Wählen Sie dann einfach die Zeilen aus, deren lastEvent-Datum vor mindestens 14 Tagen liegt oder ob die Zeile selbst ein Ereignis ist: gt library (zoo) na. locf gt gt lastEvent lt - mit (exData, na. locf (ifelse (Event, Datebegin, NA), na. rm FALSE)) gt exDatabeg gt lastEvent 14 exDataEvent, Datumsanzeige Ereignis 1 2009-08-20 TRUE 2 2009-11-21 FALSE 3 2009-11-28 FALSE 4 2010-01-12 FALSE 5 2010-01 -18 FALSE 6 2010-01-23 FALSE 7 2010-02-21 FALSE 8 2010-03-03 FALSE 9 2010-04-06 FALSE 10 2010-04-16 FALSE 11 2010-05-22 WAHR 12 2010-05-22 Geltungsbereich 12 2010-05-22 WAHR 12 2010-05-22 WAHR 12 2010-05-22 WAHR 12 2010-05-22 WAHR 12 2010-05-22 WAHR 12 2010-05-22 WAHR 12 2010-05 27 TRUE 13 2009-09-08 TRUE 14 2009-10-01 FALSE 15 2009-10-06 FALSE 16 2009-10-09 FALSE 17 2009-10-11 WAHREN 19 2009-10-28 FALSCH 20 2009-10-31 Hallo alle, gt gt gt Ich frage mich, ob es eine Möglichkeit, einen gleitenden Durchschnitt auf eine gt unregelmäßige Zeitreihen zu berechnen, oder verwenden Sie die Rollapply Funktion im Zoo gt Ich habe eine Reihe von Daten, wo ich überprüfen wollen, ob es ein Ereignis gt 14 Tage vor jedem Zeitpunkt, um diese Zeitpunkte für gt Entfernung zu markieren, und kann nicht herausfinden, eine gute Möglichkeit, es zu tun . Gt gt Vielen Dank im Voraus gt gt Gustaf gt gt gt Beispieldaten: gt gt exDatalt-Struktur (Liste (Datumsstruktur (c (14476, 14569, 14576, 14621, gt 14627, 14632, 14661, 14671, 14705, 14715, 14751) (FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, Die Namen c (quotDatebeginquot, quotEventquot gt), die row. names c (NA, 20L), die Klasse quotdata. framequot) gt gt In In diesem Beispiel ist Zeile 18 ein Datum, das weniger als 14 Tage nach einem Ereignis gt liegt und zur Entfernung markiert werden sollte. Gt gt gt - gt Gustaf Rydevik, M. Sci. Gt tel: 46 (0) 703 051 451 gt Essingetorget 40,112 66 Stockholm, gt sketch: gustafrydevik gt gt gt versteckte e-mail-mailingliste gt stat. ethz. chmailmanlistinfor-hilfe gt BITTE lesen Sie die Entsendeführung R-project. orgposting - guide. html gt und geben kommentierten, minimalen, in sich geschlossenen, reproduzierbaren Code. Dieses Thema bei Mister Wong speichern Dieses Thema bei YiGG. de speichern Dieses Thema bei YiGG. de speichern Dieses Thema bei YiGG. de speichern Dieses Thema bei YiGG. de speichern Dieses Thema bei YiGG. de speichern Dieses Thema bei YiGG. de speichern Dieses Thema bei Google speichern Dieses Thema bei del. icio. us speichern Vielen Dank an euch beide gt gt Am Thu, 3. Juni 2010 um 10.23 Uhr, Gustaf Rydevik gt lthidden E-Mail gt schrieb: gtgt Hallo all, gtgt gtgt gtgt Ich frage mich, ob es irgendeine Möglichkeit, einen gleitenden Durchschnitt auf eine Gtgt unregelmäßige Zeitreihen oder verwenden Sie die rollapply-Funktion in Zoo gtgt Ich habe eine Reihe von Daten, wo ich überprüfen möchten, ob es ein Ereignis gtgt 14 Tage vor jedem Zeitpunkt, um diese Zeitpunkte für gtgt Entfernung markieren und cant Herauszufinden, eine gute Möglichkeit, es zu tun. Gtgt gtgt Vielen Dank im Voraus gtgt gtgt Gustaf gtgt gtgt gtgt Beispieldaten: gtgt gtgt exDatalt-Struktur (Liste (Datumsstruktur (c (14476, 14569, 14576, 14621, gtgt 14627, 14632, 14661, 14671, 14705, 14715, 14751) , Gtgt FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, Es werden die Namen c (quotDatebeginquot, quotEventquot gtgt), row. names c (NA, 20L), class quotdata. framequot) gtgt gtgt In Dieses Beispiel, Zeile 18 ist ein Datum weniger als 14 Tage nach einem Ereignis gtgt und sollte für die Entfernung markiert werden. Gtgt gtgt gtgt gtgt - gtgt Gustaf Rydevik, M. Sci. Gtgt tel: 46 (0) 703 051 451 gtgt Essingetorget 40,112 66 Stockholm, gtgt skype: gustafrydevik gtgt gtgt gtgt versteckte e-Mail-Mailingliste gtgt stat. ethz. chmailmanlistinfor-help gtgt BITTE lesen Sie die Entsendeführung R-project. orgposting - guide. html gtgt und geben kommentierten, minimalen, in sich geschlossenen, reproduzierbaren Code. Gtgt gt - Gustaf Rydevik, M. Sci. Tel: 46 (0) 703 051 451 Essingetorget 40,112 66 Stockholm, SE skype: gustafrydevik Re: gleitender Durchschnitt auf irregulärer Zeitreihe Beitrag von Gabor Grothendieck am Thu, Jun 3, 2010, um 8:04 Uhr, Gabor Grothendieck lthidden email gt wrote: gt Ersetzen Sie die Nicht-Ereignisse mit NA und verwenden Sie dann na. locf aus dem Zoo-Paket, um das letzte Ereignis-Datum zu verschieben, um lastEvent zu geben. gt Wählen Sie dann einfach die Zeilen, deren Datum ist lastevent mindestens 14 Tage vor gt oder wenn die Zeile selbst ist ein Ereignis: gt gtgt Bibliothek (Zoo) na. locf gtgt gtgt lastevent LT - mit (exData, na. locf (ifelse (Ereignis , Datebegin, NA), na. rm FALSCH)) gtgt exDatabeg gt lastevent 14 exDataEvent, Die letzte Zeile hätte sein sollen: exDataexDataDatebegin gt lastevent 14 exDataEvent, gt Datebegin Ereignis gt 1 2009-08-20 TRUE gt 2 2009-11-21 FALSE gt 3 2009-11-28 FALSE gt 4 2010-01-12 FALSE gt 5 2010-01-18 FALSE gt 6 2010-01-23 FALSE gt 7 2010-02-21 FALSE gt 8 2010-03-03 FALSCHG 9 2010-04-06 FALSE gt 10 2010-04-16 FALSE gt 11 2010-05-22 WAHREN gt 12 2010-05-27 WAHR gt 13 2009-09-08 WAHR gt 14 2009-10-01 FALSCH gt 15 2009 -10-06 FALSE gt 16 2009-10-09 FALSE gt 17 2009-10-11 WAHR gt 19 2009-10-28 FALSE gt 20 2009-10-31 FALSE gt gt gt Am Do, 3. Jun 2010 um 10: 23 Uhr, Gustaf Rydevik gt lthidden E-Mail gt schrieb: gtgt Hallo, gtgt gtgt gtgt ich frage mich, ob es eine Möglichkeit ist, einen gleitenden Durchschnitt auf einer gtgt unregelmäßigen Zeitreihen, oder verwenden Sie die rollapply Funktion im Zoo zu berechnen gtgt ich habe eine Reihe von Termine, wo möchte ich überprüfen, ob es ein Ereignis gtgt 14 Tage vor jedem Zeitpunkt, um diese Zeitpunkte für gtgt Entfernung markieren, und cant herauszufinden, eine gute Möglichkeit, es zu tun. gtgt gtgt Vielen Dank im Voraus gtgt gtgt Gustaf gtgt gtgt gtgt Beispieldaten: gtgt gtgt exDatalt-Struktur (Liste (Datebegin Struktur (c (14476, 14569, 14576, 14621, gtgt 14627, 14632, 14661, 14671, 14705, 14715, 14751 , 14756, 14495, gtgt 14518, 14523, 14526, 14528, 14529, 14545, 14548), Klasse quotDatequot), gtgt Ereignis c (TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE gtgt FALSCH, FALSCH, FALSCH, TRUE, TRUE, TRUE, FALSE, FALSE, FALSE, gtgt TRUE, FALSE, FALSE, FALSE)). Namen c (quotDatebeginquot, quotEventquot gtgt), row. names c (NA, 20L), Klasse quotdata. framequot) gtgt gtgt In Dieses Beispiel, Zeile 18 ist ein Datum weniger als 14 Tage nach einem Ereignis gtgt und sollte für die Entfernung markiert werden. Gtgt gtgt gtgt gtgt - gtgt Gustaf Rydevik, M. Sci. Gtgt tel: 46 (0) 703 051 451 gtgt Essingetorget 40,112 66 Stockholm, gtgt skype: gustafrydevik gtgt gtgt gtgt versteckte e-Mail-Mailingliste gtgt stat. ethz. chmailmanlistinfor-help gtgt BITTE lesen Sie die Entsendeführung R-project. orgposting - guide. html gtgt und geben kommentierten, minimalen, in sich geschlossenen, reproduzierbaren Code. Gtgt gt

No comments:

Post a Comment