Tuesday, October 11, 2016

Exponentially Weighted Moving Average Charts For Detecting Concept Drift

Eksponensieel geweeg bewegende gemiddelde kaarte vir die opsporing van konsep drif Abstract Klassifisering stroom data vereis die ontwikkeling van metodes wat computationeel doeltreffende en in staat om te gaan met veranderinge in die onderliggende verdeling van die stroom, 'n verskynsel wat in die literatuur as konsep drif bekend is. Ons stel 'n nuwe metode vir die opsporing van konsep drif wat 'n eksponensieel geweeg bewegende gemiddelde (EWMA) grafiek gebruik om die foutieve classificatie tempo van 'n streaming klassifiseerder te monitor. Ons benadering is modulêre en kan dus uitgevoer word in parallel met 'n onderliggende klassifiseerder om 'n bykomende laag van konsep drif opsporing voorsien. Verder ons metode is computationeel doeltreffende met oorhoofse O (1) en werk in 'n ten volle aanlyn wyse met geen behoefte om datapunte te stoor in die geheue. In teenstelling met baie bestaande benaderings tot konsep drif opsporing, ons metode laat die tempo van vals positiewe ontdekkings te beheer en konstant gehou met verloop van tyd. Hoogtepunte Ons bied 'n enkele slaag en bestryk doeltreffende konsep drif opsporing algoritme. Geskik vir ontplooiing op 'n hoë frekwensie data strome. Laat die tempo van vals positiewe ontdekkings te beheer, in teenstelling met bestaande metodes. Eksperimente op beide werklike en sintetiese data toon positiewe resultate opgelewer. Sleutelwoorde Streaming klassifikasie Konsep drif Verandering detectionarXiv. org GT stat GT arXiv: 1212.6018 Statistiek masjien Leer Titel: eksponensieel Geweegde Moving Gemiddelde Charts vir die opsporing van Konsep Drift (Submitted on 25 Desember 2012) Abstract: Klassifiseer stroom data vereis die ontwikkeling van metodes wat computationeel doeltreffende is en in staat om te gaan met veranderinge in die onderliggende verdeling van die stroom, 'n verskynsel wat in die literatuur as konsep drif bekend. Ons stel 'n nuwe metode vir die opsporing van konsep drif wat 'n eksponensieel Geweegde bewegende gemiddelde (EWMA) grafiek gebruik om die foutieve classificatie tempo van 'n streaming klassifiseerder te monitor. Ons benadering is modulêre en kan dus uitgevoer word in parallel met 'n onderliggende klassifiseerder om 'n bykomende laag van konsep drif opsporing voorsien. Verder ons metode is computationeel doeltreffende met oorhoofse O (1) en werk in 'n ten volle aanlyn wyse met geen behoefte om datapunte te stoor in die geheue. In teenstelling met baie bestaande benaderings tot konsep drif opsporing, ons metode laat die tempo van vals positiewe ontdekkings te beheer en konstant gehou met verloop van tyd. Masjienleer (stat. ML) Leer (cs. LG) Aansoeke (stat. AP) 'n Vergelykende studie oor konsep drif detectors A 2 k faktoriale ontwerp is gebruik om die beste parameters vir elke metode aan te dui. Toetse in vergelyking akkuraatheid, evaluering tyd, vals alarm en Mej opsporing pryse. A Mahalanobis afstand word voorgestel as 'n metrieke om drif metodes te vergelyk. DDM was die metode wat die beste gemiddelde resultate in al getoets datastelle aangebied. Abstract In datastroom omgewings, is drif opsporing metodes wat gebruik word om te identifiseer wanneer die konteks verander het. Hierdie vraestel evalueer agt verskillende konsep drif detectors (DDM. EDDM. PHT. Stepd. Doen f. Adwin. Pare Leerders en ecdd) en voer toetse met behulp van kunsmatige datastelle wat geraak word deur skielike en geleidelike konsep dryf, met 'n paar pryse van drif, met en sonder geraas en irrelevant eienskappe, en ook die gebruik van die werklike wêreld datastelle. Daarbenewens is 'n 2 k 2 k faktoriaal ontwerp gebruik word om die parameters wat die meeste invloed prestasie wat 'n nuwigheid in die gebied aan te dui. Ook, 'n variasie van die Friedman nie-parametriese statistiese toets is gebruik om die beste metodes te identifiseer. Eksperimente in vergelyking akkuraatheid, evaluering tyd, sowel as vals alarm en Mej opsporing pryse. Verder gebruik ons ​​die Mahalanobis afstand te meet hoe soortgelyke die metodes is in vergelyking met die beste moontlike opsporing uitset. Hierdie werk kan tot 'n mate, ook gesien word as 'n navorsingsopname van bestaande drif opsporing metodes. Sleutelwoorde datastromen-Time veranderende data Konsep drif detectors ComparisonDepartment Wiskunde Past versuring en herstel van oppervlak water, grond en ekologie in die Verenigde Koninkryk: Vooruitsigte vir die toekoms onder die huidige afsetting en grondgebruik protokolle (2013) R. C. Helliwell, J. Aherne, G. MacDougall, T. R. Nisbet, D. Lawson, BJ Cosby en C. D. Evans Ekologiese Indicators DOI: dx. doi. org/10.1016/j. ecolind.2013.02.005 URL wat deur die skrywer 'n statistiese metode vir die bepaling van die omvang van die vulkaniese val deposito (2013) R. E. Burden, L. Chen, JC Phillips Kommunikasie op Stogastiese Ontleding DOI: 10,1007 / s00445-013-0707-4 URL wat deur die skrywer Gelykvormigheid matrikse en cluster algoritmes vir bevolking identifcation met behulp van genetiese data (2012) Daniel Lawson en Daniel Falush jaarlikse hersiening van menslike Genomics, vol: 13, Pages: 337-361 DOI: ABS / 10,1146 / annurev-genoom-08241 URL wat deur die skrywer Inferensie van die bevolking struktuur met behulp van digte haplotipe data (2012) Daniel Lawson, Garrett Hellenthal, Simon Myers, en Daniel Falush PLoS Genetics, vol: 8, Issue: 1, Page: e1002453 URL wat deur die skrywer Sekwensiële Monitering van 'n Bernoulli Volgorde wanneer die Pre-verandering parameter is onbekend (2012) GJ Ross, DK Tasoulis, NM Adams Computational Statistiek eksponensieel Geweegde Moving Gemiddeld Charts vir die opsporing van Konsep Drift (2012) GJ Ross, DK Tasoulis, NM Adams, Patroon DJ Hand Erkenning Briewe, vol: 33, Uitgawe: 2, Pages: 191-198 Twee-parametriese beheer Charts vir die opsporing van Arbitrêre Distribution Wysigings (2012) GJ Ross, NM Adams Journal of kwaliteit Tegnologie, vol: 44, Uitgawe: 2, Pages: 102-116 Implikasies van die verandering van die minimale oorlewing voordeel in leweroorplanting (2012) Knight, M, Barber, K. Gimson, A. Collett, D . Neuberger, J. leweroorplanting DOI: DOI: 10,1002 / lt.23380 Bayes-analise van nie-lineêre differensiaalvergelyking modelle met aansoek om 'n derm mikrobiese ekostelsel (2011) Daniel Lawson, Cornelia Holtrop en Harry Flint Die Biometriese Journal, Vol: 53 , Pages: 543-556 URL wat deur die skrywer parametriese Monitering van data strome vir veranderinge in ligging en skaal (2011) GJ Ross, DK Tasoulis, NM Adams Technometrics, vol: 53, Uitgawe: 4, Pages: 379-389 Likelihood - gratis skatting van model bewyse (2011) Xavier Didelot Richard G. Everitt, Adam M. Johansen en Daniel J. Lawson Bayes-analise, vol: 6, Pages: 49-76 URL wat deur die skrywer Grafiese modelle vir afleiding onder uitkoms afhanklik monsterneming ( 2010) Didelez, Kreiner, Keiding Statistiese Wetenskap, vol: 25, Pages: 368-387 DOI: 10,1214 / 10-STS340 URL wat deur die skrywer op die oplossing van integrale vergelykings met behulp van Markov ketting Monte Carlo metodes (2010) Doucet, A Johansen, AM Tadic, VB Toegepaste Wiskunde. en Comp. vol: 216 Uitgawe: 10, Pages: 2869-2880 Die eenvoudige harmoniese urn (2010) Edward Crane, Nicholas Georgiou, Stanislav Volkov, Andrew Wade en Robert Waters Annale van waarskynlikheid Posterior Geweegde ment leer met die staat Onsekerheid (2010) Larsen, T Leslie, DS Collins, EJ, et al. Neurale berekening, vol: 22, Pages: 1149-1179 Antwoord Robert et al. Model kritiek lig model keuse en model vergelyking (2010) Ratmann, o Andrieu, C Wiuf, C, et al. Verrigtinge van die Nasionale Akademie van Wetenskappe, VSA, vol: 107, Uitgawe: 3, Pages: E6 - E7 stabiliteit van 'n groeiproses wat gegenereer word deur monomeer te vul met die naaste-buurman koöperatiewe effekte (2010) Stanislav Volkov en Vadim Shcherbakov Stogastiese prosesse en hul aansoeke. Pages: na - na URL wat deur die skrywer Die fiksering waarskynlikheid van twee mededingende voordeel mutasies (2010) Yu, Feng Etheridge, Alison Teoretiese Bevolking Biologie, vol: 78, Uitgawe: 1, bladsye: 36 - 45 Inferensie van homoloë rekombinasie in Bakterieë die gebruik van hele genoom volgorde (2010) avier Didelot, Daniel Lawson, Aaron Darling en Daniel Falush Genetics, vol: 186 Pages: 1435-1449 URL wat deur die skrywer kundigheid en Meerveranderlike Emulatie: die Termosfeer-ionosfeer Elektrodinamika algemene sirkulasie Model (Tie - GCM) (2009) JC ROUGIER, S. Guillas, A. Maute, AD Richmond Technometrics, vol: 51, Pages: 414-424 dOI: doi: 10,1198 / TECH.2009.07123 op verskeie metodes vir data op grafieke en onreëlmatige multidimensionele situasies ( 2009) Jansen, M. Nason, GP en Silverman, B. W. Tydskrif van die Royal Statistiese Vereniging Reeks B, vol: 71, Pages: 97-126 DOI: 10,1111 / j.1467-9868.2008.00672.x URL wat deur die skrywer 'n nondecimated opheffing omskep (2009) Knight MI, Nason GP Statistiek en Computing, vol: 19, Pages: 1-16 DOI: 10,1007 / s11222-008-9062-2 A nondecimated opheffing omskep (2009) Knight, M. en Nason, GP Statistiek en Rekenaarwetenskap, vol: 19, Pages: 1-16 DOI: 10,1007 / s11222-008-9062-2 URL wat deur die skrywer Doeltreffende-Nut gebaseer Groepering oor hoë Dimensionele Partition ruimtes (2009) Live Rani, S. Anderson, PE Edwards , KD Millar, AJ en Smith, JQ Bayes-analise, vol: 4, Issue: 3, Pages: 539-572 URL wat deur die skrywer oor die gebruik van eenvoudige dinamiese stelsels vir klimaat voorspellings: 'n Bayesiaanse voorspelling van die volgende Ystydperk ontstaan ​​( 2009) M. Kruis en JC ROUGIER Die Europese fisika Journal - Spesiale Onderwerpe, vol: 174 Pages: 11-31 doi: DOI: 10,1140 / epjst / e2009-01087-5 leer om te tel: Robuuste Beramings vir Benoemde Afstande tussen molekulêre Rye (2009) OBrien, JD, Minin, VN Suchard, MA Molekulêre Biologie en Evolution DOI: 10,1093 / molbev / msp003 Bosbranden op Z met ontsteking net by 0 (2009) Stanislav Volkov ALEA Latyns-Amerikaanse Journal of Waarskynlikheid en Wiskundige Statistiek, vol: 6, Pages: 399-414 URL verskaf deur die skrywer oor stabiliteit van adsorpsie prosesse (2009) Stanislav Volkov en Vadim Shcherbakov eietydse probleme van Wiskunde en Meganika. Redakteurs: Shiryaev, A. N. Bladsynommers: 166-174 Uitgewer: Moscow State University Press URL wat deur die skrywer Wachtrij met bure (2009) Stanislav Volkov en Vadim Shcherbakov Waarskynlikheid en Wiskundige Genetics: Referate in eer van Sir John Kingman Editors: NH Bingham en CM Goldie Bladsynommers: 463-481 Uitgewer: London Wiskundige Vereniging lesingnotas Reeks URL wat deur die skrywer EAKF-CMAQ: Inleiding en evaluering van 'n data assimilasie vir CMAQ gebaseer op die Ensemble Aanpassing Kalman filter (2008) A. Zubrow, L. Chen en VR Kotamarthi J. Geophys. Res. vol: 113 DOI: 10,1029 / 2007JD009267 URL verskaf deur die skrywer Potts model groepering, kern K-middel en beraming digtheid, in pers (2008) A. Murua, L. I.Stanberry, W. Stuetzle. Journal of Computational en Grafiese Statistiek SMCTC: Sekwensiële Monte Carlo in C (2008) Adam M. Johansen Statistiek Groep Navorsingsverslag 08:16 URL wat deur die skrywer Markov-kettings (2008) Adam M. Johansen Encyclopedia of Rekenaarwetenskap Uitgewer: Wiley URL wat deur die skrywer 'n nota op hulp deeltjie filters (2008) Adam M. Johansen en Arnaud Doucet Statistiek amp Waarskynlikheid Briewe, vol: 78, Uitgawe: 12, Pages: 1498-1504 URL wat deur die skrywer gebruik van die outokorrelasie tyd en 'n outomatiese - validating metodes om die prestasie van Monte Carlo algoritmes te verbeter (2008) Everitt, RG PhD tesis URL wat deur die skrywer 'n Kruik model vir kans verhouding gebaseer adaptive fase III kliniese toetse (2008) Gopal Basak, Atanu Biswas, Stanislav Volkov Markov-prosesse en verwante velde URL wat deur die skrywer funksionele verbinding kartering met behulp van die ferromagnetiese Potts spin model. (2008) L. I.Stanberry, A. Murua, D. Cordes. Human Brain Mapping, vol: 29, Uitgawe: 4, Pages: 422-440 DOI: 10,1002 / hbm.20397 Teoretiese eienskappe van Cooks PFC dimensie vermindering algoritme vir lineêre regressie (2008) Oliver Johnson Elektroniese Tydskrif van Statistiek, vol: 2, Bladsye : 807-828 DOI: 10,1214 / 08-EJS255 URL wat deur die skrywer Leer om sein: ontleding van 'n mikro-vlak versterking model (2008) Raffaele Argiento, Robin Pemantle, Brian Skyrms, Stanislav Volkov Stogastiese prosesse en hul toepassings, URL verskaf deur die skrywer skeiding maatreëls en die meetkunde van Bayes faktor seleksie vir klassifikasie (2008) Smith, JQ Anderson, PE en Live Rani, SJ Royal Statist. Soc. B (Metodologiese), vol: 70, Uitgawe: 5, Pages: 957-980 Assessering probabilistiese voorspellings van meerveranderlike hoeveelhede, met aansoeke om voorspellings van oppervlakwinde ensemble. Genooi bespreking papier. (2008) T. Gneiting, L. I.Stanberry, E. Grimit, L. Held, N. Johnson. TOETS, vol: 17, Uitgawe: 2, Pages: 211-235 DOI: 10,1007 / s11749-008-0114-x Enkel Molekuul vlak ontleding van die subeenheid samestelling van die T-sel reseptor op live T-selle (2007) JR James en SS Wit en RW Clarke en AM Johansen et al. Verrigtinge van die Nasionale Academt van Wetenskappe, VSA, vol: 104 Uitgawe: 45, Pages: 17.662-17.667 URL wat deur die skrywer Glad funksies en lokale ekstreemwaardes (2007) Kovac, A. Computational Statistiek en data-analise, vol: om 51, Pages: 5156-5171 URL wat deur die skrywer Random omgewing op gekleurde bome (2007) Mikhail Menshikov, Dimitri Petritis, Stanislav Volkov Bernoulli, vol: 13, Pages: 966-980 URL wat deur die skrywer Tweeveranderlike skatting digtheid behulp BV regularisering (2007) Obereder, A. Scherzer, O. en Kovac, A. Computational Statistiek en data-analise, vol: om URL wat deur die skrywer van die aftree Gedrag van die zelfstandigen in Brittanje (2007) SC Parker en JC ROUGIER Toegepaste verskyn Ekonomie, Vol 39, Pages: 697-713 in ruimte en tyd statistiese modellering en voorspelling van Omgewingsake processe (2006) L. Chen, M. Fuentes en J. Davis Aansoeke van Computational Statistiek in die Omgewingswetenskappe: Hiërargiese Bayes en MCMC Metodes Redakteursforum : James S Clark en Alan Gelfand Uitgewer: Oxford University Press Lae frekwensie sein veranderinge te weerspieël verskille in funksionele verbinding tussen goed lesers en disleksie tydens deurlopende foneem kartering. (2006) L. I.Stanberry, T. Richards, V. W.Berninger, R. R.Nandy, E. Aylward, K. Maravilla, D. Cordes. Magnetiese Resonansie Beelding, vol: 24, Uitgawe: 3, Pages: 217-229 DOI: doi: 10,1016 / j. mri.2005.12.006 Periodisiteit in die verbygaande regime van uitputtende stemdag stelsels (2006) Mikhail Menshikov, Iain MacPhee, Serguei Popov , Stanislav Volkov Annale van Toegepaste Waarskynlikheid, vol: 16, Uitgawe: 4, Pages: 1816-1850 URL wat deur die skrywer Adaptive opheffing vir parametriese regressie (2006) Nunes, M. Knight, M. en Nason, GP Statistiek en Rekenaarwetenskap, vol: 16, Pages: 143-159 URL wat deur die skrywer Uitbreidings van Gladstryking via styf Strings (2005) Duumlmbgen, L. en Kovac, A. Tegniese verslag URL wat deur die skrywer handel volume en Contract Rollover in Toekomsstudie kontrakte (2005) PR Holmes en JC ROUGIER Journal of Empiriese Finansies, vol: 12, Pages: 317-338 digthede, Spectral digthede en Modaliteit (2004) Davies, PL en Kovac, A. Annale van Statistiek, vol: 32, Pages: 1093 - 1136 URL wat deur die skrywer Kwantifisering van die koste van gelyktydige nie-parametriese aanpassing van 'n paar monsters (2004) Davies, PL en Kovac, A. Tegniese verslag URL wat deur die skrywer Cluster analise van fMRI data met behulp van dendrogram slyp. (2003) L. I.Stanberry, R. R.Nandy, D. Cordes. Human Brain Mapping, vol: 20, Uitgawe: 4, Pages: 201-219 DOI: 10,1002 / hbm.10143 Robuuste parametriese regressie en modaliteit (2002) Kovac, A. Developments in Robuuste Statistiek Editors: R. Dutter, P. Filzmoser, U. Bring, P. Rousseeuw Bladsynommers: 218-227 Uitgewer: Physica, Heidelberg URL wat deur die skrywer Plaaslike Uiterstes, hardloop, Strings en Multi (met bespreking) (2001) Davies, PL en Kovac, A. Annale van Statistiek, vol: 29, Pages: 1-65 URL wat deur die skrywer meting van sosiale mobiliteit as Onvoorspelbaarheid (2001) SC Parker en JC ROUGIER Econo, vol: 68, Pages: 63 - 76Abstract In hierdie bladsy, maak ons ​​beskikbare data stroom ensemble klassifiseerders ontwerp om te gaan met konsep dryf (Hier. NSE, Dynamic Geweegde meerderheid Ensemble gebou, en RCD), konsep drif detectors (pare Leerders, ECDD, en PHT) en datastelle (Sinus en gemeng). Hul parameters en ooreenstemmende vraestelle word hieronder beskryf. Dokumentasie aan hierdie uitbreiding gebruik, moet jy moa. jar en sizeofag. jar, beskikbaar by MOA raamwerk webwerf aflaai. Dan voeg die pot lêers hieronder in die classpath by die launch MOA. Byvoorbeeld, in Linux: Java-cp EnsembleClassifiers. jar: moa. jar: weka. jar - javaagent: sizeofag. jar moa. gui. GUI die pot lêer basies het die klas lêers wat elke klassifiseerder te implementeer. Nog 'n opsie is om moa. jar decomprimeren, sluit die bron lêers in die moa. classifiers pakket en heropstel MOA. Ensemble klassifiseerders Dynamic Geweegde Meerderheid Die parameters beskikbaar vir hierdie klassifiseerder is die mense wat in die gekla vraestelle: l: Base leerder. p: Tydperk tussen kenner verwydering, skepping, en gewig update. - B: Factor om foute van klassifiseerders straf. G: Minimum fraksie van gewig per klassifiseerder. Verwysings Jeremy Zico Kolter en Marcus A. Maloof. Die gebruik van toevoeging deskundige ensembles te gaan met begrip drif. In Verrigtinge van die 22 Internasionale Konferensie oor masjienleer, ICML 05, bladsye 449-456, New York, NY, USA, 2005 ACM. ISBN 1-59593-180-5. URL doi. acm. org/10.1145/1102351.1102408~~V Jeremy Zico Kolter en Marcus A. Maloof. Dinamiese geweegde meerderheid: 'n Ensemble metode vir drywende konsepte. Die Journal of masjien Leer Navorsing. 8: 2755-2790, Desember 2007. ISSN 1532-4435. URL dl. acm. org/citation. cfmid1314498.1390333 Learn. NSE Die parameters beskikbaar vir hierdie klassifiseerder is die mense wat in die gekla vraestelle: l: Base leerder. p: Grootte van die omgewings. Na hoeveel voorbeelde van 'n nuwe klassifiseerder sal geskep word. - a: Helling van die sigmoid funksie beheer van die aantal tydens gewig in ag geneem vorige tydperke. - B: Halfpad kruising punt van die sigmoid funksie beheer van die aantal tydens gewig in ag geneem vorige tydperke. s: klassifiseerders snoei strategie wat gebruik gaan word (NR: geen snoei, ouderdom: ouderdom-gebaseerde, fout:-fout gebaseer). - e: Ensemble maksimum grootte. Verwysings Matthew Karnick, Metin Ahiskali, Michael D. Muhlbaier, en Robi Polikar. Leer konsep drif in stationaire omgewings met behulp van 'n ensemble van klassifiseerders gebaseer AP-praktiese benadering. In IEEE International Gesamentlike Konferensie oor Neurale Netwerke (IEEE World Congress op Computational Intelligence), IJCNN 08, bladsye 3455-3462, Junie 2008a. URL dx. doi. org/10.1109/IJCNN.2008.4634290 Matthew Karnick, Michael D. Muhlbaier, en Robi Polikar. Inkrementele leer in 'n nie-stasionêre omgewings met begrip drywing met behulp van 'n meervoudige klassifiseerder benadering. In 19 Internasionale Konferensie oor patroonherkenning, ICPR 08, bladsye 1-4 Desember 2008B. URL dx. doi. org/10.1109/ICPR.2008.4761062 Michael Muhlbaier en Robi Polikar. 'N Ensemble benadering vir verdere leer in stationaire omgewings. In Michal Haindl, Josef KITTLER, en Fabio Roli, redakteurs, meerdere Classifier Systems, volume 4472 van Lecture Notes in Rekenaarwetenskap, bladsye 490-500. Springer Berlyn / Heidelberg, 2007 ISBN 978-3-540-72481-0. URL dx. doi. org/10.1007/978-3-540-72523-749~~V Ryan Elwell en Robi Polikar. Inkrementele leer van konsep drif in 'n nie-stasionêre omgewings. IEEE Transactions on neurale netwerke, 22 (10): 1517-1531, Oktober 2011. ISSN 1045-9227. URL dx. doi. org/10.1109/TNN.2011.2160459 R. Elwell en R. Polikar. Inkrementele leer in stationaire omgewings met con gesleep vergeet. In IEEE International Gesamentlike Konferensie oor neurale netwerke, IJCNN 09, bladsye 771-778, Los Alamitos, CA, USA, Junie 2009b. IEEE Computer Society. URL dx. doi. org/10.1109/IJCNN.2009.5178779 RCD herhalende konsep dryf (RCD) is 'n raamwerk ontwikkel om te gaan met kontekste wat weer voor. Na die identifisering van 'n konsep drif deur 'n drif opsporing metode, dit maak gebruik van 'n nie-parametriese meerveranderlike statistiese toetse om te kyk of die konteks is 'n nuwe of 'n ou een wat weer voorkom. Die parameters wat gebruik word in DRC, is die volgende: l: Base leerder. - B: Buffer grootte. Dit is 'n voorbeeld van werklike en gestoor kontekste en word deur die statistiese toetse te identifiseer reoccurring konteks. t: Toets frekwensie. In die toetsfase is, is dit die tempo van die statistiese toetse is uitgevoer om klassifiseerder werklike betrekking tot huidige konteks in stand te hou. d: Drift opsporing metode te gebruik. - a: statistiese toets wat gebruik gaan word. s: Die minimum Persentuele ooreenkoms tussen uitkerings (p-waarde). - c: Die maksimum bedrag van klassifiseerders te slaan. - m: Die draad swembad grootte, wat aandui hoeveel gelyktydige toetse word toegelaat nie. Verwysings Paulo Mauricio Gonalves Jr en Roberto Souto Maior de Barros. RCD: 'n herhalende Konsep Drift raamwerk. Patroonherkenning Briewe. 34 (9), bladsye 1018-1025, 2013 Elsevier. URL dx. doi. org/10.1016/j. patrec.2013.02.005 Ensemble Gebou Classifier beter geskik om te hanteer herhalende konsep dryf. Die parameters is: l: Base leerder. - e: Toegelate fout. - a: Aanvaarding faktor. - c: Chunk grootte. r: Die maksimum aantal klassifiseerders te slaan en uit te kies wanneer die skep van 'n ensemble. - n: Die maksimum aantal klassifiseerder in 'n ensemble. Verwysings Sasthakumar Ramamurthy en Raj Bhatnagar. Dop Herhalende Konsep Drift in Streaming data met behulp van Ensemble klassifiseerders. In die sesde Internasionale Konferensie oor Machine Learning and Applications, pp. 404-409, 2007. URL dx. doi. org/10.1109/ICMLA.2007.80. Konsep Drift Detectoren ECDD (Ingesluit in MOA 2015) EWMA vir konsep Drift Detection (ECDD) is 'n drif detector wat 'n eksponensieel geweeg bewegende gemiddelde (EWMA) grafiek gebruik om die foutieve classificatie tempo van 'n streaming klassifiseerder te monitor. Dit kan gebruik word soos DDM en EDDM in die SingleClassifierDrift klas. Die parameters is: - a: Die gemiddelde duur lank. Lig die tempo van vals positiewe alarms per datapunte. - m: Beheer hoeveel gewig gegee aan meer onlangse data in vergelyking met ouer data. Kleiner waardes beteken minder gewig aan onlangse data. w: Waarskuwing drumpel. Verwysings Gordon J. Ross, Niall M. Adams, Dimitris K. Tasoulis en David J. Hand. Eksponensieel geweeg bewegende gemiddelde kaarte vir die opsporing van konsep drif. Patroonherkenning Briewe, 33, bladsye 191-198, 2012. Elsevier. URL dx. doi. org/10.1016/j. patrec.2011.08.019 pare Leerders (Ingesluit in MOA 2015) 'n klassifiseerder en drif detector. Skep twee klassifiseerders: 'n stabiele en 'n reaktiewe. Die eerste een is wat verantwoordelik is om die werklike stabiele konsep verteenwoordig, terwyl die reaktiewe een opgelei op die mees onlangse data. As die akkuraatheid van die reaktiewe is hoër as die stabiele, beteken dit dat die konsep verander het. Die stabiele klassifiseerder is vervang deur die reaktiewe, en die reaktiewe is reseted. Die parameters is: s: Stabiele leerder. r: Reaktiewe leerder. w: Venster grootte vir die reaktiewe leerder. t: Threashold vir die skep van 'n nuwe stabiele leerder. Verwysings Stephen H. Bach en Marcus A. Maloof, pare Leerders vir Fase Drift, in die agtste IEEE Internasionale Konferensie oor data-ontginning, pp. 23-32, 2008. URL dx. doi. org/10.1109/ICDM.2008.119. PHT (Ingesluit in MOA 2015) Die Page-Hinkley toets (PHT) is 'n sekwensiële analise tegniek tipies gebruik word vir die monitering verandering opsporing in die gemiddelde van 'n Gaussiese sein. Dit kan gebruik word soos DDM en EDDM in die SingleClassifierDrift klas. Die parameters is: d: Opsporing drumpel. w: Waarskuwing drumpel. - m: Magnitude drumpel. Verwysings DOF ​​Die DOF metode ontdek dryf deur die verwerking van data stuk deur hap, die berekening van die naaste buurman in die vorige joernaal vir elke geval in die huidige groep en hul ooreenstemmende etikette vergelyk. 'N afstand kaart word geskep, assosieer die indeks van die geval in die vorige joernaal en die etiket bereken deur die naaste. A metrieke vernoem mate van drif word bereken op grond van die kaart afstand. Die gemiddelde en standaardafwyking van alle grade van drif word bereken en, indien die huidige waarde is weg van die gemiddeld meer as s standaardafwykings, is 'n konsep drif opgewek. Die parameters is: w: Venster grootte van elke data stuk. s: Nommer van standaardafwykings te dryf op te spoor. Verwysings Parinaz Sobhani en Hamid Beigy: Nuwe Drift detectiemethode vir Data Streams. Adaptive en Intelligent Systems, 2011: Deel 6943, pp 88-97. URL dx. doi. org/10.1007/978-3-642-23857-412. STEPD STEPD bere die akkuraatheid van die basis leerder in die W mees onlangse gevalle en vergelyk dit met sy algehele akkuraatheid van die begin van die leerproses. Die parameters is: d: betekenispeil vir drif. - m: betekenispeil vir waarskuwing. Verwysings Kyosuke Nishida en Koichiro Yamauchi: Opsporing Konsep Drift met behulp van statistiek toets. Discovery Science 2007: 264-269. URL dx. doi. org/10.1007/978-3-540-75488-627. Kunsmatige data strome Sine Hierdie datastel kan gebruik word om die vier weergawes van Sinus in Gama et al skep. (2004), twee weergawes in Baäna-Garça et al. (2006). Die parameters is gebaseer op die modules wat hierdie datastel gebruik: - i: Saad vir ewekansige generasie van gevalle. f: Klassifikasie funksie gebruik (1 tot 4). Een (1) is die omkeer van twee (2), en drie (3) is die ommekeer van vier (4). s: Verminder die data slegs bevat 2 relevante numeriese eienskappe. Andersins, is twee irrelevant eienskappe geskep. - B: Balanseer die aantal gevalle van elke klas. Verwysings Joo Gama, Pedro Medas, Gladys Castillo en Pedro Pereira Rodrigues. Leer met Drift Detection. In Bazzan, Ana L. C. en Labidi, Sofiane, redakteurs, vooruitgang in Kunsmatige Intelligensie - SBIA 2004, volume 3171 van Lecture Notes in Rekenaarwetenskap, bladsye 286-295. Springer Berlyn / Heidelberg, 2004 ISBN 978-3-540-23237-7. URL dx. doi. org/10.1007/978-3-540-28645-529. Manuel Baäna-Garça, Jos del Campo-Vila, Raul Fidalgo, Albert Bifet, Ricard Gavald en Rafael Morales-Bueno. In: ECML PKDD 2006 Werkswinkel oor Knowledge Discovery uit data strome. 18 Stel 2006. Berlyn, Duitsland. URL eprints. pascal-network. org/archive/00002509/ Gemengde Hierdie datastel kan gebruik word om die weergawes in Gama et al skep. (2004) en Baäna-Garça et al. (2006). Die parameters is gebaseer op die modules wat hierdie datastel gebruik: - i: Saad vir ewekansige generasie van gevalle. f: Klassifikasie funksie gebruik (1 en 2), waar 'n mens (1) is die omkeer van twee (2). - B: Balanseer die aantal gevalle van elke klas. Verwysings Joo Gama, Pedro Medas, Gladys Castillo en Pedro Pereira Rodrigues. Leer met Drift Detection. In Bazzan, Ana L. C. en Labidi, Sofiane, redakteurs, vooruitgang in Kunsmatige Intelligensie - SBIA 2004, volume 3171 van Lecture Notes in Rekenaarwetenskap, bladsye 286-295. Springer Berlyn / Heidelberg, 2004 ISBN 978-3-540-23237-7. URL dx. doi. org/10.1007/978-3-540-28645-529. Manuel Baäna-Garça, Jos del Campo-Vila, Raul Fidalgo, Albert Bifet, Ricard Gavald en Rafael Morales-Bueno. In: ECML PKDD 2006 Werkswinkel oor Knowledge Discovery uit data strome. 18 Stel 2006. Berlyn, Duitsland. URL eprints. pascal-network. org/archive/00002509/ Kontak Kommentaar, voorstelle, uitbreidings, regstellings hoog op prys gestel. paulomgj by gmail dot com


No comments:

Post a Comment