Moving Media Senza Trabocco


Ho essenzialmente una tabella di numeri - una serie temporale di misure. Ogni riga della tabella ha 5 valori per le 5 diverse categorie, e una fila somma per il totale di tutte le categorie. Se prendo la media di ogni colonna e riassumere le medie insieme, dovrebbe essere uguale alla media delle righe somme (ignorando errore di arrotondamento, naturalmente) (Ive ha ottenuto un caso in cui i due valori continuano a venire fuori diverso da circa 30 e Im chiedendo . quanto pazzo sono io) Aggiornamento: vedi sotto - sono stato (leggermente) pazzo e aveva un errore nel mio codice. Sigh trovato il mio problema - è stato un errore stupido vittima nel mio codice. Ero alla ricerca di un errore nella media della logica somme, ma era nella somma della logica medie - fa riferimento la variabile sbagliata. Be ', comunque, weve ha dimostrato circa 5 modi da Domenica che la somma delle medie è in realtà pari alla media delle somme, nel caso in cui questo è importante per chiunque in futuro. rispose 6 Febbraio 12 alle 17:19 Forse questo dovrebbe andare come un aggiornamento alla domanda In entrambi i casi è bene comunque. Anche essere sicuri di accettare una risposta ora che il problema è stato risolto. ndash Zev Chonoles 7 febbraio 12 a 2:15 In genere non è corretto, è solo lo stesso in casi specifici. Sum (x) Sum (y) non è uguale a Sum (xy) n dove n è il numero totale di voci x è voci di riga e di colonna y è voci. unico vero se tutti i ys sono uguali ad esempio: (12 35) 2 1120 (13) (25) 47 Dove, come se y è uguale (17 47) 2 514 (14) (77) 514 PS Mi dispiace per la pubblicazione sul filo morti voglio solo che sia giusto per chiunque altro cercando. In realtà Steve potrebbe essere corretta. Ill fare un esempio semplice e quindi spiegare perché le persone intelligenti possono venire con risposte diverse, perché in un certo senso, theyre sia a destra. Prima fila: 5 6 Seconda fila: 1 2 Terza fila: 3 4 Se si esegue una somma delle medie o medio delle somme come chiesto Daniel, poi youll ottenere 7 come la risposta. Se, tuttavia, si rimuove il 1 lasciando un buco nella tabella, allora la vostra media delle somme scende a 6 23 e la vostra somma delle medie aumenta a 8. Se la tabella dei dati ha spazi vuoti o mancanti punti di dati, quindi i due sono quasi mai la stessa. Se la tabella dei dati viene equallyevenly distribuito senza punti mancanti o fori nella tabella, allora dovrebbero essere sempre la stessa. Chiunque può testare il tutto con la funzione RAND () MS Excel e. Generare una tabella con un numero qualsiasi di rowscolumns e compilare le righe e le colonne con numeri casuali o lasciarlo generare numeri casuali per voi. Quindi utilizzare MEDIA () per la media dei colonne e SUM () per sommare le medie. Poi invertire il processo e utilizzare SUM () per aggiungere le righe e MEDIA () per la media delle somme. Se la tabella è completata, i due numeri saranno esattamente lo stesso. Se, tuttavia, i dati per qualsiasi motivo manca voci, allora può variare da una grande percentuale. Basta avviare l'eliminazione di punti dati al centro del tavolo e guardare i due risultati notevolmente fluttuare. Anche di nota è se lanciate le righe e le colonne, allora si ottengono risultati completamente diversi, in modo da assicurarsi sei coerente. Se si calcola la media le righe nell'esempio di cui sopra e la somma delle medie, o sommare le colonne e medi le somme, quindi si ottiene 10.5 con una tabella completa e 11 e 10, rispettivamente, con il 1 mancante. rispose 6 agosto 12 alla 21:40 Si noti che OP ha scritto in uno dei commenti che non ci sono spazi vuoti nella tabella. Si noti inoltre che se Steve39s risposta viene eliminato allora nessuno saprà cosa significa che il primo periodo. ndash Gerry Myerson 7 agosto 12 alle 01:04 matematica misto è corretta. prendere 3 colonne 10 10s, 5 1s e 2,3,5,6,6,7,9,10 (8 valori da rand), dont gli spazi media. avg di avgs è 5.67 media di tutti i valori è 6.65. matematica misto è ok per rispondere a un vecchio thread. Questa roba, verità o truthy, vive per sempre sulla Internetis c'è un modo per calcolare la data media, ma solo ignorando l'anno Mi spiego. Ho queste date: Se uso MEDIA (F2: F39). il risultato sarà 12152008. Quello non è quello che mi serve. Quello che mi piacerebbe davvero è quello di determinare il giorno medio e Mese. Ci sono un paio dicembre risale lì che ho potuto probabilmente elimino, perché sono lontano, ma con il resto delle date, immagino che la media sarebbe da qualche parte intorno, diciamo 12 luglio (a prescindere dell'anno), per esempio . Spero che questo ha un senso. se sono necessari ulteriori dettagli, per favore fatemelo sapere. Grazie chiesto 6 maggio 15 alla 14:42 I39ve cancellato subito ma era simile a Jan Doggen39s risposta, ho usato DATA (2001, MESE (A1), GIORNO (A1)) quindi creato un elenco di date nel 2001. Si può bisogno o formattare le celle per farli visualizzare come date - tra cui la media (o GEOMEAN) risultato che si calcola. ndash Lefty 6 maggio 15 a 15: 21Tawani - non sono tutti manca il punto. Quello che dici deve essere definito utilizzando termini generici. Non si può andare con un solo esempio. Senza definizioni generali, se 400 è il 30 è ancora un outlier E se è 14 E 9 Dove ci si ferma, è necessario stddev39s, intervalli, quartili, per farlo. ndash Daniel Daranas 2 febbraio 09 alle 17:05 In taglio si don39t rimuovere i valori anomali basta don39t li includono nel calcolo. quotRemovequot potrebbe suggerire che i punti non sono più nel set di dati sono. E voi don39t rimuovere (o ignorare) perché sono valori anomali Il criterio è (di solito) solo che sono in alcune frazioni di estrema dei dati. Un valore non compreso in un rifilato significa spesso è solo leggermente più (o meno) rispetto al valore più alto (più basso) incluso. ndash Nick Cox 3 dicembre 14 a 16:48 non so se ha un nome, ma si potrebbe facilmente venire con una serie di algoritmi di rifiutare i valori anomali: Trova tutti i numeri tra il 10 ° e il 90 ° percentile (fare questo di classificare poi respingendo il primo e l'ultimo numero N10 N10) e assumono il valore medio dei valori rimanenti. valori di ordinamento, rifiutano valori alti e bassi purché così facendo, il cambio di deviazione meanstandard più valori X. Sort, rifiutare valori alti e bassi purché così facendo, i valori in questione sono più di K deviazioni standard dalla significare. Il modo più comune di avere un robusto (la solita parola che significa resistente a dati non validi) media è quello di utilizzare la mediana. Questo è solo il valore centrale nella lista ordinata (di metà strada tra i due valori medi), quindi per il tuo esempio sarebbe 90,5 a metà strada tra il 90 e il 91. Se si vuole ottenere davvero nelle statistiche robuste (come ad esempio le stime robuste di deviazione standard, ecc) mi sento di raccomandare un perso del codice a il gruppo agorà, ma questo può essere troppo avanzata per i vostri scopi. risposto 13 febbraio 09 a 09:22 Se hai a disposizione solo una variabile (come implicate) Credo che alcuni degli intervistati di cui sopra sono di essere sopra critica del vostro approccio. Certamente altri metodi che guardano le cose come leva sono più statisticamente valida, tuttavia, che implica che si sta facendo la modellazione di qualche tipo. Se vi è solo per esempio punteggi di un test o di età dei cittadini anziani (casi plausibili del tuo esempio) penso che sia pratico e ragionevole essere sospettoso del valore anomalo si mettono in su. Si poteva guardare la media complessiva e la media troncata e vedere quanto cambia, ma che sarà una funzione della vostra dimensione del campione e la deviazione dalla media per i vostri valori anomali. Con valori anomali eclatanti come quello, si sarebbe certamente vuole prendere in considerazione te processo di generazione dei dati per capire il motivo per cui questo è il caso. Si tratta di una immissione di dati o colpo di fortuna amministrativi Se è così ed è probabile estraneo a valore effettivo vero (cioè non osservata) mi sembra perfettamente bene da tagliare. Se si tratta di un valore vero, per quanto si può dire che si potrebbe non essere in grado di rimuovere se non si è esplicito nella sua analisi su di esso. ha risposto 3 dicembre 14 a 13:58 Il mio statistiche da manuale si riferisce a questo come una media del campione al contrario di una media della popolazione. Esempio implica c'era una restrizione applicata al completo set di dati, anche se nessuna modifica (rimozione) per il set di dati è stata fatta. risposto 26 16 Mar alle 03:13 0. Benvenuti nel sito. 1. Quale libro Si prega di dare un riferimento. 2. quotSample meanquot in genere non si riferiscono a una media ottenuta dopo la rimozione di valori anomali. ndash Juho Kokkala 26 marzo 16 al 08:06 Può essere la mediana. Non sempre, ma a volte. Non ho idea di quello che viene chiamato in altre occasioni. Spero che questo ha aiutato. (Almeno un po '.)

Comments