lunedì 31 maggio 2010

CONCETTI STATISTICI DI BASE


Unità statistiche: l'oggetto di osservazione della ricerca, l'entità sulle quali si opera il processo di quantificazione, possono essere persone, oggetti, transazioni, o qualunque entità che rappresenti una fonte di interesse dal punto di vista del trattamento dei dati.
Carattere: il carattere o variabile è il fenomeno oggetto di studio. Le diverse manifestazioni attraverso cui si esprime il fenomeno sono dette "modalità del carattere".
Abbiamo due tipologie distinte di caratteri: i caratteri "qualitativi", che sono discreti, sconnessi e ordinati, e i caratteri "quantitativi", che possono essere discreti o continui ma sempre ordinabili.
Su ogni unità statistica possono essere rilevati diversi caratteri ottenendo in questo modo dei "valori",che sarebbero appunto le modalità del carattere.
Classificazione: procedimento finalizzato all'organizzazione della conoscenza. Consiste nel disporre le entità appartenenti ad un determinato dominio in opportune classi o categorie. Questa operazione si basa sull'individuazione di differenze tra le entità, che possono in questo modo essere classificate in classi distinte.
Matrice dei dati: tabella in cui i dati sono organizzati in righe e colonne. Nelle righe troviamo le unità statistiche, nelle colonne i caratteri. Nelle celle risultanti dall'intersezione di righe e colonne troviamo i "valori", che rappresentano dunque la combinazione di una unità statistica con un particolare carattere.
Funzioni di aggregazione: eseguono un calcolo su un set di valori e restituiscono un valore singolo. Vediamo in che senso. La dimensione di un report si riferisce ad uno spazio K-dimensionale in cui si collocano le unità statistiche, è una forma di visualizzazione geometrica. Nel momento in cui più unità presentano le medesime modalità in più caratteri, sarà possibile aggregarle mediante una funzione che vada a sintetizzarle per poterle poi rappresentare in una semplice matrice di dati.
La funzione di aggregazione è detta "misura", per ricondurre il tutto ad uno schema matriciale, io opero una misurazione di ciascuna modalità, per l’appunto metto in atto una sintesi, una aggregazione.
Nei database, le funzioni di aggregazione più diffuse sono Count, Sum, Avg, Min, Max.
COUNT
Restituisce il numero di righe che soddisfano la condizione specificata nella clausola WHERE.
SUM
Questa funzione somma tutti i valori di una colonna. La funzione SUM opera soltanto con i numeri, se viene applicata a un campo non numerico, si ottiene un messaggio di errore.
AVG (average)
Calcola la media aritmetica dei valori di una colonna, anche questa funzione opera soltanto con i numeri.
MAX
Questa funzione serve a trovare il valore massimo di una colonna. La funzione MAX opera anche con i caratteri.
MIN
Questa funzione opera in modo analogo a MAX, ad eccezione del fatto che restituisce il valore minimo di una colonna. La funzione MIN opera anche con i caratteri, ad esempio, la stringa ‘AA’ è minore della stringa ‘BB’.
Dimensione: gerarchia organizzata di livelli che descrivono i dati della tabella e dei fatti.
Cubo multidimensionale: struttura attraverso la quale i dati sono rappresentati in dimensioni multiple attorno ad un soggetto centrale, i fatti.

Nessun commento:

Posta un commento