Zeta o non zeta? Questo è il problema

Un piccolo ripasso di statistica…

Sono sempre più frequenti i tentativi di costruire degli indicatori sintetici a partire da indicatori elementari. La maggiore difficoltà che si incontra in questa operazione è dovuta al fatto che le unità di misura e le distribuzioni di questi indicatori elementari sono quasi sempre molto differenti.

Anche l’operatore non specializzato intuisce facilmente che se abbiamo, per esempio, due indici come peso e altezza delle persone non possiamo fare una media dei due in quanto i chili (o i grammi), e i metri (o i centimetri) non possono essere tra di loro tranquillamente sommati.

A questo punto interviene spesso lo “statistico” che ricordando, per esempio, le esercitazioni scolastiche di analisi multivariata propone di “normalizzare” i valori sottraendo la loro media e dividendo per la loro deviazione standard, cioè calcolando i cosiddetti punteggi “zeta”.

Facciamo un esempio qui riprodotto in tabella: dieci aree per le quali si disponga di due indicatori, entrambi con media 50 ma il primo con range da 5 a 95 e il secondo da 49,55 a 50,45; entrambi gli indicatori sono distribuiti linearmente e hanno una correlazione completa inversa.

Aree	Indicatore uno	Indicatore due	Zeta		Somma indicatori	Media indicatori	Somma zeta
			indicatore uno	indicatore due
1	55	49,95	0,16514456	-0,1651446	104,95	52,475	0,00
2	35	50,15	-0,4954337	0,4954337	85,15	42,575	0,00
3	75	49,75	0,82572282	-0,8257228	124,75	62,375	0,00
4	15	50,35	-1,156012	1,156012	65,35	32,675	0,00
5	65	49,85	0,49543369	-0,4954337	114,85	57,425	0,00
6	25	50,25	-0,8257228	0,8257228	75,25	37,625	0,00
7	95	49,55	1,48630108	-1,4863011	144,55	72,275	0,00
8	85	49,65	1,15601195	-1,156012	134,65	67,325	0,00
9	5	50,45	-1,4863011	1,4863011	55,45	27,725	0,00
10	45	50,05	-0,1651446	0,1651446	95,05	47,525	0,00
media	50	50	0	0
dev. st.	30,2765	0,302765	1	1

Se ipotizziamo che gli indicatori abbiano la stessa unità di misura, per esempio siano delle percentuali, e lo stesso “valore” (non dal punto di vista numerico, ma dal punto di vista del suo significato, o della sua rilevanza nella composizione dei due), allora l’indice globale più appropriato è sicuramente la somma (o la media) dei due indicatori. In tal caso è evidente la differenza tra l’area 7, che ha un valore della somma di 144,55 (media di 72,275) e l’area 9, con un valore di 55,45 (media di 27,725)!

Se invece calcoliamo i punteggi zeta la somma diventa per tutti pari a zero (e così anche la media): la media di ognuno dei due indicatori è 50, la deviazione standard del primo è cento volte la deviazione standard del secondo e i punteggi zeta di ogni area hanno gli stessi valori (per ciascuno dei due indicatori) ma di segno differente.

L’abitudine che ci porta spesso a calcolare dei punteggi zeta non ci fa però riflettere, spesso, sulle assunzioni che ne sottendono il calcolo: c’è qualcosa che si sarebbe dato per implicito in questa operazione? Purtroppo la risposta è affermativa, ed è che il “valore” dello scostamento dalla media che il punteggio zeta calcola è proporzionale alla variabilità della distribuzione. Questo assunto è del tutto appropriato se l’obiettivo è spiegare la variabilità degli indicatori, ma è del tutto ingannevole se invece si vuole trovare il “valore” medio dei “valori” degli indicatori.

L’obiettivo finale della trasformazione è pertanto molto rilevante: un conto è calcolare la media dei valori e un altro è controllarne la variabilità (per esempio). È allora essenziale ragionare sulla necessità di trasformare tutti gli indicatori con una funzione simile di valore: in economia questa funzione può essere espressa con la moneta e rappresentare un costo o un prezzo/valore; oppure la funzione può essere una funzione di utilità, una funzione genericamente di “valore” dove per valore si intende l’importanza che un soggetto assegna a una misura. Spesso è difficile determinare questa funzione, ma certamente essa molto raramente coincide con la trasformazione zeta.

Ci sono ovviamente altri problemi nella composizione di diversi indicatori:

“il verso” del valore: valgono di più i valori inferiori o quelli superiori?
la “monotonia” della distribuzione: il valore cresce sempre o decresce sempre al crescere dell’indicatore? In alcuni casi il valore maggiore è centrale e questo decresce allontanandosi sia in un senso che nell’altro
il “peso” dell’indicatore nella operazione di composizione: può essere che a un indicatore sia opportuno assegnare un ruolo più rilevante e ad altri un ruolo inferiore nella operazione (per esempio) di somma o di media.

Questi sono alcuni dei principali problemi che si devono affrontare se si vuole passare da un insieme di indicatori elementari a un indicatore sintetico con lo scopo di sommare, o mediare, il loro valore, e non invece di analizzarne la variabilità. Per questo motivo lo statistico dovrà stare molto accorto nel non proporre di calcolare i punteggi zeta in qualsiasi situazione quasi che questa fosse una ricetta magica non curandosi che così, spesso, si perviene a risultati del tutto distorti, se non addirittura del tutto menzogneri.

…prima di leggere un documento del Ministero

Perché ci siamo permessi questa, certamente pedante e anche un po’ noiosa, digressione sul calcolo dei punteggi zeta? Non certo per ricordare a tutti i lettori della Rivista alcune nozioni elementari di statistica, ma perché siamo rimasti meravigliati che nella redazione di un recente documento¹ messo a disposizione dal Ministero della salute non si sia tenuto conto delle considerazioni che abbiamo appena esposto.

Il documento, che ha fatto molta notizia non solo tra gli addetti ai lavori ma anche sulla stampa quotidiana, è relativo alla metodologia adottata per la identificazione delle Regioni di riferimento da utilizzare nella applicazione dei costi standard in sanità. Se in quel documento si fossero applicate le considerazioni che abbiamo qui esposto sarebbe emersa la stessa classifica? Lasciamo ai lettori immaginare la risposta…

Referenze

^{1.«NOTA METODOLOGICA APPLICATIVA DELLA DELIBERA RECANTE DISPOSIZIONI IN MATERIA DI “DEFINIZIONE DEI CRITERI DI QUALITÀ DEI SERVIZI EROGATI, APPROPRIATEZZA ED EFFICIENZA, PER LA SCELTA DELLE REGIONI DI RIFERIMENTO AI FINI DELLA DETERMINAZIONE DEI COSTI E DEI FABBISOGNI STANDARD NEL SETTORE SANITARIO, IN ATTUAZIONE DELL'ARTICOLO 27, COMMA 5, DEL DECRETO LEGISLATIVO 6 MAGGIO 2011, N. 68” APPROVATA NELLA SEDUTA DEL CONSIGLIO DEI MINISTRI DELL’11 DICEMBRE 2012 E REGISTRATA ALLA CORTE DEI CONTI IN DATA 21.03.2013 (REG.N.3 FOGLIO N.15)» del 21 giugno 2013 redatta dall’Ufficio IV del Dipartimento della Programmazione e dell’ordinamento del Servizio Sanitario Nazionale - Direzione Generale della Programmazione Sanitaria del Ministero della Salute}

Approfondisci su epiprev.it Vai all'articolo su epiprev.it Versione Google AMP