Professional Documents
Culture Documents
SOMMARIO
OBIETTIVI DEL CORSO - AREA METODOLOGICA ......................................................................... 2 1. MISURE DI OCCORRENZA E DI ASSOCIAZIONE..................................................................... 3 1.1. 1.2. 1.3. 1.4. 1.5. 1.6. DUE DEFINIZIONI FONDAMENTALI: PREVALENZA E INCIDENZA ............................. 3 IL PRIMO PASSO: IL CONTEGGIO DEI CASI ...................................................................... 3 LE PROPORZIONI .................................................................................................................... 4 Lincidenza cumulativa...................................................................................................... 4 I TASSI ....................................................................................................................................... 5 GLI ODDS .................................................................................................................................. 7 LE MISURE DI ASSOCIAZIONE ............................................................................................ 7 Le misure assolute di associazione .................................................................................... 8 Le misure relative di associazione..................................................................................... 9 Odds ratio e rischio relativo ............................................................................................ 10 Rischi relativi per esposizioni su pi livelli .................................................................... 11 Rischi relativi: i confronti possibili nel Programma Nazionale Esiti .............................. 12 Rischi relativi: outcome positivo o negativo? .......................................................... 13
1.3.1.
LA VALIDITA DELLO STUDIO ................................................................................................... 14 GLI ERRORI SISTEMATICI IN EPIDEMIOLOGIA ............................................................. 14 IL CONFONDIMENTO ........................................................................................................... 15 IL CONTROLLO DEL CONFONDIMENTO ......................................................................... 17 La misura della gravit .................................................................................................... 18 Luso della misura di gravit: la standardizzazione diretta ............................................. 19 La standardizzazione indiretta ......................................................................................... 21 Risk adjustment versus propensity adjustment ............................................................... 21 La modificazione di effetto ............................................................................................. 22
VERIFICA DI IPOTESI E INTERVALLI DI CONFIDENZA ....................................................... 24 LERRORE CASUALE ............................................................................................................ 24 LA LOGICA DEI TEST STATISTICI ...................................................................................... 24 GLI INTERVALLI DI CONFIDENZA .................................................................................... 28 Ampiezza dellintervallo e test statistici ......................................................................... 29
3.3.1.
1.3. LE PROPORZIONI
La proporzione un rapporto in cui il numeratore costituisce un sottoinsieme del denominatore. Varia tra zero e uno ed adimensionale, ovvero, priva di unit di misura. Infatti, le proporzioni sono puri numeri poich non vengono espresse in metri, anni o altre unit di misura. Le proporzioni possono essere utilizzate per misurare sia la prevalenza sia lincidenza. Ipotizziamo che tra i 726 pazienti ricoverati per infarto miocardico acuto nellospedale Careggi, al momento dallammissione ospedaliera, 124 erano affetti da diabete. Il rapporto 124/726, che restituisce un valore percentuale pari a 17,1%, esprime la prevalenza di diabete nella coorte di infartuati del Careggi, calcolata alla data dellammissione ospedaliera. Il calcolo di queste prevalenze riveste un ruolo fondamentale nelle valutazioni comparative di esito, perch ci permette di caratterizzare i pazienti ricoverati nei diversi ospedali oggetto di analisi, in funzione di tutte le caratteristiche demografiche e cliniche presenti nei sistemi informativi sanitari.
periodo di osservazione
Struttura ospedaliera
Numero di deceduti
Rischio
10 47
10/75 47/726
13,33% 6,47%
Si noti come, per un corretto calcolo e una corretta interpretazione di questa misura necessario che tutti i soggetti siano stati osservati per un identico periodo di tempo (follow-up) e che questo sia chiaramente esplicitato nella presentazione dei rischi. Nellesempio, lospedale Andrea Costa di Porretta, quindi, pur avendo un minor numero di decessi, ha un rischio di morte pi elevato rispetto allospedale Careggi di Firenze.
1.4. I TASSI
Laltra misura di occorrenza che consente di esprimere il conteggio dei casi in relazione alla dimensione della popolazione il tasso, che consente di sintetizzare in ununica grandezza sia la frequenza di una malattia (quanti pazienti sviluppano la malattia) sia la sua velocit (quando i pazienti sviluppano la malattia). Al contrario della proporzione, che pu essere utilizzata per misurare sia lincidenza sia la prevalenza, il tasso pu essere utilizzato soltanto per misurare lincidenza. Noto anche come densit di incidenza, il tasso viene calcolato rapportando il numero di nuovi casi di malattia sviluppati durante il periodo di osservazione, al totale degli anni-persona. Pu variare tra 0 e infinito e, al contrario del rischio, ha unit di misura: il (tempo)-1. A questo punto necessario approfondire il concetto di anni-persona. Per ciascun individuo, gli anni persona quantificano il periodo di esposizione al rischio, che inizia con lingresso del paziente nello studio (la data di un ricovero, di un intervento chirurgico o di una diagnosi) e pu terminare:nel momento in cui si verifica lesito di interesse (in questo esempio, ipotizziamo che si tratti del decesso per tutte le cause); nel momento in cui termina lo studio (in questo esempio, ipotizziamo che la durata dello studio sia di quattro anni);
5
nel momento in cui il paziente sia perso al follow-up (soggetti per i quali, da un certo momento in poi, non pi possibile ottenere le informazioni necessarie per lo svolgimento dello studio, per esempio i pazienti che emigrano verso zone non coperte dai sistemi informativi disponibili).
In figura 1 viene schematizzato il follow-up di uno studio di coorte cui partecipano tre pazienti. Il paziente numero 1 conclude lo studio senza aver manifestato lesito di interesse (quindi, dopo 4 anni di osservazione); gli altri due pazienti manifestano lesito in tempi differenti, il paziente numero 2 presenta lesito dopo 2 anni mentre il paziente numero 3 presenta lesito dopo 1 anno.
Il tasso viene calcolato dividendo la somma degli esiti per la somma degli anni-persona, ovvero: 2/(4+2+1) = 0,29 esiti per anno-persona. Eseguendo lo stesso calcolo per lo studio schematizzato in figura 2, si ottiene un tasso pari a: 2/(4+3+3) = 0,20 esiti per anno-persona.
In entrambi gli studi, un paziente su tre manifesta lesito di interesse (rischio) tuttavia, i pazienti schematizzati in figura 2 hanno una maggiore sopravvivenza, che si traduce in un tasso di mortalit pi basso. Adesso risulta pi chiaro il motivo per cui lunit di misura del tasso il (tempo)-1. Semplicemente perch il tempo (che nellesempio espresso in anni-persona) appare al denominatore della misura di occorrenza. Si noti, infine, come il rischio sia totalmente insensibile alla sopravvivenza dei pazienti deceduti: sia nello studio schematizzato in figura 1 sia in quello schematizzato in figura 2, il rischio assume valore 2/3 = 0,67.
Tuttavia, non sempre la popolazione in studio viene classificata in due gruppi, gli esposti e i non esposti. Infatti, lesposizione pu essere a livelli multipli, come la stadiazione di una patologia, la struttura ospedaliera in cui avvenuto un ricovero o larea geografica di residenza. Le misure di associazione possono essere classificate in due tipi: misure assolute e misure relative. Entrambe confrontano loccorrenza di malattia tra esposti e non esposti, ci che le differenzia la modalit con cui viene effettuato il confronto.
Il rischio negli esposti : 28/4.000 = 0,007 = 7 per 1.000 lavoratori. Il rischio nei non esposti : 64/16.000 = 0,004 = 4 per 1.000 lavoratori. La differenza tra i rischi : 7 per 1.000 - 4 per 1.000 = 3 per 1.000 lavoratori. Pertanto, negli esposti, ogni 1.000 lavoratori, 3 decessi per cancro sono attribuibili allesposizione e avrebbero potuto essere evitati fornendo adeguate protezioni ai dipendenti.
10 47
10/75 47/726
13,33% 6,47%
Per ottenere una misura relativa di effetto sufficiente calcolare il rapporto tra i due rischi: 13,33%/6,47% = 2,06. In questo caso, il rischio dellAzienda O-U Careggi (6,47%) si trova al denominatore del rapporto, pertanto lAzienda O-U Careggi viene assunta come categoria di riferimento (reference category). Il rischio relativo (risk ratio), generalmente abbreviato in RR, dunque pari a 2,06. Si noti come, trattandosi di un rapporto, il rischio relativo un numero puro poich non ha unit di misura. Il calcolo del rischio relativo in questo caso ci dice che lOspedale Andrea Costa ha un rischio di morte a 30 giorni dal ricovero in caso di infarto miocardico pi che doppio rispetto allAzienda O-U Careggi. In altre parole, lOspedale Andrea Costa di Porretta ha un rischio del 106% superiore rispetto a quello dellAzienda O-U Careggi. In questo caso, lincremento percentuale viene calcolato come segue: (RR 1,00) x 100 = (2,06-1,00) x 100 = 106%. Va ricordato che in tutte le misure relative di associazione, il valore 1,00 rappresenta luguaglianza tra le misure di occorrenza negli esposti e nei non esposti, quindi, lindipendenza tra lesposizione e la malattia.
9
per il Careggi, odds = 0,0647/(10,0647) = 0,07. Adesso sar sufficiente calcolare il rapporto tra i due odds: 0,15/0,07 = 2,14. Come si vede in questo caso, lodds ratio (2,14) costituisce una buona approssimazione del rischio relativo (2,06). Questo si verifica quando lesito in studio un evento raro, che pu essere definito come un evento il cui rischio inferiore al 10%, anche se alcuni autori utilizzano la soglia del 5%. Nellesempio proposto, il rischio complessivo, per linsieme delle due strutture, pari a (10+47)/(726+75) = 0,07 = 7%. Siamo, pertanto, in una situazione limite, anche perch una delle due strutture, lAndrea Costa di Porretta, ha un rischio superiore al 10%. Quando levento non raro, gli odds ratio vanno interpretati alla luce del fatto che sono sempre pi estremi del rischio relativo, ovvero sempre pi lontani dal valore 1,00. Nel grafico di pagina seguente, viene riportata la variazione di un odds ratio allaumentare della frequenza dellesito, in un esempio in cui il rischio relativo pari a 2,00. Come si vede, allaumentare della frequenza dellesito lodds ratio si discosta molto dal rischio relativo.
10
Ospedale di Civitanova Marche Azienda Ospedaliera di Reggio-Emilia Ospedale Andrea Costa di Porretta Azienda O-U Careggi di Firenze
8 57 10 47
In tabella 4, sono stati riportati i rischi relativi per ciascun ospedale. LAzienda O -U Careggi, essendo stata assunta come categoria di riferimento, ha un valore pari a 1,00, a indicare che tutte le altre strutture presenti nella tabella saranno confrontate con questo ospedale. Osservando i rischi relativi riportati nellultima colonna, si nota come questi abbiano diverse direzioni e diverse intensit.
11
LAzienda Ospedaliera di Reggio-Emilia e lOspedale di Porretta hanno la stessa direzione ma diverse intensit. La direzione la stessa perch entrambi i rischi relativi sono maggiori di 1, a indicare una maggiore mortalit dei due ospedali rispetto alla categoria di riferimento, lAzienda OU Careggi. Tuttavia le intensit sono diverse: mentre lOspedale di Porretta presenta un rischio del 106% maggiore rispetto al lAzienda O-U Careggi, lAzienda Ospedaliera di Reggio-Emilia ha un rischio del 53% maggiore rispetto allAzienda O-U Careggi. Lintensit , pertanto, minore. LOspedale di Civitanova Marche si differenzia invece dagli altri perch ha una direzione diversa. Infatti, il suo rischio relativo inferiore allunit, a indicare un rischio minore rispetto allAzienda O-U Careggi, il 10% in meno, in questo caso. E necessario prestare attenzione quando si ottengono rischi relativi inferiori allunit. Infatti, il rischio relativo pu variare da 0 a infinito. Pertanto, i fattori protettivi avranno rischi relativi compresi nel ristretto intervallo tra 0,00 e 1,00, mentre i fattori di rischio avranno rischi relativi compresi nel pi ampio intervallo tra 1,00 e infinito. Da questo deriva che i rischi relativi maggiori di 1,00 non sono direttamente confrontabili con quelli minori di 1,00, perch la scala diversa. Per esempio, un rischio relativo di 2,00 (raddoppio la probabilit di un evento) e un rischio relativo di 0,50 (dimezzo la probabilit di un evento), che chiaramente presentano direzioni opposte, hanno la stessa intensit. Eppure, nel primo caso gli esposti hanno un rischio del 100% in pi rispetto ai non esposti mentre nel secondo caso gli esposti hanno un rischio del 50% in meno rispetto ai non esposti. La scala , dunque diversa, ma lintensit la stessa. Infatti, generalizzando , dire che A il doppio di B (RR = 2,00) contiene la medesima informazione che dire: B la met di A (RR = 0,50).
Pur avendo direzioni opposte, entrambi i rischi relativi evidenziano una situazione favorevole per lOspedale di Civitanova Marche. Infatti, la mortalit a 30 giorni dallinfarto del 44% inferiore rispetto alla media nazionale mentre la probabilit di ricevere un intervento chirurgico entro le 48 ore del 59% superiore rispetto alla media nazionale.
Prima di procedere con gli altri argomenti del corso, opportuno puntualizzare che i rischi e i rischi relativi che abbiamo presentato in questo capitolo possono essere definiti grezzi, poich su queste misure non sono state applicate le tecniche per il controllo del confondimento che verranno descritte nei capitoli successivi.
13
E possibile classificare gli errori sistematici in tre grandi tipologie: bias di selezione, bias di informazione e bias di confondimento. In questo manuale, le prime due tipologie saranno presentate con pochi approfondimenti metodologici, limitandone la trattazione ad alcune definizioni basilari. Ampio spazio sar invece dedicato al concetto di confondimento, fondamentale per linterpretazione dei dati del Programma Nazionale Esiti. Il bias di selezione legato allarruolamento dei soggetti in studio, nel caso in cui questi non vengano selezionati in modo casuale. Pensiamo alle valutazioni comparative di esito e pensiamo, per esempio, allindicatore mortalit a 30 giorni da un ricovero per infarto miocardico acuto.
14
Potremmo trovarci di fronte a un bias di selezione se alcune delle strutture valutate avessero codificato come infarto anche casi nei quali non erano pienamente soddisfatti tutti i criteri per porre questa diagnosi, selezionando, come conseguenza, soggetti con una diversa condizione clinica, pi grave o meno grave rispetto a quella indicata dal protocollo dello studio. In queste strutture, i risultati ottenuti non potranno essere considerati come rappresentativi di una popolazione di pazienti con infarto del miocardio e i confronti con gli altri ospedali saranno necessariamente falsati dal diverso criterio di selezione utilizzato. Il bias di informazione invece legato a una errata attribuzione dellesposizione o dellesito e consiste nella classificazione dei pazienti o dei ricoveri in un gruppo (esposti rispetto a non esposti, con esito rispetto a senza esito) diverso da quello al quale dovrebbero essere assegnati, generando cos una errata classificazione (misclassificazione). E opportuno sottolineare che le esposizioni di maggiore interesse, nel Programma Nazionale Esiti, sono costituite dalla struttura ospedaliera o dallarea di residenza. Un caso di misclassificazione dellesposizione potrebbe avvenire nelle valutazioni comparative della mortalit a trenta giorni da unangioplastica coronarica. Nei casi in cui la procedura venga eseguita in service, lintervento (con il relativo esito) potrebbe essere erroneamente attribuito alla struttura di ricovero e non alla struttura in cui stata effettivamente eseguita langioplastica (esterna per esempio allospedale valutato). Infatti, utilizzando le informazioni del Sistema Informativo Ospedaliero non possibile tracciare il percorso del paziente nei casi in cui una procedura segua questo particolare iter organizzativo. Per una pi ampia presentazione e discussione degli errori sistematici in epidemiologia, si rimanda a: Rothman K, Greenland S. Modern Epidemiology. 2nd ed. Philadelphia: Lippincott Williams & Wilkins; 1998: 93-114.
2.2. IL CONFONDIMENTO
Nel capitolo precedente abbiamo introdotto una misura di effetto, il rischio relativo, che ci permette di capire se una determinata struttura ospedaliera o area di residenza abbia esiti pi favorevoli o meno favorevoli rispetto a una categoria di riferimento, che pu essere la media nazionale, un benchmark o unaltra struttura ospedaliera. Ipotizziamo di avere analizzato la mortalit a 30 giorni dal ricovero per infarto miocardico acuto in una determinata struttura ospedaliera, lOspedale A, e di avere ottenuto un rischio relativo rispetto alla media nazionale pari a 1,55. Pertanto, lOspedale A presenta una mortalit del 55% superiore rispetto alla media nazionale. A che cosa pu essere attribuibile questo risultato sfavorevole? Questo eccesso di rischio esprime realmente una peggiore qualit dellassistenza rispetto alla media nazionale? Per una valutazione pi completa, si decide di confrontare le caratteristiche demografiche e cliniche dei pazienti ricoverati nellOspedale A con quelle del totale dei pazienti ricoverati per infarto in Italia. In tabella 5 sono riportate alcune delle caratteristiche di cui possibile disporre attraverso il Sistema Informativo Ospedaliero.
15
Tabella 5. Mortalit a 30 giorni dal ricovero per infarto miocardico acuto: confronto tra le caratteristiche demografiche e cliniche
Ospedale A Rischio grezzo (%) Et in anni (media) Diabete (%) Pregresse malattie cerebrovascolari (%) 15,93% 75 25 20
Italia 10,28% 68 14 8
Come si vede dalla tabella, i pazienti trattati nellOspedale A hanno una situazione clinica pi sfavorevole rispetto alla media nazionale. Sono pi anziani, hanno una maggiore prevalenza di diabete e una maggiore proporzione di soggetti con pregresse malattie cerebrovascolari. Questo rende pi difficile il confronto tra i due gruppi perch non possibile distinguere leffetto dellOspedale dalleffetto della diversa distribuzione delle patologie. Perch dunque lOspedale A ha una mortalit maggiore rispetto alla media nazionale? Si tratta realmente di un problema legato alla qualit dellassistenza o dipende soltanto dalla maggiore complessit clinica dei suoi pazienti? Questa confusione di effetti prende il nome di confondimento, un errore sistematico (in epidemiologia si utilizzano i sinonimi: distorsione o bias) che impedisce di determinare correttamente leffetto dellesposizione sullesito. Diamo a questo punto una definizione pi formale di fattore confondente. Un fattore pu essere definito confondente se: causalmente associato con lesito; in altre parole, il fattore confondente deve essere associato allesito in studio come causa e non come effetto. Nellesempio appena proposto, in base alle conoscenze a priori, let avanzata, il diabete e le pregresse malattie cerebrovascolari sono causalmente associati con la mortalit da ricovero per infarto. Queste caratteristiche vengono spesso definite fattori di rischio, poich, se presenti, aumentano la probabilit che si verifichi lesito in studio; associato con lesposizione; ci vuol dire che le distribuzioni dei fattori confondenti devono essere diverse tra esposti e non esposti. Nellesempio, la distribuzione dellet (sintetizzata dal suo valore medio), del diabete e delle pregresse malattie cerebrovascolari sono sostanzialmente diverse tra esposti (i pazienti trattati nellospedale A) e non esposti (il totale dei pazienti ricoverati per infarto in Italia); non deve costituire un passaggio intermedio nel percorso causale tra lesposizione e la malattia; ci significa che il fattore confondente non deve essere un effetto dellesposizione. Cerchiamo di chiarire meglio: se lesposizione in studio fosse costituita dalluso di un farmaco antipertensivo e lesito fosse la mortalit per infarto, la pressione arteriosa rilevata dopo linizio del trattamento non pu essere considerata un fattore confondente. Infatti, questo valore pressorio sarebbe un effetto dellesposizione, attraverso il quale il farmaco riduce, nel lungo periodo, la mortalit per infarto.
16
Torniamo alla tabella 5: Ospedale A Rischio grezzo (%) Et in anni (media) Diabete (%) Pregresse malattie cerebrovascolari (%) 15,93% 75 25 20 Italia 10,28% 68 14 8
Et, diabete e pregressi eventi cerebrovascolari sono fattori di rischio per la mortalit (e soddisfano quindi lassociazione causale con lesito), sono associati allesposizione e non possono certamente essere un effetto dellassistenza ospedaliera (non sono quindi un passaggio intermedio nel percorso tra esposizione e malattia). Sono, pertanto, fattori confondenti. Il rischio relativo grezzo di 1,55 quindi sovrastimato dal confondimento, perch parte delleccesso di rischio osservato nellOspedale A spiegato dalla maggiore complessit clinica dei suoi pazienti. Questo rende necessario lutilizzo di metodi statistici per il controllo del confondimento.
17
Tabella 6. Modello predittivo. Infarto miocardico acuto: mortalit a 30 giorni dal ricovero. Predittore Et in anni Genere (donne vs uomini) Tumori maligni Diabete Malattie ematologiche Cardiomiopatie Scompenso cardiaco Malattie cerebrovascolari Pregresso by-pass aorto-coronarico Pregressa angioplastica coronarica Numero 32.319 5.547 9.774 3.999 1.121 6.896 5.663 5.078 11.837 Odds ratio grezzo 1,09 1,85 2,17 1,68 2,69 2,13 2,66 2,55 0,47 0,39 Odds ratio aggiustato 1,08 1,02 1,69 1,21 1,33 1,44 1,36 1,55 0,58 0,44
Proviamo a interpretare qualche odds ratio cos ottenuto. Per ogni aumento di un anno di et, il rischio di morire a 30 giorni dal ricovero per infarto aumenta dell8% (odds ratio = 1,08). Al contrario, le differenze di genere sono trascurabili perch lodds ratio prossimo al valore di 1,00 (odds ratio = 1,02) valore che, come descritto nel primo capitolo, esprime lindipendenza tra lesposizione (in questo caso il genere del paziente) e lesito in studio (in questo caso il decesso a 30 giorni). I tumori maligni costituiscono invece un fattore di rischio: la loro presenza aumenta del 69% la mortalit a 30 giorni (odds ratio = 1,69). Anche il diabete, le malattie ematologiche, le cardiomiopatie e lo scompenso cardiaco sono fattori di rischio. Infatti, tutte queste patologie concomitanti presentano un odds ratio maggiore di 1. Il pregresso by-pass aorto-coronarico invece un fattore protettivo, essendo associato a una riduzione relativa del rischio pari al 42%, ottenuto come (1-0,58) x 100. Valutazioni analoghe valgono per la pregressa angioplastica coronarica.
distribuzione dei fattori di rischio di una popolazione di riferimento come base per tutti i confronti. Per ciascuno degli indicatori valutati, la popolazione di riferimento costituita dallinsieme di tutti i ricoveri osservati a livello nazionale. Attraverso i parametri stimati dai modelli statistici, per ciascuna struttura e area di residenza vengono calcolati i rischi aggiustati, denominati nel sito come rischi adj. Questi rendono ininfluente la diversa distribuzione dei fattori di rischio e consentono un confronto valido tra tutti i gruppi oggetto di interesse. Infatti, dopo laggiustamento, i rischi possono essere interpretati come se tutte le strutture e tutte le aree presentassero la stessa distribuzione dei fattori di rischio (et, sesso, gravit della patologia e comorbilit) della popolazione di riferimento. Pertanto, dopo laggiustamento, le differenze osservate tra gli ospedali non potranno pi essere attribuibili alla diversa gravit dei pazienti e rifletteranno le reali differenze nella qualit delle cure. Il rapporto tra due rischi aggiustati costituisce un rischio relativo aggiustato, denominato nel sito come RR adj. Vediamo un esempio in relazione alla mortalit a 30 giorni dal ricovero per infarto miocardico acuto.
LAzienda O-U Umberto I di Roma ha un rischio grezzo di mortalit a 30 giorni dal ricovero per infarto pari al 12,25%, che diventa 19,63% dopo laggiustamento per gravit. Questi pazienti, prima dellaggiustamento, non erano confrontabili con la media nazionale perch presentavano una minore complessit clinica rispetto al totale dei pazienti ricoverati per infarto in Italia. Applicando all Azienda O-U Umberto I la distribuzione nazionale delle caratteristiche-paziente, quali et, sesso e patologie concomitanti, il rischio della struttura aumenta. Ricordando che la mortalit a livello nazionale pari al 10,28%, il rischio relativo aggiustato si ottiene dal rapporto 19,63/10.28 = 1,91. Pertanto, dopo aver reso ininfluente leffetto della diversa gravit dei pazienti, lUmberto I di Roma presenta un rischio di mortalit del 91% superiore rispetto alla media nazionale. Avendo applicato a tutti gli ospedali la stessa distribuzione per gravit (quella osservata a livello nazionale), tutte le strutture ospedaliere sono confrontabili sia tra di loro sia con la media nazionale.
20
numero di livelli, come nel caso delle strutture ospedaliere. Inoltre, le tecniche basate sul propensity adjustment sono incentrate sulla sintesi di tutti i potenziali fattori confondenti in ununica variabile, il propensity score, da utilizzare nei processi di aggiustamento e trovano maggiore applicazione nei casi in cui il numero dei fattori confondenti sia molto elevato rispetto al numero degli esiti osservati. Tuttavia, nei contesti in cui si ha a disposizione un notevole numero di esiti, come nelle valutazioni comparative a livello nazionale o regionale, le metodologie di risk adjustment e propensity adjustment conducono a risultati praticamente identici. Per approfondimenti sul tema si consigliano le seguenti pubblicazioni: Rosenbaum P, Rubin D. The central role of the propensity score in observational studies for causal effects. Biometrika 1983;70:41-45. DAgostino R. Propensity score methods for bias reduction in the comparison of a treatment to a non-randomized control group. Statistics in Medicine 1998;17:2265-2281.
22
Per una corretta valutazione dei risultati, si puntualizza che tutti i rischi, sia per gli uomini sia per le donne, sono stati aggiustati mediante standardizzazione diretta, applicando a ciascuna struttura ospedaliera la distribuzione nazionale delle caratteristiche del paziente (si veda il paragrafo 2.3.2). Pertanto, tutti i rischi aggiustati mostrati nellesempio sopra sono confrontabili tra loro. Anche in questo caso, i rischi relativi aggiustati (RR ADJ) sono espressi rispetto alla media nazionale complessiva (calcolata, quindi, sul totale di uomini e donne) che, per questo indicatore, pari al 10,28%.
23
Al contrario dellerrore sistematico, descritto nel paragrafo 2.1, lerrore casuale non ha una direzione ben precisa e si distribuisce uniformemente intorno al vero valore del parametro di interesse (ad esempio un rischio relativo). C unaltra differenza rilevante tra le due tipologie di errore. Mentre lerrore sistematico indipendente dalla numerosit campionaria (ovvero dal numero delle osservazioni analizzate), lerrore casuale diminuisce allaumentare del numero delle osservazioni, consentendo di ottenere stime sempre pi precise.
confronti tra ospedali o aree di residenza rendendo statisticamente ininfluente leffetto della diversa distribuzione dei fattori di rischio. Soffermiamoci su un esempio concreto, analizzando la proporzione di pazienti che ricevono tempestivamente un intervento chirurgico a seguito di frattura del collo del femore. Si ricorda che, in questo contesto, il termine rischio un sinonimo di proporzione (vedi paragrafo 1.3.1).
Per lOspedale di Castel San Pietro Terme, in Provincia di Bologna, la probabilit di ricevere un intervento chirurgico entro le 48 ore del 30% superiore rispetto alla media nazionale (media nazionale = 33,11%). Ma questo risultato favorevole statisticamente significativo? Per rispondere a questa domanda, necessario spendere alcune parole sulla logica dei test statistici. Questa branca della statistica prende il nome di verifica di ipotesi o anche analisi della significativit. In alcuni contesti, lanalisi di un campione di dati ha come obiettivo anche quello di prendere una decisione sulla base delle informazioni contenute nei dati stessi. A tale proposito, i test statistici possono fornire utili elementi di valutazione sulla base di tre grandezze fondamentali. La forza della misura di associazione: di quanto si allontana il rischio relativo rispetto al valore 1,00 di indifferenza? Il numero di osservazioni analizzate: sullosservazione di quanti ricoveri sto basando le mie conclusioni? La frequenza dellesito in studio: lesito che sto valutando raro, come per esempio la mortalit a 30 giorni dallintervento di bypass aorto-coronarico, o comune (non raro), come per esempio la proporzione di parti con taglio cesareo primario? La verifica di ipotesi, che una branca dellinferenza statistica, attraverso la combinazione di questi tre elementi consente di ottenere il valore della p (p-value), che esprime la probabilit di sbagliare per effetto del caso se dichiariamo che il risultato dellospedale che stiamo analizzando diverso rispetto a una determinata categoria di riferimento. Torniamo al nostro esempio sulla frattura del collo del femore: per lOspedale di Castel San Pietro Terme il test statistico produce un valore della p pari a 0,072 (esprimendolo in percentuale 7,2%).
25
Il test mette a confronto il risultato dellOspedale di Castel San Pietro Terme (intervento tempestivo nel 43,09% dei casi) col risultato medio nazionale (intervento tempestivo nel 33,11% dei casi). Proviamo a interpretare il valore della p: la probabilit di sbagliare per effetto del caso se dichiariamo che in questo ospedale la proporzione di pazienti operati entro le 48 ore diversa dalla media nazionale pari al 7,2%. In altre parole, 7,2% la probabilit di sbagliare per effetto del caso se si conclude che il risultato dellOspedale di Castel San Pietro Terme veramente migliore rispetto alla media nazionale. Per convenzione, un rischio relativo viene considerato statisticamente significativo se il valore della p prodotto dal test statistico minore o uguale a 0,05. Secondo questa logica, la probabilit di errore che siamo disposti ad accettare nel dichiarare che il risultato di un ospedale veramente diverso dalla media nazionale (e non lo sia per effetto del caso) deve essere inferiore al 5%. In conclusione, il rischio relativo aggiustato dellOspedale di Castel San Pietro Terme non statisticamente significativo perch il valore della p (0,072) maggiore di 0,05. Pertanto non abbiamo abbastanza elementi per escludere che la differenza tra questo Ospedale e la media nazionale sia interamente attribuibile alleffetto del caso.
26
In base al rischio relativo aggiustato e al test statistico possibile classificare il risultato di ogni ospedale in tre categorie: 1. strutture con esiti pi favorevoli rispetto alla media nazionale (valore della p 0,05); 2. strutture con esiti non significativamente diversi dalla media nazionale (valore della p > 0,05); 3. strutture con esiti meno favorevoli rispetto alla media nazionale (valore della p 0,05). Segue un esempio sullanalisi della mortalit a 30 giorni dal ricovero per infarto miocardico acuto. In ascissa riportato il rischio aggiustato espresso in percentuale. Le tre categorie sono distinte da colori diversi, come da legenda. Infarto miocardico acuto: mortalit a 30 giorni dal ricovero
Nellesempio seguente, che vuole confrontare lIRCCSF Ospedale Maggi di Milano e lIRCCSF S. Matteo di Pavia , invece, possibile evidenziare come il risultato del test sia strettamente legato al numero dei ricoveri analizzati.
27
Pur presentando rischi relativi rispetto alla media praticamente identici, lIRCCSF Ospedale Maggi non raggiunge la significativit statistica (valore della p > 0,05) a causa del limitato numero di osservazioni (140 ricoveri analizzati nel 2011) mentre lIRCCSF S. Matteo (468 ricoveri analizzati nel 2011) presenta un valore della p = 0,029, che indica una mortalit significativamente pi elevata rispetto alla media nazionale.
Dallosservazione dei risultati emerge che lampiezza dellintervallo di confidenza diminuisce allaumentare della numerosit campionaria, a indicare una maggiore precisione della stima del rischio relativo.
28
Analizziamo, adesso, la relazione tra ampiezza dellintervallo e livello di confidenza. I risultati sono presentati in tabella 8. Tabella 8. Ampiezza dellintervallo e livello di confidenza Rischio relativo 2,00 2,00 2,00 Numerosit campionaria* 400 400 400 Livello di confidenza 90% 95% 99% Intervallo di confidenza 1,31-3,04 1,21-3,30 1,04-3,86
Dallosservazione dei risultati presentati nella tabella emerge che lampiezza dellintervallo aumenta allaumentare del livello di confidenza. Infatti, a parit di numerosit campionaria, lunico modo che abbiamo per incrementare il livello di confidenza quello di aumentare lampiezza dellintervallo, che essendo pi ampio avr una maggiore probabilit di comprendere il valore reale del rischio relativo.
29
30