You are on page 1of 6

Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv.

Editia a 6 revzut, Editura CREDIS, Bucureti, 207p. ISBN 978-973-734-461-8.

3.6.

Formule de calcul pentru medie i dispersie

Dei pentru obinerea unui anumit rezultat numeric putem folosi mai multe formule echivalente algebric, vom prefera ntotdeauna acele formule care presupun ct mai puine operaii sunt ct mai rapide - sau care, n cazul operrii cu valori aproximative, amplific erorile de aproximare ct mai puin sunt ct mai precise. Pentru ultima proprietate va trebui ca operaiile care introduc aproximri mpririle i extragerile de radicali - s fie plasate ct mai trziu. Aceste formule se numesc, n literatura statistic, formule de calcul sau, mai explicit, formule de calcul rapid i / sau precis.

3.6.1. Metod de calcul rapid al mediei i dispersiei


(a) n cazul unei serii statistice (b)

x1,x2,...,xi,...,xN, respectiv,

n cazul unei serii statistice grupat n distribuia de frecvene absolute (xj, Nj) cu N = Nj,

notnd cu T1 = xi i T2 = xi2, respectiv T1 = Nj xj i T2 = Nj xj2, media va fi:

M=

T1 , iar N

dispersia se va putea obine, dup calcularea mediei, prin formula:

S2 =

T2 M2 . N

Aceasta o vom denumi formula de calcul rapid a dispersiei deoarece presupune mai puine operaii dect formula teoretic de definiie. innd cont c T2 = xi2 rezult c: dispersia este media ptratelor minus ptratul mediei valorilor seriei. Formularea se reine uor deoarece conine un joc de cuvinte.
Exemplul 3.6.1. S se calculeze media i dispersia pentru urmtoarea serie de 6 valori: 2, 3, 2, 4, 3, 3. Rezultatele finale vor fi rotunjite la dou zecimale.

Rezolvri rapide
(AA DA !) (a) Plasm seria n coloana x, calculm ptratele valorilor n coloana x2 i calculm T1 i T2 sumnd valorile din fiecare coloan:
x2 4 9 4 16 9 9 T2 = 51

x 2 3 2 4 3 3 T1 = 17

Apoi, conform formulelor de calcul:

M=

T1 17 = 2 ,833 i N 6 T 51 S 2 = 2 M 2 2,833 2 8,5 8,026 = 0,474 0,47. N 6


Rspuns: M 2,83 i S2 0,47.

71

Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv. Editia a 6 revzut, Editura CREDIS, Bucureti, 207p. ISBN 978-973-734-461-8.

Observaii: Deoarece n calcul trebuie s avem o zecimal n plus fa de rezultatul final, iar media este un rezultat intermediar n calculul dispersiei, am calculat media cu trei zecimale. n final, am rotunjit-o la dou zecimale, aa cum se cere n enun.
n total s-au executat 20 operaii algebrice. (a) Dac seria este grupat n distribuia de frecvene absolute din primele dou coloane ale tabelei urmtoare, calculm mai nti coloanele cu valorile xj2 i cu produsele Nj xj, respectiv, Nj xj2 i calculm T1 i T2 sumnd valorile din ultimele dou coloane:
Nj 2 3 1 N=6 xj 2 3 4 xj2 4 9 16 Nj x j 4 9 4 T1 = 17 Nj x j 2 8 27 16 T2 = 51

Apoi, conform formulelor de calcul: T 17 2 ,833 i M= 1 = N 6 T 51 S 2 = 2 M 2 2,833 2 0,47 . N 6

+ Rezolvare greoaie
(AA NU !! - folosind formula teoretic a dispersiei) (a) Din suma elementelor primei coloane de mai jos determinm mai nti media M = 17 / 6 2,833. Apoi calculm coloanele doi i trei i suma celei de-a treia coloane:
x 2 3 2 4 3 3 N = x = 17 x-M -0,833 0,167 -0,833 1,166 0,167 0,167 (x-M) 2 0,694 0,028 0,694 1,340 0,028 0,028 (x-M) 2 =2,812

n final

(x M ) =
N

2,812 0,47. 6

Rspuns: M 2,83 i S2 0,47.

n calculul dispersiei, media i celelalte rezultate intermediare au fost rotunjite la trei zecimale, pentru a avea, aa cum se cere, o zecimal n plus fa de rezultatul final. n total s-au executat 23 operaii algebrice, cu trei mai multe dect la punctul (a). n mod evident, operaiile executate au fost mai dificile dect n varianta (a) de mai sus.

+3.6.2. Formule de calcul rapid i precis pentru dispersie


precizie

N T2 T12 N2

T2
T2 T1 2 N N2

T12 N N

T2 T1 N N
Numr operaii: 5 4

<>

T2 M2 N
rapiditate 3

72

Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv. Editia a 6 revzut, Editura CREDIS, Bucureti, 207p. ISBN 978-973-734-461-8.

Deoarece variabilitatea biologic este mult mai mare dect variabilitatea produs de erorile de msurare i de rotunjire prin calcul, n biostatistic ne va interesa mai mult rapiditatea dect precizia. De aceea, cel puin n calculul manual, vom prefera formula din chenarul dublu care presupune calculul prealabil al mediei. n programele de calculator va fi de preferat formula din chenarul simplu. Aceasta este utilizat n tiinele exacte i inginerie, adic oriunde este nevoie de o precizie ct mai bun.

+3.6.3. Metode de calcul manual simplificat prin artificii


Acest subparagraf este introdus nu att pentru narmarea cititorului cu metode de calcul manual ci, mai degrab, pentru a-l familiariza cu un mod de gndire fundamental n matematic i statistic, mod ce va fi necesar pentru nelegerea paragrafului dedicat distribuiei normale. Pentru aceasta s considerm urmtorul exemplu pe care l vom soluiona, mai nti direct, dup modelul prezentat la punctul 3.6.1.(a).

Exemplul 3.6.3.
Rezolvare:
S se calculeze media i dispersia pentru urmtoarea serie de 5 valori: 1, 7, 10, 16, 19.

Plasm seria n coloana x, calculm ptratele valorilor n coloana x2 i calculm T1 i T2 sumnd valorile din fiecare coloan:
x 1 7 10 16 19 T1 = 53 x2 1 49 100 256 361 T2 = 767

Apoi, conform formulelor de calcul:

T1 53 = = 10,6 i N 5 T 767 S2 = 2 M 2 = 10,6 2 = 153,4 112,36 = 41,04. N 5 M=

Translatarea datelor (sau introducerea unei medii provizorii, x 0 ) Observm c numerele cu care s-a lucrat n seria de 5 valori de mai sus sunt relativ mari i, deci, calculul a decurs relativ greoi. Datele sunt reprezentate prin cercuri pline n desenul urmtor.

Pentru micorarea numerelor introduse n calcul putem face o translaie convenabil de lungime x0, adic vom calcula x' = x x0. De exemplu, dac vom lua x0 = 10, noul ir va avea valorile reprezentate mai sus prin cerculee goale i enumerate n coloana a II-a a tabelului urmtor:

73

Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv. Editia a 6 revzut, Editura CREDIS, Bucureti, 207p. ISBN 978-973-734-461-8. x 1 7 10 16 19 x' = x x0 -9 -3 0 6 9 T '1 = 3 (x)2 81 9 0 36 81 T '2 = 207

De regul vom alege un x0 ct mai aproape de tendina central a irului, aa cum o sesizm intuitiv. De aceea metoda se numete i introducerea unei medii provizorii, x0. Dac este posibil, este convenabil ca x0 s fie chiar o valoare a irului pentru c aceasta va deveni 0 uurnd calculele ulterioare. Calculm noua medie i noua dispersie:

M =
(S ' ) 2 =

T '1 N

3 5

= 0,6

T '2 207 (M ' ) 2 = 0,6 2 = 41,4 0,36 = 41,04 . N 5

Deoarece datele au fost translatate la stnga cu x0 = 10 uniti, atunci i noua medie M' va fi cu x0 = 10 uniti mai mic dect media iniial, M. Adic M' = M x0.

Observaia 1:
(important pentru paragraful dedicat distribuiei normale) Dac x0 ar fi chiar media seriei iniiale M, noua medie va fi M' = M - M = 0, ca n desenul urmtor.

Observaia 2:

Media cutat, M se poate obine din noua medie, M' astfel:

M = M ' + x0

= 0,6 + 10 = 10,6.

mprtierea, n particular dispersia, nu s-a modificat n nici un fel, deci

74

Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv. Editia a 6 revzut, Editura CREDIS, Bucureti, 207p. ISBN 978-973-734-461-8.

S 2 = (S ' ) 2

= 41,04.

2 Dilatarea ori contractarea datelor (sau introducerea unui f actor de scar h , sau schimbarea unit ii de m sur ) S considerm acum irul valorilor x' din exemplul anterior. Observm c aceste valori pot deveni i mai mici (deci i mai uor de manevrat n calculul manual) dac le divizm cu h = 3, obinnd valorile x" = x' / h din tabelul urmtor:
x -9 -3 0 6 9 x = x / h -3 -1 0 2 3 T1 = 1 (x) 2 9 1 0 4 9 T2 = 23

Am executat o contractare1 a axei cu factorul de scar h = 3, noile valori fiind ptratele goale din desenul urmtor. Altfel spus am schimbat unitatea de msur iniial cu o nou unitate de msur care este de 3 ori mai mic.

Media i dispersia pentru noul ir x" vor fi:

M' ' =
( S' ' ) 2 =

T' '1 1 = = 0,2 N 5

Deoarece datele au fost micorate de h = 3 ori, i noua medie M, respectiv noua abatere standard S'' vor fi de acelai numr de ori mai mici dect M', respectiv S'. Adic M'' = M' / h i S'' = S' / h, iar (S'') 2 =(S') 2/ h 2 .

T' ' 2 23 (M ' ' ) 2 = 0,2 2 = 4,6 0,04 = 4,56 . N 5

Observaia 3:
(important pentru paragraful dedicat distribuiei normale) Dac h ar fi chiar abaterea standard a irului x', i anume S', noua abatere standard va fi S'' = S' / S' = 1.

Dac valorile irului ar fi fost fracionare este posibil s fi fost avantajoas o dilatare care s le transforme n numere ntregi mai uor de manevrat n calcul.

75

Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv. Editia a 6 revzut, Editura CREDIS, Bucureti, 207p. ISBN 978-973-734-461-8.

Observaia 4:

Media i dispersia irului x' vor fi date de formulele:

M' = M' ' h


Observaia 5:

= 0,2 3 = 0,6

(S' ) 2 = (S' ' ) 2 h 2

= 4,56 32 = 4,56 9 = 41,04.

Dac dorim s aflm media i dispersia irului originar x, atunci vom ine cont c am efectuat att: o translaie de lungime x0, ct i o comprimare / dilatare de factor de scar h:

x'' = x' / h= (x - x0 ) / h
i formulele de revenire la media M i dispersia S2 ale irului iniial se vor obine combinnd formulele de mai sus:

M = M' + x0 = M' ' h + x0 S 2 = ( S' ) 2 = ( S' ' ) 2 h 2

3.6.4. Probleme
1. a. S se calculeze prin formulele de calcul simultan rapid i precis mediile i dispersiile, precum i abaterile standard i coeficienii de variaie pentru seriile S4'', S3, S4' i S5 din subparagraful 3.1.1. b. S se compare rezultatele numerice obinute cu rezolvarea prin sintez grafic prezentat n finalul problemei rezolvate la punctul 5 de la 3.1.1. a.
Seria

Rezolvare:
Media (n mm) M 190,00 190,00 189,50 172,39 Dispersia (n mm2) S2 0,00 0,67 3,43 65,90 Abaterea standard (n mm) S 0,00 0,82 1,85 8,12 Coeficientul de variaie CV% 0,00% 0,43% 0,98% 4,71%

S4'' S3 S4' S5

2.

a. S se execute aceleai calcule i pentru distribuia grupat S5' lund ca valori centrele claselor. S se observe diferenele ntre valorile indicatorilor pentru aceast serie i cea negrupat corespunztoare (S5). La distribuia grupat fa de cea negrupat corespunztoare: b. media va fi ntotdeauna mai mare ? c. dispersia va fi ntotdeauna mai mic ? a.
Seria

Rezolvare:
M 172,50 S2 48,61 S 6,97 CV% 4,04%

S5 b. Nu. Media la distribuia grupat poate fi mai mare sau mai mic n funcie de modul de plasare a valorilor seriei negrupate fa de centrele claselor. c. Da. Dispersia distribuiei grupate va fi ntotdeauna mai mic sau egal cu dispersia distribuiei negrupate, cci prin grupare valorile mprtiate n cadrul unei clase vor fi concentrate n centrul clasei respective. Un rspuns mai elaborat se poate baza pe proprietatea de aditivitate a dispersiei. Seria negrupat are dispersia egal cu dispersia total (variaia total / volumul seriei), iar seria grupat are dispersia egal cu dispersia intergrupri (variaia intergrupri / acelai volum), gruprile fiind dictate de intervalele de grupare. Practic, prin grupare s-a pierdut variaia intragrupri, ceea ce intuitiv a constituit explicaia de mai sus.

76

You might also like