Professional Documents
Culture Documents
3.6.
Dei pentru obinerea unui anumit rezultat numeric putem folosi mai multe formule echivalente algebric, vom prefera ntotdeauna acele formule care presupun ct mai puine operaii sunt ct mai rapide - sau care, n cazul operrii cu valori aproximative, amplific erorile de aproximare ct mai puin sunt ct mai precise. Pentru ultima proprietate va trebui ca operaiile care introduc aproximri mpririle i extragerile de radicali - s fie plasate ct mai trziu. Aceste formule se numesc, n literatura statistic, formule de calcul sau, mai explicit, formule de calcul rapid i / sau precis.
x1,x2,...,xi,...,xN, respectiv,
n cazul unei serii statistice grupat n distribuia de frecvene absolute (xj, Nj) cu N = Nj,
M=
T1 , iar N
S2 =
T2 M2 . N
Aceasta o vom denumi formula de calcul rapid a dispersiei deoarece presupune mai puine operaii dect formula teoretic de definiie. innd cont c T2 = xi2 rezult c: dispersia este media ptratelor minus ptratul mediei valorilor seriei. Formularea se reine uor deoarece conine un joc de cuvinte.
Exemplul 3.6.1. S se calculeze media i dispersia pentru urmtoarea serie de 6 valori: 2, 3, 2, 4, 3, 3. Rezultatele finale vor fi rotunjite la dou zecimale.
Rezolvri rapide
(AA DA !) (a) Plasm seria n coloana x, calculm ptratele valorilor n coloana x2 i calculm T1 i T2 sumnd valorile din fiecare coloan:
x2 4 9 4 16 9 9 T2 = 51
x 2 3 2 4 3 3 T1 = 17
M=
71
Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv. Editia a 6 revzut, Editura CREDIS, Bucureti, 207p. ISBN 978-973-734-461-8.
Observaii: Deoarece n calcul trebuie s avem o zecimal n plus fa de rezultatul final, iar media este un rezultat intermediar n calculul dispersiei, am calculat media cu trei zecimale. n final, am rotunjit-o la dou zecimale, aa cum se cere n enun.
n total s-au executat 20 operaii algebrice. (a) Dac seria este grupat n distribuia de frecvene absolute din primele dou coloane ale tabelei urmtoare, calculm mai nti coloanele cu valorile xj2 i cu produsele Nj xj, respectiv, Nj xj2 i calculm T1 i T2 sumnd valorile din ultimele dou coloane:
Nj 2 3 1 N=6 xj 2 3 4 xj2 4 9 16 Nj x j 4 9 4 T1 = 17 Nj x j 2 8 27 16 T2 = 51
+ Rezolvare greoaie
(AA NU !! - folosind formula teoretic a dispersiei) (a) Din suma elementelor primei coloane de mai jos determinm mai nti media M = 17 / 6 2,833. Apoi calculm coloanele doi i trei i suma celei de-a treia coloane:
x 2 3 2 4 3 3 N = x = 17 x-M -0,833 0,167 -0,833 1,166 0,167 0,167 (x-M) 2 0,694 0,028 0,694 1,340 0,028 0,028 (x-M) 2 =2,812
n final
(x M ) =
N
2,812 0,47. 6
n calculul dispersiei, media i celelalte rezultate intermediare au fost rotunjite la trei zecimale, pentru a avea, aa cum se cere, o zecimal n plus fa de rezultatul final. n total s-au executat 23 operaii algebrice, cu trei mai multe dect la punctul (a). n mod evident, operaiile executate au fost mai dificile dect n varianta (a) de mai sus.
N T2 T12 N2
T2
T2 T1 2 N N2
T12 N N
T2 T1 N N
Numr operaii: 5 4
<>
T2 M2 N
rapiditate 3
72
Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv. Editia a 6 revzut, Editura CREDIS, Bucureti, 207p. ISBN 978-973-734-461-8.
Deoarece variabilitatea biologic este mult mai mare dect variabilitatea produs de erorile de msurare i de rotunjire prin calcul, n biostatistic ne va interesa mai mult rapiditatea dect precizia. De aceea, cel puin n calculul manual, vom prefera formula din chenarul dublu care presupune calculul prealabil al mediei. n programele de calculator va fi de preferat formula din chenarul simplu. Aceasta este utilizat n tiinele exacte i inginerie, adic oriunde este nevoie de o precizie ct mai bun.
Exemplul 3.6.3.
Rezolvare:
S se calculeze media i dispersia pentru urmtoarea serie de 5 valori: 1, 7, 10, 16, 19.
Plasm seria n coloana x, calculm ptratele valorilor n coloana x2 i calculm T1 i T2 sumnd valorile din fiecare coloan:
x 1 7 10 16 19 T1 = 53 x2 1 49 100 256 361 T2 = 767
Translatarea datelor (sau introducerea unei medii provizorii, x 0 ) Observm c numerele cu care s-a lucrat n seria de 5 valori de mai sus sunt relativ mari i, deci, calculul a decurs relativ greoi. Datele sunt reprezentate prin cercuri pline n desenul urmtor.
Pentru micorarea numerelor introduse n calcul putem face o translaie convenabil de lungime x0, adic vom calcula x' = x x0. De exemplu, dac vom lua x0 = 10, noul ir va avea valorile reprezentate mai sus prin cerculee goale i enumerate n coloana a II-a a tabelului urmtor:
73
Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv. Editia a 6 revzut, Editura CREDIS, Bucureti, 207p. ISBN 978-973-734-461-8. x 1 7 10 16 19 x' = x x0 -9 -3 0 6 9 T '1 = 3 (x)2 81 9 0 36 81 T '2 = 207
De regul vom alege un x0 ct mai aproape de tendina central a irului, aa cum o sesizm intuitiv. De aceea metoda se numete i introducerea unei medii provizorii, x0. Dac este posibil, este convenabil ca x0 s fie chiar o valoare a irului pentru c aceasta va deveni 0 uurnd calculele ulterioare. Calculm noua medie i noua dispersie:
M =
(S ' ) 2 =
T '1 N
3 5
= 0,6
Deoarece datele au fost translatate la stnga cu x0 = 10 uniti, atunci i noua medie M' va fi cu x0 = 10 uniti mai mic dect media iniial, M. Adic M' = M x0.
Observaia 1:
(important pentru paragraful dedicat distribuiei normale) Dac x0 ar fi chiar media seriei iniiale M, noua medie va fi M' = M - M = 0, ca n desenul urmtor.
Observaia 2:
M = M ' + x0
= 0,6 + 10 = 10,6.
74
Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv. Editia a 6 revzut, Editura CREDIS, Bucureti, 207p. ISBN 978-973-734-461-8.
S 2 = (S ' ) 2
= 41,04.
2 Dilatarea ori contractarea datelor (sau introducerea unui f actor de scar h , sau schimbarea unit ii de m sur ) S considerm acum irul valorilor x' din exemplul anterior. Observm c aceste valori pot deveni i mai mici (deci i mai uor de manevrat n calculul manual) dac le divizm cu h = 3, obinnd valorile x" = x' / h din tabelul urmtor:
x -9 -3 0 6 9 x = x / h -3 -1 0 2 3 T1 = 1 (x) 2 9 1 0 4 9 T2 = 23
Am executat o contractare1 a axei cu factorul de scar h = 3, noile valori fiind ptratele goale din desenul urmtor. Altfel spus am schimbat unitatea de msur iniial cu o nou unitate de msur care este de 3 ori mai mic.
M' ' =
( S' ' ) 2 =
Deoarece datele au fost micorate de h = 3 ori, i noua medie M, respectiv noua abatere standard S'' vor fi de acelai numr de ori mai mici dect M', respectiv S'. Adic M'' = M' / h i S'' = S' / h, iar (S'') 2 =(S') 2/ h 2 .
Observaia 3:
(important pentru paragraful dedicat distribuiei normale) Dac h ar fi chiar abaterea standard a irului x', i anume S', noua abatere standard va fi S'' = S' / S' = 1.
Dac valorile irului ar fi fost fracionare este posibil s fi fost avantajoas o dilatare care s le transforme n numere ntregi mai uor de manevrat n calcul.
75
Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv. Editia a 6 revzut, Editura CREDIS, Bucureti, 207p. ISBN 978-973-734-461-8.
Observaia 4:
= 0,2 3 = 0,6
Dac dorim s aflm media i dispersia irului originar x, atunci vom ine cont c am efectuat att: o translaie de lungime x0, ct i o comprimare / dilatare de factor de scar h:
x'' = x' / h= (x - x0 ) / h
i formulele de revenire la media M i dispersia S2 ale irului iniial se vor obine combinnd formulele de mai sus:
3.6.4. Probleme
1. a. S se calculeze prin formulele de calcul simultan rapid i precis mediile i dispersiile, precum i abaterile standard i coeficienii de variaie pentru seriile S4'', S3, S4' i S5 din subparagraful 3.1.1. b. S se compare rezultatele numerice obinute cu rezolvarea prin sintez grafic prezentat n finalul problemei rezolvate la punctul 5 de la 3.1.1. a.
Seria
Rezolvare:
Media (n mm) M 190,00 190,00 189,50 172,39 Dispersia (n mm2) S2 0,00 0,67 3,43 65,90 Abaterea standard (n mm) S 0,00 0,82 1,85 8,12 Coeficientul de variaie CV% 0,00% 0,43% 0,98% 4,71%
S4'' S3 S4' S5
2.
a. S se execute aceleai calcule i pentru distribuia grupat S5' lund ca valori centrele claselor. S se observe diferenele ntre valorile indicatorilor pentru aceast serie i cea negrupat corespunztoare (S5). La distribuia grupat fa de cea negrupat corespunztoare: b. media va fi ntotdeauna mai mare ? c. dispersia va fi ntotdeauna mai mic ? a.
Seria
Rezolvare:
M 172,50 S2 48,61 S 6,97 CV% 4,04%
S5 b. Nu. Media la distribuia grupat poate fi mai mare sau mai mic n funcie de modul de plasare a valorilor seriei negrupate fa de centrele claselor. c. Da. Dispersia distribuiei grupate va fi ntotdeauna mai mic sau egal cu dispersia distribuiei negrupate, cci prin grupare valorile mprtiate n cadrul unei clase vor fi concentrate n centrul clasei respective. Un rspuns mai elaborat se poate baza pe proprietatea de aditivitate a dispersiei. Seria negrupat are dispersia egal cu dispersia total (variaia total / volumul seriei), iar seria grupat are dispersia egal cu dispersia intergrupri (variaia intergrupri / acelai volum), gruprile fiind dictate de intervalele de grupare. Practic, prin grupare s-a pierdut variaia intragrupri, ceea ce intuitiv a constituit explicaia de mai sus.
76