You are on page 1of 13

Quim. Nova, Vol. 29, No.

2, 338-350, 2006
D
i
v
u
l
g
a

o
*e-mail: marcia@iqm.unicamp.br
QUIMIOMETRIA II: PLANILHAS ELETRNICAS PARA CLCULOS DE PLANEJAMENTOS
EXPERIMENTAIS, UM TUTORIAL
Reinaldo F. Tefilo e Mrcia M. C. Ferreira*
Instituto de Qumica, Universidade Estadual de Campinas, CP 6154, 13084-971 Campinas - SP
Recebido em 10/12/04; aceito em 20/5/05; publicado na web em 8/12/05
CHEMOMETRICS II: SPREADSHEETS FOR EXPERIMENTAL DESIGN CALCULATIONS, A TUTORIAL. This work describes,
through examples, a simple way to carry out experimental design calculations applying an spreadsheets. The aim of this tutorial is
to introduce an alternative to sophisticated commercial programs that normally are too complex in data input and output. An overview
of the principal methods is also briefly presented. The spreadsheets are suitable to handle different types of computations such as
screening procedures applying factorial design and the optimization procedure based on response surface methodology. Furthermore,
the spreadsheets are sufficiently versatile to be adapted to specific experimental designs.
Keywords: spreadsheets; experimental design; chemometrics.
INTRODUO
Atualmente, com o advento acelerado dos meios computacionais,
clculos muitas vezes simples podem ficar mascarados quando rea-
lizados por pacotes computacionais complexos. Os planejamentos
fatoriais
1-3
, por ex., exigem aps sua execuo, clculos simples, mas
muitas vezes tediosos devido grande quantidade de dados a serem
processados. A maioria dos estudantes e profissionais aprende a uti-
lizar softwares que realizam tais clculos, entretanto, em muitos ca-
sos, sem o interesse e estmulo necessrios para entender como os
mesmos so processados.
A importncia do entendimento dos procedimentos realizados
pelos softwares fundamental para avaliao dos resultados obti-
dos, bem como para o questionamento da maneira pelo qual tais
softwares os realizam.
H no mercado diversos tipos de softwares que realizam clcu-
los de planejamentos experimentais, tais como Statistica
4
,
Unscrambler
5
, Statgraphics
6
, Design Expert
7
, Modde
8
, Minitab
9
dentre outros. Entre os programas gratuitos destaca-se o pacote de
algoritmos executveis disponvel no web site Chemkeys
10
, sendo
este at o momento, o nico gratuito em portugus. Nota-se, por-
tanto, que a maioria destes programas no so gratuitos e muitas
vezes processam resultados complicados de serem entendidos por
um pesquisador inexperiente. Ao contrrio, as planilhas eletrni-
cas, j bastante difundidas e conhecidas, so prticas no sentido da
entrada de dados e equaes, alm de proporcionarem excelente
visualizao dos resultados, fcil transferncia de dados, grficos
e tabelas, sendo ferramentas poderosas para implementar e reali-
zar diferentes tipos de clculos, como os de planejamentos experi-
mentais. vlido destacar que existem verses gratuitas dispon-
veis na web tanto para sistemas operacionais Windows quanto para
Linux, como a encontrada no pacote Openoffice
11
.
O objetivo deste trabalho foi desenvolver, de maneira simples e
didtica, planilhas eletrnicas utilizando-se o software Excel

da
Microsoft
12
para realizar clculos de planejamentos fatoriais e
otimizao empregando Metodologias de Superfcie de Resposta
(RSM). Desta maneira, o trabalho descreve, de modo amplo e obje-
tivo, os mtodos implementados empregando planilhas eletrnicas.
Para a etapa de triagem realizaram-se a estimativa e a avalia-
o dos efeitos para planejamentos fatoriais completos e
fracionrios. As estimativas dos erros para estes planejamentos
foram obtidas de trs maneiras independentes, isto , empregando
replicatas das observaes; utilizando os efeitos de altas ordens;
ou com a incluso de experimentos no ponto central. Para a etapa
de otimizao utilizaram-se os planejamentos compostos centrais
e Doehlert, que se baseiam na metodologia de superfcie de res-
posta. Os coeficientes foram obtidos utilizando o mtodo dos qua-
drados mnimos. O modelo foi avaliado empregando a anlise de
varincia e a estimativa dos erros foi alcanada atravs de experi-
mentos no ponto central.
Aplicaes empregando as planilhas so apresentadas com di-
versos exemplos, em que todos os mtodos so utilizados e a inter-
pretao dos resultados comentada.
Visto que at o momento, a literatura disponvel em portugus,
principalmente destinada a qumicos, bastante escassa, este tutorial
enriquece as opes tanto para professores de nvel superior e alu-
nos de graduao e ps-graduao, quanto para profissionais da
rea industrial. Amplia ainda as opes de algoritmos para clcu-
los empregando tais planejamentos, estando os arquivos dispon-
veis no web site do Laboratrio de Quimiometria Terica e Aplica-
da do Instituto de Qumica da Universidade Estadual de Campinas
(UNICAMP)
13
.
EXPERIMENTOS PARA TRIAGEM
Muitas vezes em um sistema, diversos fatores ou variveis (os
termos fatores e variveis sero usados neste tutorial indistinta-
mente) podem influenciar a resposta desejada. Um experimento
para triagem executado com o interesse em se determinar as va-
riveis experimentais e as interaes entre variveis que tm influ-
ncia significativa sobre as diferentes respostas de interesse
3
.
Aps selecionar as variveis que so possveis de serem estuda-
das e que provavelmente interferem no sistema, preciso avaliar a
metodologia experimental (tempo, custo, etc.). As variveis que no
foram selecionadas devem ser fixadas durante todo o experimento.
Em uma etapa seguinte, deve-se escolher qual planejamento usar
para estimar a influncia (o efeito) das diferentes variveis no resul-
tado. No estudo de triagem, as interaes entre as variveis (interaes
339 Quimiometria II: Planilhas Eletrnicas para Clculos de Planejamentos Vol. 29, No. 2
principais) e de segunda ordem, obtidas normalmente pelos planeja-
mentos fatoriais completos ou fracionrios, so de extrema impor-
tncia para a compreenso do comportamento do sistema.
Planejamentos fatoriais completos
Em um planejamento fatorial so investigadas as influncias de
todas as variveis experimentais de interesse e os efeitos de interao
na resposta ou respostas. Se a combinao de k fatores investigada
em dois nveis, um planejamento fatorial consistir de 2
k
experimen-
tos. Normalmente, os nveis dos fatores quantitativos (i.e. concen-
traes de uma substncia, valores de pH, etc.) so nomeados pelos
sinais (menos) para o nvel mais baixo e + (mais) para o nvel mais
alto, porm o que importa a relao inicial entre o sinal dado e o
efeito obtido, no sendo um critrio definido a nomeao dos sinais.
Para fatores qualitativos (i.e. tipos de cidos, tipos de catalisadores,
etc.), como no existem valores altos ou baixos, fica a critrio do
experimentalista nomear os seus nveis.
Os sinais para os efeitos de interao de 2 ordem e de ordem
superior entre todas as variveis do planejamento, realizando todas
as combinaes possveis, so obtidos pelo produto dos sinais ori-
ginais das variveis envolvidas. Desta maneira, possvel cons-
truir as colunas de sinais para todas as interaes e, assim, elaborar
a matriz de coeficientes de contraste (Tabela 1).
Uma coluna de sinais + (mais) adicionada esquerda da ma-
triz de coeficientes de contraste para o clculo da mdia de todas
as respostas observadas.
Suponha um planejamento fatorial com n ensaios e y
i
observaes
individuais (quando houver replicatas, considere a resposta mdia

y
i
).
Os efeitos para cada coluna da matriz de coeficientes de contraste
(conforme Tabela 1) so dados pelas seguintes Equaes:
(1)
(2)
A Equao 1 descreve o efeito para a mdia de todas as obser-
vaes, enquanto a Equao 2 descreve o clculo do efeito para as
variveis e interaes usando a diferena entre as mdias das ob-
servaes no nvel mais (y
i(+)
) e as mdias das observaes no nvel
menos (y
i(-)
).
Outro mtodo para clculo dos efeitos para um planejamento
fatorial completo ser descrito mais adiante no item Modelos
empricos em estudo de triagem.
Planejamentos fatoriais fracionrios
O planejamento fatorial completo necessita de 2
k
ensaios para
sua execuo, portanto, sua principal desvantagem o grande n-
mero de ensaios que devem ser realizados a cada fator adicionado
ao estudo. Se considerarmos (e observarmos) que os efeitos de al-
tas ordens, principalmente para planejamentos com k > 4, so qua-
se sempre no significativos, a realizao de ensaios para estimar
tais efeitos de interao pode ser irrelevante. Desta maneira, com
um nmero menor de experimentos, possvel obter informaes
daqueles efeitos mais importantes e retirar, na maioria das vezes,
as mesmas concluses caso fosse realizado um fatorial completo.
Os planejamentos que apresentam estas caractersticas so conhe-
cidos como planejamentos fatoriais fracionrios
1-3,14-16
.
H muitos e diferentes tipos de planejamentos fatoriais fracio-
nrios descritos na literatura
1-3,14
, como, por ex., as fraes
1/2, 1/4, 1/8, 1/16...1/2
b
de um planejamento 2
k-b
, em que k o
nmero de variveis e b o tamanho da frao. O tamanho
da frao influenciar no possvel nmero de efeitos a serem esti-
mados e, conseqentemente, no nmero de experimentos neces-
srios
3
.
Pode-se ainda dizer que h dois tipos de fraes: aquelas cujo
objetivo obter somente os efeitos principais
14
e aquelas em que se
adicionam experimentos para separar e estimar efeitos de interaes,
caso se assuma que tais interaes apresentam influncia sobre os
resultados.
3
No primeiro caso necessrio executar, por ex., ape-
nas 8 experimentos para investigar 7 variveis, 12 experimentos
para 11 variveis, etc., sendo conhecidos como planejamentos
saturados
1-3
e planejamentos de Plackett-Burman
14
.
Construo do planejamento fatorial fracionrio
Normalmente, para a construo do planejamento fatorial
fracionrio desejado, utiliza-se um planejamento fatorial completo.
Para exemplificar, consideremos um planejamento 2
3-1
construdo a
partir de um planejamento fatorial completo com duas variveis: V
1
e V
2
. A Tabela 2 apresenta o planejamento fatorial completo com
duas variveis. Sero necessrios quatro experimentos para a execu-
o deste planejamento 2
2
e, a partir dos resultados, podem-se obter
os efeitos principais das duas variveis e o efeito de interao (V
1
.
V
2
).
A coluna da matriz de coeficientes de contraste responsvel pela
interao obtida pela multiplicao dos elementos da coluna da
varivel V
1
com os respectivos elementos da varivel V
2
. As colunas
de V
1
, V
2
e V
1
V
2
da matriz de coeficientes de contraste de um plane-
jamento fatorial completo definem a configurao de um planeja-
mento fatorial fracionrio com trs variveis utilizando apenas os
quatro ensaios destacados em negrito na Tabela 3, em que V
1
, V
2
e
V
1
V
2
sero substitudas pelas variveis independentes x
1
, x
2
e x
3
.
Como o nmero de experimentos a metade do completo, te-
mos uma meia frao de um planejamento fatorial 2
3
(
1

2
2
3
= 2
-1
2
3
=
2
3-1
), conforme as Tabelas 2 e 3.
Tabela 1. Matriz de coeficientes de contraste para um planejamento
fatorial 2
3
Variveis Interaes*
Mdia x
1
x
2
x
3
x
12
x
13
x
23
x
123
+ - - - + + + -
+ + - - - - + +
+ - + - - + - +
+ + + - + - - -
+ - - + + - - +
+ + - + - + - -
+ - + + - - + -
+ + + + + + + +
* x
12
, x
13
e x
23
so os efeitos de interao de 2 ordem; x
123
o efeito
de interao de 3 ordem.
Tabela 2. Planejamento fatorial fracionrio 2
3-1
a partir de um
planejamento fatorial completo 2
2
Nexp.
(*)
x
1
(V
1
) x
2
(V
2
) x
3
(V
1
V
2
)
5 -1 -1 1
2 1 -1 -1
3 -1 1 -1
8 1 1 1
(*)
Ensaios correspondentes obtidos da Tabela 3.
340 Quim. Nova Tefilo e Ferreira
Uma outra propriedade importante dos planejamentos fatoriais
fracionrios diz respeito aos experimentos selecionados que co-
brem o volume mximo do domnio considerado em um nmero
limitado de experimentos
3
. Note nas Tabelas 2 e 3 que os experi-
mentos destacados so comuns aos dois planejamentos.
A Figura 1 destaca como os experimentos de meia frao se-
lecionados distribuem-se em um domnio experimental para trs
variveis (Tabela 3).
Para montagem de um planejamento fatorial fracionrio
saturado considere o seguinte exemplo: sete variveis podem ser
estudadas, com um mnimo de experimentos, em um planejamen-
to fatorial fracionrio com frao 1/16, ou seja, 2
7-4
(
1

16
2
7
= 2
-4
2
7
=
2
7-4
). Para este caso, o planejamento definido pelo modelo de
matriz para um planejamento fatorial 2
3
(Tabela 3).
Um planejamento fatorial completo com sete variveis necessita
de 128 experimentos. Sendo o planejamento fracionrio 2
7-4
, 1/16 do
planejamento completo, ele necessitar de somente 8 experimentos.
Neste caso, para elaborao da matriz de planejamento a partir
da matriz mostrada na Tabela 3, as variveis x
4
, x
5
, x
6
e x
7
sero os
produtos das colunas das variveis x
1
x
2
, x
1
x
3
, x
2
x
3
e x
1
x
2
x
3
, respecti-
vamente.
Efeitos confundidos e resoluo
Certamente h perda de informaes quando se realizam os
planejamentos fatoriais fracionrios. Os efeitos principais so mis-
turados com os efeitos de interao e esta contaminao aumenta
entre as interaes, quando se aumenta a frao do planejamento.
Para entender melhor a confuso causada por esta mistura, con-
sidere uma meia frao de um planejamento fatorial 2
5-1
(Tabela
4). O objetivo obter todos os efeitos principais e todos os poss-
veis efeitos de interao realizando apenas 16 ensaios. Uma matriz
de planejamento elaborada a partir de um planejamento 2
4
. A
coluna da quinta varivel (5) obtida a partir da multiplicao de
todas as outras, ou seja, 1234. Assim, 5 = 1234 chamado de gera-
dor de um planejamento fracionrio
1,15
. Observa-se pela Tabela 4
que os coeficientes de contraste para o efeito de 123 tm os mes-
mos sinais de 45. Isto mostra que os efeitos estimados por estas
duas interaes sero os mesmos, ou seja, sero confundidos, sen-
do assim chamados de pseudnimo um do outro.
A meia frao do planejamento mostrada na Tabela 4 foi obti-
da a partir do gerador (5=1234), no entanto, para conhecer a iden-
tidade de um pseudnimo realizada uma definio de contrastes
a partir da relao apresentada pela Equao 3
I = 12345 (3)
O pseudnimo obtido multiplicando o definido contraste I
por cada um dos efeitos. Por ex., o pseudnimo de 1 obtido mul-
tiplicando 1 por 12345. Considere tambm, como regra, que se
um mesmo termo aparecer mais de uma vez na multiplicao, este
termo desaparece. Portanto, 112345 = 2345. Para 12 o pseudnimo
1212345 = 345.
Se um outro fator F adicionado ao planejamento 2
5-1
(Tabela
4) ele passa a ser um planejamento 2
5-2
e, portanto, um quarto do
fatorial completo. Para obter este novo fator, uma outra definio
de contrastes obtida de um gerador adicional. Assim 5 = 1234 e
6 = 123. Portanto, I = 12345 e I = 1236, respectivamente. Uma ter-
ceira definio de contrastes ento obtida multiplicando os dois
anteriores conforme a Equao 4
I = 123451236 = 456 (4)
O pseudnimo para cada efeito pode agora ser obtido pela
maneira usual. Para 1 temos: 1 = 112345 = 11236 = 1456 ou 1 =
2345 = 236 = 1456.
Assim, com um quarto do planejamento 2
5
, cada efeito apre-
senta trs pseudnimos e a estimativa dos efeitos principais indi-
vidual, no entanto, eles se confundem com efeitos de interao de
2 ordem.
Este tipo de confuso pode ocasionalmente causar dificulda-
des na interpretao, mas isto facilmente contornado por adio
Tabela 3. Planejamento fatorial completo 2
3
N exp. x
1
x
2
x
3
1 -1 -1 -1
2 1 -1 -1
3 -1 1 -1
4 1 1 -1
5 -1 -1 1
6 1 -1 1
7 -1 1 1
8 1 1 1
Figura 1. Experimentos selecionados para um planejamento fatorial
fracionrio 2
3-1
Tabela 4. Coeficientes de contraste para um planejamento fatorial
fracionrio 2
5-1
N exp. 1 2 3 4 5 1234 123 45 2345
1 - - - - + + - - -
2 + - - - - - + + +
3 - + - - - - + + -
4 + + - - + + - - +
5 - - + - - - + + -
6 + - + - + + - - +
7 - + + - + + - - -
8 + + + - - - + + +
9 - - - + - - - - +
10 + - - + + + + + +
11 - + - + + + + + -
12 + + - + - - - - +
13 - - + + + + + + -
14 + - + + - - - - +
15 - + + + - - - - -
16 + + + + + + + + +
341 Quimiometria II: Planilhas Eletrnicas para Clculos de Planejamentos Vol. 29, No. 2
de poucos experimentos complementares, a fim de separar efeitos
confundidos.
Um conceito importante em planejamentos fatoriais fracionrios
a resoluo do planejamento, que define a ordem em que se ne-
gligenciam os efeitos e definida por um nmero romano coloca-
do depois do planejamento ou subescrito. Em geral, a resoluo o
valor do nmero de fatores que compem o termo de menor com-
primento nas definies de contrastes I
1
. Para ilustrar:
1. Resoluo III No confunde efeitos principais entre si,
mas os confunde com efeitos de interao entre dois fatores.
2. Resoluo IV No confunde efeitos principais entre si e
nem com efeitos de interao entre dois fatores, mas confunde efei-
tos principais com efeitos de interao entre trs variveis e os
efeitos entre duas variveis se confundem com outros efeitos, in-
clusive entre eles.
3. Resoluo V Os efeitos principais so confundidos com
efeitos de interao entre quatro variveis e os efeitos de interao
entre duas variveis so confundidos com efeitos de interao en-
tre trs variveis.
Planejamentos fatoriais fracionrios com resoluo maior que
V so raramente usados em triagem
3
.
Os clculos para estimativa dos efeitos para um planejamento
fatorial fracionrio, sero descritos no item Modelos empricos em
estudo de triagem.
Planejamentos fatoriais com ponto central
Em muitos casos, a realizao de repeties autnticas pode ser
algo inconveniente por diversas razes. Para contornar este infortnio
e obter uma boa estimativa dos erros, um experimento normalmente
includo no centro do planejamento (Figura 2), em que o valor mdio
dos nveis de todas as variveis empregado. So os conhecidos expe-
rimentos no ponto central (nvel zero). Deste modo, possvel avaliar
a significncia dos efeitos ou coeficientes, tanto em planejamentos de
triagem (completos ou fracionrios) como em metodologias de super-
fcie de resposta (discutidos mais adiante). Alm desta vantagem, re-
comenda-se este tipo de experimento pelas seguintes razes
3
: o risco
de perder a relao no linear entre os intervalos minimizado e
possvel estimar um modelo razovel e verificar se h falta de ajuste.
Logicamente no h como fugir das repeties, mas o nmero
destas, na maioria dos casos, significativamente reduzido.
No entanto, esta metodologia possvel de ser aplicada somente
quando se utilizam variveis quantitativas, visto que, para variveis
qualitativas, no h como adicionar nveis no ponto central.
Os clculos para estimativa de efeitos e coeficientes relaciona-
dos aos planejamentos com ponto central sero discutidos no item
Modelos empricos em estudo de triagem.
Modelos empricos em estudo de triagem
Pode-se assumir, desde o incio do experimento, que o sistema
estudado (domnio experimental) regido por alguma funo que
descrita pelas variveis experimentais. Normalmente esta funo pode
ser aproximada por um polinmio, o qual pode fornecer uma boa des-
crio entre os fatores e a resposta obtida. A ordem deste polinmio
limitada pelo tipo de planejamento usado. Planejamentos fatoriais de
dois nveis, completos ou fracionrios, podem estimar apenas efeitos
principais e interaes. Planejamentos fatoriais de trs nveis (ponto
central) podem estimar, alm disso, o grau de curvatura na resposta.
Para descrever tais modelos em um estudo de triagem, so uti-
lizados os polinmios mais simples, ou seja, aqueles que contm
apenas termos lineares. Considerando um exemplo para trs vari-
veis, x
1
, x
2
e x
3
, dois polinmios seriam:
y = b
0
+ b
1
x
1
+ b
2
x
2
+ b
3
x
3
+ e (5)
y = b
0
+ b
1
x
1
+ b
2
x
2
+ b
3
x
3
+ b
12
x
1
x
2
+ b
13
x
1
x
3
+ b
23
x
2
x
3
+ b
123
x
1
x
2
x
3
+ e (6)
Segundo a Equao 5, o coeficiente b
0
o valor populacional
da mdia de todas as respostas obtidas, b
1
, b
2
e b
3
so os coeficien-
tes relacionados com as variveis x
1
, x
2
, e x
3
, respectivamente, e o
erro aleatrio associado ao modelo e, para o caso da Equao 6,
b
12
, b
13
, b
23
so os coeficientes para as interaes x
1
x
2
, x
1
x
3,
x
2
x
3
e
b
123
o coeficiente para a interao x
1
x
2
x
3
.
A partir do planejamento montado, pode-se construir a matriz
de coeficientes de contraste, de acordo com a Tabela 1. A matriz de
coeficientes de contraste X, juntamente com o vetor de respostas y,
obtido experimentalmente, ser utilizada para clculo dos coefici-
entes do modelo, conhecidos tambm como vetor de regresso.
O modelo procurado, descrito pelas Equaes 5 e 6 pode ser
representado matricialmente pela Equao 7

^
y = Xb (7)
em que
^
y o vetor das respostas estimadas pelo modelo e b o vetor
de regresso.
Uma maneira de determinar o vetor de regresso b atravs do
mtodo dos quadrados mnimos
17,18
, definido pela Equao 8, em
que X
t
indica a transposta de X
b = (X
t
X)
-1
X
t
y (8)
(X
t
X)
-1
a matriz inversa do produto da transposta da matriz X
com ela mesma.
Para um planejamento fatorial completo, a matriz X qua-
drada e ortogonal, onde n corresponde ao nmero de ensaios. Isto
ocorre pois as colunas de X no esto normalizadas, portanto X
-1
=
X
t
. Neste caso, a Equao 8 se resume Equao 9
1
b = X
t
y (9)
n
A Equao 8 geral e pode ser empregada para se fazer a esti-
mativa de efeitos e coeficientes para todos os planejamentos des-
critos neste artigo, no entanto a Equao 9 especfica para o pla-
nejamento fatorial completo, no sendo aplicvel aos outros plane-
jamentos descritos.
Como as variveis so estudadas em dois nveis codificados,
cada efeito satisfaz variao de duas unidades da varivel corres-
Figura 2. Planejamento 2
2
com ponto central
342 Quim. Nova Tefilo e Ferreira
pondente. Se considerarmos os fatores individualmente, pode-se
provar que o valor de cada coeficiente do modelo a metade do
valor do efeito correspondente, exceto para b
0
, cujo valor o mes-
mo do calculado para seu efeito (Equao 1). Desta maneira, o
modelo empregado para descrever as respostas elaborado em fun-
o dos efeitos por unidade de variao individual
2
.
Estimativa dos erros para os efeitos atravs de repeties
Normalmente, os resultados obtidos em experimentos de pla-
nejamento fatorial completo ou fracionrio com repeties consis-
tem de uma pequena amostra de um hipottico conjunto maior,
representado por uma populao. Destes dados podemos obter a
mdia amostral, a varincia amostral e o desvio padro amostral,
como se segue:
(10)
(11)
(12)
em que r o nmero de replicatas, isto , o nmero de ensaios
realizados em um mesmo ponto experimental (nvel), y
i
so os va-
lores de cada observao individual,

y o valor mdio, s
2
a
varincia e s o desvio padro.
A soma dos desvios da mdia amostral de r replicatas neces-
sariamente zero. Isto requer que ( y
i
-

y) = 0 constitua uma restri-


o linear nos desvios usados no clculo de s
2
. Est subentendido
que com r 1 replicatas possvel determinar a que falta. Os r
resduos y -

y e, conseqentemente, a soma dos seus quadrados


juntamente com a varincia amostral so ditas ter, por esta razo,
r 1 graus de liberdade. A perda de um grau de liberdade est
associada necessidade de substituir a mdia populacional pela
mdia amostral derivada dos dados. Desta maneira, quando repeti-
es genunas so realizadas em uma srie de condies experi-
mentais, a variao entre suas observaes pode ser usada para
estimar o desvio padro de uma simples observao e, conseqen-
temente, o desvio dos efeitos
1
. Todos os ensaios, inclusive repeti-
es, devem ser realizados aleatoriamente, refazendo todas as eta-
pas do experimento. As repeties realizadas desta maneira so
consideradas genunas.
Em um experimento em que cada ensaio foi realizado r vezes,
se o valor de r for pequeno, por exemplo, 2 r 10, haver poucos
graus de liberdade para o clculo da varincia. Uma maneira para
se obter um maior nmero de graus de liberdade realizando uma
estimativa conjunta das varincias, conforme a Equao 13
(13)
(14)
O resultado da Equao 13 reflete a varincia conjunta (s
c
2
) de
cada observao individual y
i
sendo o erro padro igual raiz qua-
drada do mesmo. A Equao 14, que exatamente o denominador
da Equao 13 , portanto, o nmero de graus de liberdade da esti-
mativa conjunta, designada como .
Observa-se atravs das Equaes 1 e 2 e considerando a reali-
zao de repeties autnticas, que cada efeito uma combinao
linear dos valores de y
i
dos n ensaios, com coeficientes c iguais a
+ 2/n e -2/n. Levando em considerao a aleatoriedade dos ensai-
os, tais valores so estatisticamente independentes e apresentam a
mesma varincia populacional
2
. Neste caso, por definio, as
correlaes entre todas as variveis so nulas, e a varincia da com-
binao linear das variveis aleatrias pode ser dada por
2
(15)
Transportando a Equao 15 para o nosso mundo amostral,
pode-se provar que a varincia de cada efeito dada por
1
(16)
em que s
c
2
dada pela Equao 13 e r
i
o nmero de replicatas em
cada ensaio n.
E, finalmente, para calcular o valor do erro de cada efeito, bas-
ta extrair a raiz quadrada de V(ef).
Estimativa dos erros para os efeitos, sem repeties
Uma maneira de estimar erros de efeitos sem a realizao de
repeties supor que interaes de altas ordens para k 3 no so
significativos e, portanto, so erros experimentais nos valores dos
efeitos
2
.
Aplicando a Equao 13 sobre estes efeitos de interao e fa-
zendo algumas consideraes, obtm-se a varincia dos efeitos
conforme a Equao 17
(17)
em que efi
i
so os efeitos de interao considerados como erros
experimentais e l o nmero total de efeitos considerados.
preciso estar atento ao utilizar este tipo de estimativa do erro.
Nem sempre os efeitos de altas ordens so irrelevantes e, se tais
efeitos forem includos no clculo, os erros tornam-se altos e, des-
ta maneira, no possvel distinguir com confiabilidade aqueles
que so realmente importantes.
O nmero de graus de liberdade utilizado para avaliao dos
efeitos agregados a estes erros o mesmo nmero total de efeitos
considerados como erros, isto , o valor l da Equao 17.
Encorajamos o leitor interessado a ler as ref. 16 e 19 que apre-
sentam outros mtodos de identificao de efeitos significativos
sem a realizao de repeties.
Estimativa dos erros para os efeitos e coeficientes a partir das
repeties no ponto central
Conforme mencionado anteriormente, uma das grandes vantagens
da incluso de experimentos no centro do planejamento devida
estimativa do erro com poucas repeties, normalmente entre 3 e 5.
A partir das repeties realizadas possvel obter a mdia e a
varincia das replicatas de acordo com as Equaes 10 e 11, res-
pectivamente.
Por outro lado, sendo os coeficientes obtidos atravs da Equao
8, nota-se que a matriz (X
t
X)
-1
apresenta grande influncia na
varincia dos parmetros de regresso. O produto desta matriz com
o valor da varincia obtida atravs das repeties no ponto central
(Equao 11) fornece a matriz V(b) conhecida como matriz de
343 Quimiometria II: Planilhas Eletrnicas para Clculos de Planejamentos Vol. 29, No. 2
varincia-covarincia (Equao 18). A matriz V(b) simtrica e os
elementos de sua diagonal so as varincias dos parmetros de re-
gresso, na mesma ordem em que elas aparecem na equao de re-
gresso. Os elementos fora da diagonal so as covarincias entre os
parmetros de regresso. A raiz quadrada dos elementos da diagonal
principal da matriz V(b) determina os valores correspondentes dos
erros padro (s
bi
) dos coeficientes calculados (Equao 19).
V(b) = (X
t
X)
-1
s
2
(18)
(19)
Identificao dos efeitos e coeficientes significativos
Na literatura
1-3,15,16
h diferentes mtodos para se avaliar efei-
tos e coeficientes significativos; entre os mais usados destaca-se a
anlise de varincia (ANOVA), o grfico de probabilidade normal
(distribuio normal) e a comparao de efeitos com uma medida
independente da variabilidade. Neste trabalho, as avaliaes de
significncia para a deciso estatstica, tanto para efeitos como para
coeficientes de modelos, foram realizadas empregando o teste t
(distribuio de Student), atravs do valor p
20,21
.
Para realizar a interpretao correta utilizando o valor p ne-
cessrio compreender os testes de hiptese e significncia, confor-
me descrito abaixo.
Em muitos casos, formula-se uma hiptese estatstica com o pro-
psito de rejeit-la ou invalid-la. Por ex., se o desejo decidir se
um sistema diferente de outro, formula-se a hiptese de que no h
diferena entre os sistemas. Essa hiptese denominada nula e re-
presentada por H
0
. Qualquer hiptese diferente da pr-fixada de-
nominada hiptese alternativa e normalmente representada por H
1
21
.
Se uma hiptese for rejeitada quando deveria ser aceita, diz-se
que foi cometido um erro tipo I. Se, por outro lado, uma hiptese
for aceita quando deveria ter sido rejeitada, diz-se que foi cometi-
do um erro do tipo II. Em ambos os casos foi tomada uma deciso
errada ou foi cometido um erro de julgamento
21,22
.
Para que qualquer teste de hiptese ou regra de deciso seja
adequada, eles devem ser planejados de modo que os erros de deci-
so sejam reduzidos ao mnimo.
Ao testar uma hiptese estabelecida, a probabilidade mxima, re-
presentada freqentemente por , com a qual se sujeitaria a correr o
risco de um erro do tipo I denominada nvel de significncia do teste.
Se, por ex., escolhido um nvel de significncia 0,05 ou 5%,
h ento cerca de 5 chances em 100 da hiptese nula ser rejeitada,
quando deveria ser aceita, isto , h uma confiana de 95% de que
se tomou uma deciso correta. Nesses casos, diz-se que a hiptese
rejeitada ao nvel de significncia 0,05, o que significa que a
probabilidade de erro seria de 0,05
22
.
Considerando a hiptese nula de que o valor do efeito se con-
funde com seu erro, pode-se formular a seguinte regra de deciso:
a) rejeio da hiptese nula com 5% de significncia, quando
o valor de t
calc
situar-se fora do intervalo entre t

( |t
calc
| t

). Isso
equivale a dizer que o valor estatstico amostral observado signi-
ficativo no nvel definido e,
b) aceitao da hiptese, caso contrrio.
Uma maneira alternativa de concluir o teste de hiptese com-
parar o valor p do teste estatstico amostral com o nvel de
significncia . O valor p do teste estatstico amostral o menor
nvel de significncia para que se rejeite H
0
20
. Neste sentido, com-
para-se o valor p com e, se o valor p rejeita-se H
0
, caso
contrrio H
0
aceito. A vantagem de se conhecer o valor p est na
possibilidade de se avaliar todos os nveis de significncia para
que o resultado observado possa ser estatisticamente rejeitado
20-21
.
A representao grfica do valor p descrita na Figura 3.
Conforme as Figuras 3(a e b), o nvel de significncia a
rea hachurada no grfico de distribuio. Na Figura 3a a rea cor-
respondente ao valor p maior que o nvel de significncia, por-
tanto, o valor calculado do teste estatstico est fora da regio cr-
tica, o que implica em aceitar H
0
. Para a Figura 3b a rea do valor
p menor que o nvel de significncia e assim, o valor calculado
do teste estatstico est dentro da regio crtica, o que implica em
rejeitar H
0
. importante ressaltar que esta discusso vlida tanto
para testes unilaterais quanto para bilaterais.
Especificamente, o valor p representa a probabilidade de vali-
dade do erro envolvido no resultado observado, isto , como repre-
sentativo da populao
4
. Por ex., levando em considerao o valor
de um efeito, se o valor do teste estatstico calculado (razo entre o
efeito e seu erro) apresentar um grande desvio da distribuio de
Student, ele provavelmente descreve algo mais que o resduo expe-
rimental. Desta maneira, ser significativo dentro de um intervalo
de confiana e assim, |t
calc
| t

ou p , para o nmero de graus de
liberdade em questo.
METODOLOGIA DE SUPERFCIE DE RESPOSTA:
OTIMIZAO
Aps a realizao dos experimentos de triagem, os fatores sig-
nificativos so selecionados e uma metodologia de anlise de su-
perfcies de respostas pode ser executada para otimizao do expe-
rimento. Neste sentido, otimizar significa encontrar os valores das
variveis que iro produzir a melhor resposta desejada, isto , en-
contrar a regio tima na superfcie definida pelos fatores.
A metodologia de superfcie de resposta baseia-se na constru-
o de modelos matemticos empricos que geralmente empregam
funes polinomiais lineares ou quadrticas para descrever o siste-
ma estudado e, conseqentemente, do condies de explorar (mo-
delar e deslocar) o sistema at sua otimizao.
Um planejamento experimental construdo para estimar coefi-
cientes, segundo algum modelo aproximado, deve reunir certos
critrios desejveis, sendo os principais
17,18
: proporcionar boas es-
timativas para todos os coeficientes, exigindo poucos experimen-
tos e, fornecer condies de avaliao dos coeficientes e do mode-
lo, ou seja, da regresso e da falta de ajuste.
Neste trabalho sero descritos os Planejamentos, Composto
Central CCD - Central Composite Design
23
e Doehlert
24
, que pos-
sivelmente so as classes de planejamentos mais utilizadas para
ajustar modelos quadrticos (Equao 20), visto que apresentam
todos os critrios descritos acima, dentre outros.
(20)
em que k o nmero de variveis.
Figura 3. Representao grfica do valor p para um teste unilateral
344 Quim. Nova Tefilo e Ferreira
Planejamento composto central
Os planejamentos compostos centrais (CCD) foram apresenta-
dos por Box e Wilson
23
, em 1951, como uma evoluo dos planeja-
mentos 3
3
, que necessitavam de muitos experimentos para um pe-
queno nmero de fatores, mesmo para planejamentos fracionrios.
Outras vantagens, como rotabilidade e blocagem ortogonal, alm
do pouco nmero de ensaios, foram obtidas devido presena das
seguintes partes no planejamento
17,18
:
1. um planejamento fatorial completo de dois nveis, podendo
ser usado ainda, um planejamento fatorial fracionrio de dois nveis;
2. experimentos no ponto central, isto , x
i
= 0 para todo i e,
3. experimentos nos pontos axiais em que x
i
= , com x
j

x
i
, e = . Estes pontos so situados nos eixos do sistema de
coordenadas com distncia da origem e formam a parte estrela
do planejamento.
A Figura 4 ilustra os pontos experimentais no sistema de coor-
denadas definidas pelos eixos x
i
.
Para construo de um planejamento CCD necessrio definir o
nmero de variveis a serem estudadas (k), qual planejamento fatorial
ser empregado (completo 2
k
ou fracionrio 2
k-b
) e quantos experi-
mentos sero realizados no ponto central (2k). O nmero de experi-
mentos a ser realizado dado por 2
k
+2k+1. A Tabela 5 descreve
como o valor de varia com o nmero de variveis
17,18
e a Tabela 6
apresenta as matrizes de planejamento para 2 e 3 variveis.
Observe que neste tipo de planejamento, os nveis (o mesmo
vale para qualquer valor codificado x
i
) necessitam ser decodificados
para os valores experimentais dos nveis das variveis a serem es-
tudadas e para isso utiliza-se a Equao 21
(21)
em que x
i
o valor codificado do planejamento CCD, z
i
o valor
experimental do nvel,

z o valor mdio entre os nveis mais (+) e


menos (-), que exatamente o valor do nvel zero (0) e z a
diferena entre os nveis mais (+) e menos (-).
Vale ressaltar tambm, que aceitvel o ajuste de a um valor
experimentalmente vivel para o nvel, desde que no ocorram gran-
des distores no valor original.
Utilizando a Tabela 5 podem-se construir diferentes tipos de pla-
nejamentos CCD, conforme aqueles apresentados na Tabela 6. A
partir do planejamento montado, pode-se obter a matriz de coefici-
entes de contraste, de acordo com a Tabela 1. O modelo apresentado
na Equao 20 pode ser representado matricialmente segundo a Equa-
o 7 e seus coeficientes so estimados atravs da Equao 8.
A estimativa dos erros para os coeficientes a partir das replicatas
no ponto central realizada conforme as Equaes 18 e 19 e a avali-
ao dos coeficientes realizada conforme o item Identificao dos
efeitos e coeficientes significativos, descrito anteriormente.
Figura 4. Planejamentos compostos centrais: (a) k = 2 e =1,414, (b) k = 3
e =1.682. () planejamento fatorial, () pontos axiais e () ponto central
Tabela 5. Alguns planejamentos CCD e suas caractersticas
N variveis(k) 2 3 4 5 5 6 6
Valor de b para 2
k-b
0 0 0 0 1 0 1
N de exp. no planejamento fatorial 4 8 16 32 16 64 32
N de exp. no ponto axial 4 6 8 10 10 12 12
Valor de 1,414 1,682 2,000 2,378 2,000 2,828 2,378
Tabela 6. Matrizes dos planejamentos compostos centrais com duas e trs variveis
Planejamento CCD 2
2
Planejamento CCD 2
3
x
1
x
2
x
1
x
2
x
3
-1 -1 -1 -1 -1
1 -1 Planejamento fatorial 1 -1 -1
-1 1 -1 1 -1
1 1 1 1 -1 Planejamento fatorial
-1 -1 1
0 0 Ponto central 1 -1 1
-1 1 1
- 0 1 1 1
0 Pontos axiais
0 - 0 0 0 Ponto central
0
- 0 0
0 0
0 - 0 Pontos axiais
0 0
0 0 -
0 0
345 Quimiometria II: Planilhas Eletrnicas para Clculos de Planejamentos Vol. 29, No. 2
Matriz Doehlert
O planejamento Doehlert ou Matriz Doehlert foi apresentado
por David H. Doehlert em 1970
24
, sendo uma alternativa bastante
til e atrativa aos planejamentos experimentais de segunda ordem.
Os pontos da matriz Doehlert correspondem aos vrtices de um
hexgono gerado de um simplex regular e, em geral, o nmero
total de pontos experimentais no planejamento igual a k
2
+k+pc,
em que k o nmero de fatores e pc o nmero de experimentos
no ponto central. Uma importante propriedade do planejamento
Doehlert diz respeito ao nmero de nveis que cada varivel pos-
sui. Com quatro variveis, por ex., o nmero de nveis 5, 7, 7 e 3,
o que permite avaliar as variveis consideradas mais importantes,
ou seja, que apresentam efeitos mais pronunciados em um nmero
maior de pontos do espao estudado
25
. Alm disso, este tipo de
planejamento necessita de um menor nmero de experimentos em
relao ao planejamento composto central sendo, portanto, mais
eficiente. Esse menor nmero de experimentos para se chegar
regio tima vem do fato de que o domnio da vizinhana facil-
mente explorado pelo ajuste de poucos experimentos, j que o pr-
ximo hexgono utiliza pontos experimentais j explorados pelo
hexgono anterior, conforme Figura 5
3
.
O planejamento Doehlert descreve um domnio circular para duas
variveis, esfrico para trs e hiperesfrico para mais de trs vari-
veis, o que acentua a uniformidade no espao envolvido. Embora
suas matrizes no sejam ortogonais nem rotacionais, elas no apre-
sentam divergncias significativas que comprometam a qualidade
necessria para seu uso efetivo
26
. Para duas variveis, a matriz
Doehlert consiste de um ponto central e mais seis pontos adicionais
formando um hexgono regular e, por esse motivo, situada sob um
crculo (Figura 5). As matrizes do planejamento Doehlert para duas,
trs e quatro variveis podem ser visualizadas na Tabela 7. As matri-
zes Doehlert apresentadas na Tabela 7 so pr-estabelecidas e suas
construes no so triviais como os outros planejamentos apresen-
tados neste trabalho. Mais detalhes sobre a construo deste tipo de
matriz podem ser obtidos nas refs. 24 e 27.
Cada planejamento definido considerando o nmero de vari-
veis e os valores codificados (x
i
) da matriz experimental. A rela-
o entre os valores experimentais e os valores codificados dada
pela Equao 22
(22)
O termo x
i
o valor codificado para o nvel do fator i; z
i
o seu
experimental; z
i
a distncia entre o valor experimental no ponto
central e o experimental no nvel superior ou inferior,
d
o maior
valor limite codificado na matriz para cada fator (na coluna x
2b
da
Tabela 7, por ex.,
d
= 0,866) e z
0
i
o valor experimental no ponto
central.
A maioria dos pacotes computacionais disponveis atualmen-
te, comerciais ou gratuitos, ainda no disponibilizou algoritmos
para clculos de planejamentos Doehlert sendo, portanto, um
Figura 5. Planejamento Doehlert com duas variveis () com adio de
novos experimentos (
. . . .
).
Tabela 7. Matrizes Doehlert para duas, trs e quatro variveis
Variveis Experimentais Matriz Doehlert
2 Variveis 3 Variveis 4 Variveis
x
1a
x
2a
x
1b
x
2b
x
3b
x
1c
x
2c
x
3c
x
4c
1 0 0 0 0 0 0 0 0 0
2 1 0 1 0 0 1 0 0 0
3 0,5 0,866 0,5 0,866 0 0,5 0,866 0 0
4 -1 0 0,5 0,289 0,817 0,5 0,289 0,817 0
5 -0,5 -0,866 -1 0 0 0,5 0,289 0,204 0,791
6 0,5 -0,866 -0,5 -0,866 0 -1 0 0 0
7 -0,5 0,866 -0,5 -0,289 -0,817 -0,5 -0,866 0 0
8 0,5 -0,866 0 -0,5 -0,289 -0,817 0
9 0,5 -0,289 -0,817 -0,5 -0,289 -0,204 -0,791
10 -0,5 0,866 0 0,5 -0,866 0 0
11 0 0,577 -0,817 0,5 -0,289 -0,817 0
12 -0,5 0,289 0,817 0,5 -0,289 -0,204 -0,791
13 0 -0,577 0,817 -0,5 0,866 0 0
14 0 0,577 -0,817 0
15 0 0,577 -0,204 -0,791
16 -0,5 0,289 0,817 0
17 0 -0,577 0,817 0
18 0 0 0,613 -0,791
19 -0,5 0,289 0,204 0,791
20 0 -0,577 0,204 0,791
21 0 0 -0,613 0,791
346 Quim. Nova Tefilo e Ferreira
indicativo dentre outros, de que este planejamento est relativa-
mente pouco difundido entre os pesquisadores.
Avaliao do modelo
O modelo obtido pode no ser exatamente aquele que descreve
a regio estudada do sistema e, neste caso, no pode ser usado para
fazer estimativas para deslocamento e muito menos para extrair
concluses sobre a regio tima. A maneira mais confivel de se
avaliar a qualidade do ajuste do modelo empregando a anlise de
varincia (ANOVA)
21
.
Na ANOVA a variao total da resposta definida como a soma
quadrtica de dois componentes: a soma quadrtica da regresso
(SQ
regr
) e a soma quadrtica dos resduos (SQ
res
). A soma quadrtica
da variao total, corrigida para a mdia (SQ
total
) pode, assim, ser
escrita como a Equao 23
SQ
total
= SQ
regr
+ SQ
res
(23)
em que SQ
regr
e SQ
res
so apresentadas com mais detalhes nas Equa-
es 24 e 25, respectivamente.
(24)
(25)
Da Equao 24, m o nmero total de nveis do planejamento,
isto , pontos experimentais do planejamento;
^
y
i
o valor estimado
pelo modelo para o nvel i e

y o valor mdio das replicatas (r). No


entanto, como h somente replicatas no ponto central, a mdia das
replicatas nos nveis (+) mais e (-) menos o prprio valor observado
do ensaio naquele nvel. Note que o segundo somatrio indica que se
deve fazer o quadrado das diferenas inclusive com cada repetio.
As replicatas realizadas no ponto central deixaro um resduo
para cada observao y
i
. A soma quadrtica destes resduos forne-
ce a soma quadrtica residual somente no nvel zero.
A Equao 25 indica que o quadrado da diferena entre o valor
de cada observao (y
i
) e o valor estimado (
^
y
i
) e, inclusive das
replicatas (y
j
) em cada nvel (m), fornece a soma quadrtica resi-
dual de todos os nveis.
Quando algum modelo ajustado aos dados, a soma quadrtica
do erro puro sempre uma parte da soma quadrtica dos resduos.
Ento, cada resduo pode ser desmembrado em duas partes
18
, isto
(26)
Pela Equao 26, o primeiro termo da direita diz respeito dife-
rena entre o valor de cada observao individual no nvel e a mdia
de todas as observaes naquele nvel. J o segundo termo
corresponde diferena entre o valor estimado no nvel e a mdia de
todas as observaes naquele nvel. A subtrao entre estes dois ter-
mos fornece como resposta o resduo de cada observao individual.
Para evitar os termos negativos na Equao 26, tomam-se as
suas diferenas quadrticas e obtm-se Equao 27
(27)
O primeiro termo da direita chamado de soma quadrtica do
erro puro e est relacionado exclusivamente com os erros aleatrios
das replicatas. J o segundo termo da direita chamado de soma
quadrtica da falta de ajuste, pois ele uma medida da discrepncia
entre a resposta do modelo de previso (
^
y
i
) e a mdia das replicatas
(

y
i
) realizadas no conjunto de condies experimentais
18
.
A Equao 27 pode ser resumida da seguinte maneira
SQ
res
= SQ
ep
+ SQ
faj
(28)
Para cada fonte de variao (regresso, resduos, falta de ajus-
te, erro puro e total), necessrio obter o nmero de graus de liber-
dade. No introduzindo detalhes, pode-se provar que o nmero de
graus de liberdade para as Equaes 24, 25 e 27 so p 1, n p e (n
m) + (m p), respectivamente
1-2,18,26
, em que p o nmero de
parmetros (coeficientes) do modelo, n o nmero total de obser-
vaes (ensaios) e m o nmero de nveis do planejamento. O
nmero de graus de liberdade para as outras fontes de variao
pode ser obtido por clculos algbricos simples.
A diviso da soma quadrtica de cada fonte de variao pelo
seu respectivo nmero de grau de liberdade fornece a mdia
quadrtica (MQ). A razo entre a mdia quadrtica da regresso
(MQ
reg
) pela mdia quadrtica dos resduos (MQ
res
), que nada mais
do que a razo entre duas varincias, pode ser usada para compa-
rar tais fontes de variao atravs do teste F (distribuio de Fisher),
levando em considerao seus respectivos nmeros de graus de
liberdade. O mesmo pode ser feito para a razo entre a mdia
quadrtica da falta de ajuste (MQ
faj
) pela mdia quadrtica do erro
puro (MQ
ep
).
Assim, como foi realizada a avaliao dos efeitos e coeficien-
tes empregando o teste t, atravs do valor p, o mesmo ser feito
para comparar as duas fontes de variao entre si, empregando-se
neste caso o teste F (Equao 29)
(29)
em que MQ
1
e MQ
2
so as mdias quadrticas das fontes de varia-
o 1 e 2, respectivamente, e
1
,
2
so seus respectivos nmeros de
graus de liberdade.
Exemplificando, a razo entre as mdias quadrticas da falta
de ajuste e do erro puro o valor calculado do teste estatstico
(F
calc
), que usado para comparar qual mais significativo. Pode-
se formular uma hiptese nula (H
0
) considerando que no h dife-
rena entre as fontes de variao comparadas. Esta hiptese se re-
flete na seguinte regra de deciso:
a) rejeio da hiptese nula com 5% de significncia, quando o
valor de F
calc
se situar fora do intervalo definido por F

(|F
calc
|
F

), ou seja, p . Isso equivale a dizer que o valor estatstico


amostral observado significativo no nvel definido e as fontes
de variao comparadas so diferentes.
b) Aceitao da hiptese nula, caso contrrio.
Se H
0
for rejeitada para MQ
faj
/MQ
ep
, isto , p , ento h uma
falta de ajuste significativa ao nvel de probabilidade e nmero de
graus de liberdade definidos (normalmente, = 0,05) e o modelo
no adequado.
Em termos prticos, um bom modelo necessita ter uma regres-
so significativa e uma falta de ajuste no significativa. Isto equi-
vale a dizer que a maior parte da variao total das observaes em
torno da mdia deve ser descrita pela equao de regresso e o
restante certamente, ficar com os resduos. Da variao que fica
com os resduos esperado que a maior parte fique com o erro
puro, que o erro experimental, e no com a falta de ajuste, que
est diretamente relacionada com o modelo.
Outros parmetros para observar se toda variao em torno da
mdia foi explicada pela regresso so o valor do coeficiente de
variao R
2
(Equao 30) e o grfico dos resduos
2
.
O valor de R
2
representa a frao da variao que explicada
pela falta de ajuste do modelo (Equao 30). Quanto mais prximo
347 Quimiometria II: Planilhas Eletrnicas para Clculos de Planejamentos Vol. 29, No. 2
de 1 o valor do coeficiente estiver, melhor estar o ajuste do mode-
lo s respostas observadas.
(30)
Note que o erro puro no explica nada do modelo, ento o valor
mximo possvel de R
2

(31)
A anlise de varincia (ANOVA), de acordo com as Equaes
descritas para avaliao do modelo, est resumida na Tabela 8.
Uma boa prtica examinar a distribuio dos resduos, pois
ajuda a verificar se no h nada de errado com o modelo. Neste
caso, pode-se fazer um grfico dos valores estimados pelo modelo
(
^
y
i
) com os valores da diferena entre os valores observados expe-
rimentalmente (y
i
) e seus respectivos valores estimados, isto ,
(
^
y
i
) versus (y
i

^
y
i
). Se os resduos no estiverem aleatoriamente
distribudos, pode-se desconfiar do modelo e investir em outros
recursos para sua melhoria.
MATERIAIS E MTODOS
As planilhas foram elaboradas no software Excel da Microsoft
Office 2003
12
e testadas nas verses 2000 e XP deste mesmo
software. Testou-se a compatibilidade de software empregando a
planilha eletrnica de domnio pblico disponvel no pacote
Openoffice 1.1.1
11
instalado nos sistemas operacionais Windows
98 SE
12
e Linux Fedora Core 2
28
. Todos os outros testes foram rea-
lizados em sistemas operacionais Windows 98 SE, XP e 2000
12
.
Para testes de processamento empregaram-se os computadores pes-
soais com processadores Pentium II e AMD Duron com 64 MB de
memria RAM. Os clculos foram validados atravs dos softwares
Matlab 6.5
29
e Statistica 6.0
30
.
EXEMPLOS
Recomenda-se para melhor entendimento, realizar o download
dos arquivos referente s planilhas descritas neste tutorial na pgina
http://lqta.iqm.unicamp.br e utiliz-las para executar os exemplos.
Sero apresentadas neste tutorial, trs aplicaes que exempli-
ficaro estudos de triagem utilizando os planejamentos fatoriais
completos, fatoriais fracionrios e fatoriais com ponto central e,
para a otimizao, ser descrito um planejamento composto cen-
tral. De maneira geral, estes exemplos podem ser usados como
referncias para construo, clculo e interpretao dos resultados
para estudos que empreguem tais planejamentos.
Outras planilhas, alm das apresentadas nos exemplos, podem
ser encontradas no mesmo web site, inclusive para o planejamento
Doehlert, no exemplificado aqui.
Em todos os arquivos, as matrizes de contrastes podem ser ob-
servadas deslocando a barra de rolagem para a direita na parte in-
ferior da janela e todas as equaes inseridas podem ser visualizadas
clicando sobre a clula de interesse.
Exemplo 1: Planejamento fatorial completo
Os arquivos necessrios para este exemplo so planejamentos
fatoriais completos (fatorial 1.4) e planejamentos fatoriais com-
pletos com ponto central (fatpc 1.1).
Ser descrito o planejamento fatorial completo com ponto cen-
tral utilizado por Arambarri et al.
31
. Os autores tinham como obje-
tivo aprimorar a determinao analtica de estanho (Sn) total em
soluo cida de sedimentos aps digesto. A determinao foi
executada em extratos de gua rgia/HF usando a eficincia do
paldio como modificador qumico. As variveis e nveis investi-
gados na etapa de triagem com o objetivo de definir o domnio
experimental so apresentados na Tabela 9. Foi executado um pla-
nejamento de dois nveis com quatro variveis, ou seja, 2
4
=16 ex-
perimentos. A resposta estudada foi a absorbncia.
Como se optou pela no realizao de repeties de todos os
experimentos, os autores tinham vrias alternativas de fazer a esti-
mativa conjunta do erro. A escolhida foi a realizao de trs
replicatas no ponto central (Figura 6), que realmente consistiu de
uma escolha adequada; no entanto, uma outra maneira seria no
realizar repetio alguma e estimar os erros a partir dos efeitos de
altas ordens, conforme apresentado na Figura 7.
Os autores optaram tambm por divulgar os resultados dos efei-
tos calculados na forma de uma ANOVA, entretanto outras maneiras
podem ser utilizadas, como aquelas apresentadas nas Figuras 6 e 7.
Observe que os resultados que apresentam os efeitos ou coefi-
cientes significativos so idnticos para as duas planilhas, no en-
tanto, diferenas de resultados podem ocorrer e, certamente, o pla-
nejamento em que se utilizaram replicatas no ponto central rela-
tivamente mais confivel. Os graus de liberdade so apresentados
nas planilhas entre parnteses junto ao t de Student.
O clculo dos coeficientes realizado pela planilha apresentada
na Figura 6 mostra apenas os coeficientes principais e suas
interaes at 2 ordem. Na realidade, clculos prvios foram rea-
lizados em outra planilha considerando todos os coeficientes prin-
cipais e de interaes. Observou-se, porm, que os coeficientes de
interao de 3 e 4 ordem no eram significativos e, assim, o cl-
culo destes coeficientes no necessrio e no foi realizado na
planilha apresentada. Neste caso o nmero de parmetros (p) di-
minuiu de 14 para 11, o que tem uma grande influncia sobre a
ANOVA pois, ao mesmo tempo em que o valor da mdia quadrtica
da regresso aumenta, o valor da mdia quadrtica dos resduos
diminui, o que contribui ainda mais para a significncia do mode-
lo, alm de torn-lo mais simples.
Pode-se concluir finalmente, que as variveis T
pir
, T
atom
e C
mod
Tabela 8. Anlise de varincia para regresso mltipla
Fonte de SQ Nde graus MQ F
variao de liberdade
Regresso SQ
regr
p 1 MQ
regr
MQ
regr
/MQ
res
Resduos SQ
res
n p MQ
res
Falta de ajuste SQ
faj
m p MQ
faj
MQ
faj
/MQ
ep
Erro Puro SQ
ep
n m MQ
ep
Total SQ
total
n 1
Tabela 9. Variveis experimentais para o planejamento fatorial
completo 2
4
Nveis
Variveis Cdigos (-) (+)
Temperatura de pirlise/ C T
pir
600 1400
Temperatura de atomizao/ C T
atom
1700 2500
Volume do modificador/ L
-1
V
mod
2 8
Concentrao do modificador/ mg L
-1
C
mod
0 1000
348 Quim. Nova Tefilo e Ferreira
nos nveis estudados so significativas a 95% de confiana, en-
quanto que a varivel V
mod
no apresentou influncia no sistema
e pode ser fixada em qualquer valor entre os dois nveis. Nor-
malmente ela fixada naquele valor que apresenta menor custo.
O valor do efeito da varivel T
atom
negativo, revelando que a
passagem do nvel menos (-) para o nvel mais (+) desta vari-
vel contribui para uma queda na resposta e, portanto, deve-se
estudar a regio do nvel mais baixo visto que o interesse a
maior resposta. Alm disso, as interaes T
pir
xT
atom
e T
pir
xC
mod
so
significativas e positivas. Pode se concluir, considerando as
interaes individualmente, que se obtm uma maior resposta quan-
do se trabalha simultaneamente no nvel mais (+) das duas vari-
veis. No entanto, para um caso especfico, recomenda-se avaliar os
grficos de mdias marginais
32
(no discutido neste trabalho), para
uma avaliao mais criteriosa das interaes de segunda ordem.
Pela ANOVA, pde-se observar que o modelo linear apresen-
tou um bom ajuste e regresso significativa, no entanto, como o
objetivo otimizar a resposta, um deslocamento para a regio ti-
ma foi executado atravs de um planejamento composto central,
estudando agora, somente as trs variveis significativas. O leitor
interessado poder obter os resultados finais buscando o trabalho
completo dos autores, disponvel na referncia citada.
Exemplo 2: Planejamento fatorial fracionrio
O arquivo necessrio para este exemplo o fracpc 1.0, que con-
tm o planejamento fatorial fracionrio empregado neste exemplo.
Ser descrito o planejamento fatorial fracionrio utilizado por
Dron et al.
33
.
Os autores tinham como objetivo adequar a microextrao por
fase slida com headspace (HS-SPME) para determinao de
metil terc-butil ter (MTBE) usando cromatografia gasosa com
deteco de ionizao em chama (FID). Planejamentos experimen-
tais foram aplicados para determinar as variveis significativas e
otimizar o processo de HS-SPME de MTBE em gua. As variveis
e nveis investigados na etapa de triagem so apresentados na Ta-
bela 10, com o objetivo de definir o domnio experimental. Foi
executado um planejamento de dois nveis e cinco variveis com
resoluo III, ou seja, 2
5-2
experimentos. A resposta investigada foi
a rea do pico. Os autores realizaram trs replicatas no ponto cen-
tral para realizar a estimativa do erro (Figura 8).
De acordo com a Figura 8, os contrastes principais C2 e C5 e
os contrastes de interao C25 e C124 so significativos a 95%
de confiana. No contraste C2, ocorre a mistura da varivel prin-
cipal X
2
com as interaes X
1
X
4
e X
3
X
4
X
5
. Observando que as
variveis X
1
, X
3
e X
4
no so significativas e apresentam baixos
valores de efeito, certamente o valor do contraste devido so-
mente influncia da varivel X
2
. Da mesma maneira, o valor do
contraste C5 tambm pode ser considerado como resultado da
influncia da varivel X
5
. O contraste C25 confirma o quanto as
variveis X
2
e X
5
so significativas. J o contraste C124, segura-
mente, levando em considerao sua alta ordem, significativo
devido presena da varivel X
2
em sua interao. Conclui-se,
portanto, que as variveis Temp e Sal so as mais importantes no
Figura 7. Exemplo 1: Planilha para clculos do planejamento fatorial completo
2
4
, que apresenta a estimativa do erro dos efeitos sem a realizao de replicatas
Tabela 10. Variveis e nveis experimentais para o planejamento
fatorial fracionrio 2
5-2
Nveis
Variveis Cdigos (-) (+)
(X
1
) Tempo de extrao/min Time 2 20
(X
2
) Temperatura/C Temp 24 60
(X
3
) Velocidade de agitao/rpm Agit 800 1200
(X
4
) Volume do headspace/mL HSvol 10 20
(X
5
) Concentrao salina/g L
-1
Sal 0 200
Figura 6. Exemplo 1: Planilha para clculos do planejamento fatorial
completo 2
4
, que apresenta a estimativa do erro atravs de replicatas no
ponto central e com a avaliao do modelo linear
Figura 8. Exemplo 2: Planilha para clculos do planejamento fatorial fracionrio
2
5
I
-
I
2
I
, apresentando a estimativa do erro atravs de replicatas no ponto central
349 Quimiometria II: Planilhas Eletrnicas para Clculos de Planejamentos Vol. 29, No. 2
processo da microextrao de MTBE nas condies estudadas.
As variveis Time, Agit e HSvol no apresentaram efeitos signifi-
cativos e devem ser fixadas em um nvel entre os estudados.
Ressalta-se aqui o ganho de tempo que os resultados deste pro-
cedimento proporcionaram para a anlise, alm da minimizao
do consumo de reagentes e da gerao de resduos.
Os autores, interessados em otimizar a microextrao, execu-
taram o planejamento composto central com as duas variveis mais
importantes obtidas na etapa de triagem.
Os resultados finais deste estudo podem ser encontrados no
trabalho completo dos autores, na referncia citada.
Exemplo 3: Planejamento composto central
O arquivo necessrio para este exemplo o CCD 1.0, que con-
tm a planilha utilizada neste estudo.
A metodologia de superfcie de resposta exemplificada utili-
zando o trabalho desenvolvido por Kukreja et al.
34
.
Os autores tinham como objetivo estabilizar a relao funcio-
nal entre os fatores (contedo de negro-de-fumo e leo vegetal) e
vrias propriedades como tempo de cura, dureza, mdulo de elas-
ticidade, resistncia trao, resistncia ao rasgo e ruptura no alon-
gamento. O timo seria encontrar o nvel de leo vegetal no com-
posto de maneira que tal nvel contribuisse como um agente de
acoplamento entre a interface negro-de-fumo borracha. Neste caso,
os autores obtiveram vrias respostas para um mesmo planejamen-
to, o que contribuiu para a otimizao simultnea das propriedades
em uma mesma regio experimental.
Como havia apenas dois fatores a serem estudados, a otimizao,
empregando o planejamento composto central, foi realizada sem a
passagem pela etapa de triagem. Com duas variveis, conforme Ta-
belas 6 e 7, so necessrios quatro experimentos no planejamento
fatorial, quatro experimentos nos pontos axiais e os autores optaram
pela realizao de duplicatas no ponto central, portanto, dez resulta-
dos experimentais foram necessrios para cada propriedade.
Neste trabalho, os autores no disponibilizaram diretamente as
respostas obtidas para cada propriedade, porm, eles forneceram
os valores dos coeficientes dos modelos e o planejamento usado.
Empregando a Equao 8 possvel calcular as respostas obtidas
e, para fins de exemplificao, foram adicionados erros aleatrios
normalizados sobre as mesmas (respostas na Figura 9) e, certa-
mente, os coeficientes obtidos aqui so ligeiramente diferentes
daqueles publicados no trabalho original.
O leitor pode confirmar os valores usados para atravs da
Equao 21.
A Tabela 11 apresenta os resultados obtidos para a propriedade
ruptura no alongamento. Observa-se que todos os coeficientes fo-
ram significativamente importantes com 95% de confiana, bem como
o modelo de regresso avaliado pela ANOVA. No houve falta de
ajuste do modelo, o que confirmado pela distribuio aleatria dos
resduos com baixas magnitudes em relao aos valores estimados.
A Figura 10 mostra a superfcie de resposta do modelo obtida
para a propriedade ruptura no alongamento. Atravs da superfcie
possvel concluir que com o aumento do contedo de leo no com-
posto de borracha ocorre um aumento na ruptura no alongamento;
no entanto, tal propriedade diminui e alcana um mnimo no ponto
central, seguido por um aumento com acrscimo do negro-de-fumo.
Uma explicao para o valor mnimo da ruptura no alongamento na
Tabela 11. Nveis empregados no planejamento composto central para duas variveis
Nveis
Variveis Cdigos (-1,414) (-) (0) (+) (+1,414)
(X
1
) Negro-de-fumo/phr NF 47,17 48,00 50,00 52,00 52,83
(X
2
) leo vegetal/phr OV 00,17 01,00 03,00 05,00 05,83
Figura 9. Exemplo 3: Planilha para clculos do planejamento composto
central com duas variveis
Figura 10. Exemplo 3: Superfcie de resposta para a propriedade ruptura
no alongamento
350 Quim. Nova Tefilo e Ferreira
regio do ponto central pode ser atribuda ao do acoplamento do
leo vegetal e formao de uma extenso mxima da ligao cru-
zada atravs da formao de ligaes qumicas e fsico-qumicas
entre a interface negro-de-fumo borracha. Certamente, o aumento
no alongamento ao redor do ponto central causado pela plastificao
das molculas de borracha pelo leo vegetal.
Os resultados para as outras propriedades estudadas e a conclu-
so geral do estudo podem ser obtidos da mesma maneira a partir do
trabalho completo dos autores, disponvel na referncia citada.
CONCLUSES
Em todos os computadores pessoais e programas testados, os
clculos foram realizados com rapidez e no ocorreram falhas,
exceto para a construo do grfico da superfcie de resposta. Isto
ocorreu visto que a planilha do pacote Openoffice 1.1.1 no
disponibiliza em sua biblioteca grfica malhas contnuas, no en-
tanto a superfcie construda, porm em barras descontnuas.
A montagem dos clculos em uma planilha eletrnica uma tare-
fa bastante simples e est ao alcance do leitor interessado. A versatili-
dade das planilhas permite implementar clculos tanto de planeja-
mentos experimentais usuais como de planejamentos que talvez nem
estejam disponveis em pacotes computacionais comerciais.
Assim, o uso das planilhas eletrnicas apresenta as seguintes
vantagens principais: h verses gratuitas de planilhas eletrnicas
tanto para sistemas operacionais Windows como Linux; o ambiente
das planilhas eletrnicas amigvel e seu uso, bastante fcil; clcu-
los de planejamentos experimentais so facilmente implementados
e controlados em seu ambiente oferecendo, ainda, facilidade de
visualizao das equaes e de adaptao para planejamentos espe-
cficos, como o caso do planejamento Doehlert ou planejamentos
de misturas; os programas de edio de planilhas eletrnicas forne-
cem internamente bibliotecas de algoritmos, inclusive estatsticos,
tornando possvel realizar a avaliao em tempo real dos coeficien-
tes, efeitos e modelos; grficos, tabelas e dados podem ser facilmen-
te construdos e transferidos para arquivos de textos e etc; o emprego
deste tipo de ferramenta no ensino de quimiometria pode contribuir
significativamente, uma vez que o estudante pode compreender a
realizao dos clculos e a obteno dos resultados, deixando-o mais
entusiasmado e convencido sobre o potencial destas ferramentas
35
.
Enfim, as planilhas eletrnicas vm enriquecer ainda mais as
ferramentas de clculos de planejamentos experimentais dispon-
veis para os profissionais interessados. Os potenciais deste tipo de
ferramenta so imensos e tarefa do usurio descobri-los.
AGRADECIMENTOS
Ao apoio financeiro do Conselho Nacional de Desenvolvimen-
to Cientfico e Tecnolgico CNPq e aos colegas A. Krell e G. A.
da Silva pela leitura do texto e valiosas sugestes, ao colega T. P.
Trindade pela colaborao na elaborao das planilhas e ao colega
E. Correa pela colaborao na elaborao do web site.
REFERNCIAS
1. Box, G. E. P.; Hunter, W. G.; Hunter, J. S.; Statistic for Experimenters: An
Introduction to Design, Data Analysis and Model Building, Wiley: New
York, 1978.
2. Barros Neto, B.; Scarminio, I. S.; Bruns, R. E.; Como fazer experimentos:
pesquisa e desenvolvimento na cincia e na indstria, 2
a
ed., Ed. Unicamp:
Campinas, 2002.
3. Lundstedt, T.; Seifert, E.; Abramo, L.; Theilin, B.; Nystrm, A.; Pettersen,
J.; Bergman, R.; Chemom. Intell. Lab. Syst. 1998, 42, 3.
4. http://www.statsoft.com, acessada em Novembro 2005.
5. http://www.camo.com, acessada em Novembro 2005.
6. http://www.statgraphics.com, acessada em Novembro 2005.
7. http://www.statease.com, acessada em Novembro 2005.
8. http://www. umetric.com, acessada em Novembro 2005.
9. http://www. minilab.com, acessada em Novembro 2005.
10. http://www. chemkeys.com/bra/index.htm, acessada em Novembro 2005.
11. http://openoffice.org.br, acessada em Novembro 2005.
12. http://www.microsoft.com, acessada em Novembro 2005.
13. http://lqta.iqm.unicamp.br, acessada em Novembro 2005
14. Plackett, R. L.; Burman, J. P.; Biometrika 1946, 33, 305.
15. Morgan, E.; Burton, K. W.; Church, P. A.; Chemom. Intell. Lab. Syst. 1989,
5, 283.
16. Langsrud, .; Ellekjaer, M. R.; Naes, T.; J. Chemom. 1994, 8, 205.
17. Myers, R. H.; Montgomery, D. C.; Response surface methodology, Wiley:
New York, 2002.
18. Box, G. E. P.; Draper, N. R.; Empirical Model-Building and Response
Surfaces, Wiley: New York, 1987.
19. Sundberg, R.; Chemom. Intell. Lab. Syst. 1994, 24, 1.
20. Schervish, M. J.; Am. Statist. 1996, 50, 203.
21. Christensen, R.; Analysis of variance, design and regression applied
statistical methods, CRC: New York, 2000.
22. Spiegel, R. M.; Estatstica, LTC: Rio de Janeiro, 1967.
23. Box, G. E. P.; Wilson, K. B.; J. Roy. Statist. Soc., Ser. B 1951, 13, 1.
24. Doehlert, D. H.; Appl. Statist. 1970, 19, 231.
25. Ferreira, S. L. C.; Santos, W. N. L. dos; Quintella, C. M.; Neto, B. B.;
Bosque-Sendra, J. M.; Talanta 2004, 63, 1061.
26. Massart, D. L.; Vandeginste, B. G. M.; Buydens, L. M. C.; Jong, S.; Lewi,
P. J.; Smeyers-Verbeke, J.; Handbook of Chemometrics and Qualimetrics,
Part A, Elsevier: Amsterdam, 1998.
27. Garca-Campaa, A. M.; Rodrguez, L. C.; Gonzlez, A. L.; Barrero, F.
A.; Ceba, M. R.; Anal. Chim. Acta 1997, 348, 237.
28. http://fedora.redhat.com, acessada em Outubro de 2004.
29. Matlab, The Language of Technical Computing; Natick, USA, 2003.
30. Statistica, Data Analysis Software System; Tulsa, USA, 2001.
31. Arambarri, I.; Garcia R.; Milln, E.; Analyst 2000, 125, 2084.
32. Milliken, G.A.; Johnson, D. E.; Analysis of Messy Data, van Nostrand
Reinhold, Co.: New York, 1984, vol. 1.
33. Dron, J.; Garcia, R.; Milln, E.; J. Chromatogr., A 2002, 963, 259.
34. Kukreja, T. R.; Kumar, D.; Prasad, K.; Chauhan, R. C.; Choe, S.; Kundu,
P. P.; Eur. Polym. J. 2002, 38, 1417.
35. Tefilo, R. F.; Bruns, R. E; Ferreira, M. M. C.; Resumos da 27 Reunio
Anual da Sociedade Brasileira de Qumica, Salvador, Brasil, 2004.

You might also like