You are on page 1of 9

PROJ.

LIN

Page 1 sur 9

Excel > Referncia de funo > Estatstica

PROJ.LIN
Mostrar tudo
Calcula as estatsticas para uma linha usando o mtodo de "mnimos quadrados" para calcular uma linha reta que
melhor se ajusta aos seus dados e retorna uma matriz que descreve a linha. Voc pode combinar PROJ.LIN com
outras funes para calcular as estatsticas para outros tipos de modelos que so lineares nos parmetros
desconhecidos, incluindo polinomial, logaritmo, exponencial e srie de potncia. Uma vez que a funo retorna uma
matriz de valores, ela deve ser inserida como uma frmula de matriz.
A equao para a linha :
y = mx + b ou
y = m1x1 + m2x2 + ... + b (se existirem mltiplos intervalos de valores de x)
onde o valor de y dependente uma funo dos valores de x independentes. Os valores de m so coeficientes que
correspondem a cada valor de x, e b um valor constante. Observe que y, x e m podem ser vetores. A matriz
retornada por PROJ.LIN {mn.mn-1.....m1.b}. PROJ.LIN tambm pode retornar dados estatsticos de regresso
adicionais.
Sintaxe
PROJ.LIN(val_conhecidos_y;val_conhecidos_x;constante;estatstica)
Val_conhecidos_y o conjunto de valores y que voc j conhece na relao y = mx + b.

Se a matriz val_conhecidos_y estiver em uma nica coluna, cada coluna de val_conhecidos_x ser
interpretada como uma varivel separada.
Se a matriz val_conhecidos_y estiver uma nica linha, cada linha de val_conhecidos_x ser interpretada como
uma varivel separada.
Val_conhecidos_x um conjunto opcional de valores x que voc j deve conhecer na relao y = mx + b.

A matriz val_conhecidos_x pode incluir um ou mais conjuntos de variveis. Se apenas uma varivel for usada,
val_conhecidos_y e val_conhecidos_x podem ser intervalos de qualquer formato, desde que tenham
dimenses iguais. Se mais de uma varivel for usada, val_conhecidos_y deve ser um vetor (ou seja, um
intervalo com altura de uma linha ou largura de uma coluna).
Se val_conhecidos_x for omitido, pressupe-se que a matriz {1,2,3,...} seja do mesmo tamanho que
val_conhecidos_y.
Constante um valor lgico que fora ou no a constante b a se igualar a 0.

Se constante for VERDADEIRO ou omitido, b ser calculado normalmente.

ms-help://MS.EXCEL.12.1046/EXCEL/content/HP10069838.htm

07/12/2008

PROJ.LIN

Page 2 sur 9

Se constante for FALSO, b ser definido como 0 e os valores de m sero ajustados para que y = mx.
Estatstica o valor lgico que especifica se estatsticas de regresso adicionais sero retornadas.

Se estatstica for VERDADEIRO, PROJ.LIN retornar dados estatsticos de regresso adicionais, de forma
que a matriz retornada seja {mn.mn-1.....m1.b;sen.sen-1.....se1.seb;r2.sey;F.df;ssreg.ssresid}.
Se estatstica for FALSO ou omitido, PROJ.LIN retornar apenas os coeficientes m e a constante b.
Os dados estatsticos de regresso adicionais so:
Dados
estatsticos

Descrio

se1.se2.....sem

Os valores de erro padro para os coeficientes m1.m2.....mn.

seb

Os valores de erro padro para a constante b (seb = #N/D quando constante FALSO).

r2

O coeficiente de determinao. Compara valores de y estimados e reais e seu valor varia entre 0
e 1. Se for igual a 1, existir uma correlao perfeita na amostra no haver diferena entre os
valores de y estimados e os valores reais. Por outro lado, se o coeficiente de determinao for
igual a 0, a equao de regresso no ter utilidade para prever um valor de y. Para obter mais
informaes sobre como r2 calculado, consulte "Comentrios" mais adiante neste tpico.

Sey
F

O valor de erro para a estimativa de y.


A estatstica F, ou o valor de F observado. Use a estatstica F para determinar se a relao
observada entre as variveis dependentes e independentes ocorre por acaso.

Df

Os graus de liberdade. Use os graus de liberdade para ajud-lo a encontrar os valores F crticos
em uma tabela estatstica. Compare os valores encontrados na tabela com a estatstica F
retornada por PROJ.LIN para determinar um nvel de confiana para o modelo. Para obter mais
informaes sobre o clculo de df, consulte " Comentrios" mais frente, neste tpico. O
exemplo 4 apresentado abaixo mostra a utilizao de F e de df.

Ssreg

A soma dos quadrados da regresso.

Ssresid

A soma residual dos quadrados. Para obter informaes sobre como ssreg e ssresid so
calculadas, consulte "Comentrios" mais frente, neste tpico.

A ilustrao a seguir mostra a ordem em que os dados estatsticos adicionais so fornecidos.

Comentrios

Voc pode descrever qualquer linha reta com a inclinao e o ponto de origem y:
Inclinao (m):
Para calcular a inclinao de uma linha, freqentemente representada por m, use dois pontos da linha, (x1,y1)
e (x2,y2); a inclinao ser igual a (y2 - y1)/(x2 - x1).

ms-help://MS.EXCEL.12.1046/EXCEL/content/HP10069838.htm

07/12/2008

PROJ.LIN

Page 3 sur 9

Intercepto de y (b):
O intercepto de y de uma linha, freqentemente representado por b, o valor de y no ponto em que a linha
cruza o eixo y.
A equao de uma linha reta y = mx + b. Uma vez fornecidos os valores de m e de b, voc pode calcular
qualquer ponto na linha inserindo o valor de y ou de x nessa equao. Voc pode tambm usar a funo
TENDNCIA.
Quando voc tiver apenas uma varivel de x independente, poder obter os valores de inclinao e de
intercepto de y diretamente, usando as frmulas a seguir:
Inclinao:
NDICE(PROJ.LIN(val_conhecidos_y;val_conhecidos_x);1)
Ponto de origem y:
NDICE(PROJ.LIN(val_conhecidos_y;val_conhecidos_x);2)
A preciso da linha calculada por PROJ.LIN depender do grau de disperso dos seus dados. Quanto mais
lineares forem os dados, mais preciso ser o modelo de PROJ.LIN. PROJ.LIN usa o mtodo dos mnimos
quadrados para determinar o ajuste perfeito aos seus dados. Quando voc tiver apenas uma varivel
independente, os clculos para m e b sero baseados nas frmulas a seguir:

onde x and y so exemplos de mdia, ou seja, x = MDIA(val_conhecidos_x) e y = MDIA(val_conhecidos_y).


As funes de ajuste de linha e de curva PROJ.LIN e PROJ.LOG podem calcular a linha reta ou a curva
exponencial que se ajustem perfeitamente aos seus dados. No entanto, voc ter que decidir qual dos dois
resultados melhor se adapta aos seus dados. Voc pode calcular TENDNCIA
(val_conhecidos_y;val_conhecidos_x) para uma linha reta, ou CRESCIMENTO
(val_conhecidos_y;val_conhecidos_x) para uma curva exponencial. Essas funes, sem o argumento
novos_valores_x, retornaro uma matriz dos valores de y estimados ao longo da linha ou da curva, de acordo
com seus pontos de dados reais. Ento, voc poder comparar os valores previstos com os valores reais.
Alm disso, possvel represent-los graficamente para uma comparao visual.
Na anlise de regresso, o Microsoft Excel calcula a diferena de quadrados entre o valor y estimado e o valor
y real para cada ponto. A soma dessas diferenas de quadrados chamada de soma dos quadrados de
resduo, ssresid. O Microsoft Excel calcula a soma total dos quadrados. Quando const for igual a
VERDADEIRO ou for omitido, a soma total dos quadrados ser a soma das diferenas dos quadrados entre
os valores y reais e a mdia dos valores y. Quando const for igual a FALSO, a soma total dos quadrados ser
a soma de quadrados dos prprios valores de y (sem subtrair a mdia dos valores de y de cada valor de y
individual). A soma da regresso dos quadrados, ssreg, pode ser obtida de: ssreg = sstotal - ssresid. Quanto
menor for a soma de quadrados de resduo, comparada com a soma de quadrados total, maior ser o valor do
coeficiente de determinao, r2, que indica a preciso com que a equao resultante da anlise de regresso
descreve a relao entre as variveis. r2 igual a ssreg/sstotal.

ms-help://MS.EXCEL.12.1046/EXCEL/content/HP10069838.htm

07/12/2008

PROJ.LIN

Page 4 sur 9

Em alguns casos, uma ou mais colunas de X (supondo que os Ys e Xs estejam em colunas) podem ter
valores previsveis adicionais na presena de outras colunas de X. Em outras palavras, se forem eliminadas
uma ou mais colunas de X, poderemos chegar a valores previsveis de Y com a mesma preciso. Nesse caso,
as colunas de X redundantes devem ser omitidas no modelo de regresso. Esse fenmeno chamado de
colinearidade porque qualquer coluna de X redundante pode ser expressa como uma soma dos mltiplos
das colunas de X no-redundantes. PROJ.LIN verifica a colinearidade e remove as colunas de X redundantes
do modelo de regresso quando as identifica. As colunas de X removidas podem ser reconhecidas no
resultado de PROJ.LIN como tendo 0 coeficiente assim como 0 ses. Se uma ou mais colunas forem
removidas como redundantes, df ser afetada porque depende do nmero de colunas de X realmente
utilizadas para fins previsveis. Para obter mais detalhes sobre o clculo de df, consulte o Exemplo 4 abaixo.
Se df for alterada porque as colunas de X redundantes foram removidas, os valores de sey e F tambm sero
afetados. Na prtica, a colinearidde dever ser relativamente rara. Contudo, um caso em que sua ocorrncia
ser mais provvel quando algumas colunas de X contiverem somente 0s e 1s indicando se um dado um
experimento ou se no faz parte de um determinado grupo. Se const for igual a VERDADEIRO ou for omitido,
PROJ.LIN ir inserir uma coluna de X adicional de 1s para modelar a interceptao. Se voc tiver uma coluna
com um 1 para cada dado se masculino, ou 0 se no for, voc tambm ter uma coluna com um 1 para cada
dado se for feminino e 0 se no for. Essa segunda coluna ser redundante porque suas informaes podero
ser obtidas pela subtrao da entrada da coluna indicador de masculino da entrada da coluna adicional de
1s adicionada por LINEST.
df calculada da seguinte maneira quando nenhuma coluna de X removida do modelo devido
colinearidade: se houver k colunas de _xs conhecidos e const = VERDADEIRO ou omitido, ento df = n k
1. Se const = FALSO, ento df = n - k. Em ambos os casos, cada coluna de X removida devido a
colinearidade aumentar df em 1.
As frmulas que retornam matrizes devem ser inseridas como frmulas de matriz.
Ao inserir a constante de uma matriz como valores_conhecidos_x em forma de argumento, use pontos para
separar valores na mesma linha e pontos-e-vrgulas para separar linhas. Os caracteres de separao podem
ser diferentes dependendo das configuraes do local em Opes Regionais e de Idiomas no Painel de
Controle.
Voc deve observar que os valores de y estimados pela equao de regresso podem no ser vlidos se
estiverem fora do intervalo de valores de y usado para determinar a equao.
O algoritmo de base utilizado na funo PROJ.LIN diferente do algoritmo de base utilizado nas funes
INTERCEPO e INCLINAO. A diferena entre esses algoritmos pode levar a diferentes resultados
quando os dados forem indeterminados e colineares. Por exemplo, se os pontos de dados do argumento
val_conhecidos_y forem 0 e os pontos de dados do argumento val_conhecidos_x forem 1:
PROJ.LIN retorna um valor de 0. O algoritmo PROJ.LIN foi desenvolvido para retornar resultados
razoveis para dados colineares e nesse caso no mnimo uma resposta ser encontrada.
INCLINAO e INTERCEPO retornaro um erro #DIV/0!. O algoritmo INCLINAO e
INTERCEPO foi desenvolvido para procurar somente uma resposta, e nesse caso poder haver
mais de uma resposta.
Alm de usar PROJ.LOG para calcular estatsticas para outros tipos de regresso, voc deve usar PROJ.LIN
para calcular o intervalo de outros tipos de regresso ao inserir funes de variveis x e y como sries x e y
do PROJ.LIN. Por exemplo, a frmula a seguir:

ms-help://MS.EXCEL.12.1046/EXCEL/content/HP10069838.htm

07/12/2008

PROJ.LIN

Page 5 sur 9

=PROJ.LIN(valores y, valores x^COLUNA($A:$C))


funciona quando voc tem uma nica coluna de valores y e uma nica coluna de valores x para calcular a
aproximao cbica (polinomial de ordem 3) do formato:
y = m1*x + m2*x^2 + m3*x^3 + b
Voc pode ajustar essa frmula para calcular outros tipos de regresso, mas em alguns casos necessrio o
ajuste dos valores de sada e outras estatsticas.
Exemplo 1 Inclinao e Intercepto de Y
Talvez seja mais fcil de compreender o exemplo se voc copi-lo para uma planilha em branco.
Como copiar um exemplo

Y conhecido

X conhecido

Frmula

Frmula

=PROJ.LIN(A2:A5;B2:B5;FALSO)

OBSERVAO

A frmula no exemplo deve ser inserida como uma frmula de matriz. Aps copiar o exemplo para

uma planilha em branco, selecione o intervalo A7:B7 iniciando com a clula de frmula. Pressione F2 e, em seguida,
pressione CTRL+SHIFT+ENTER. Se a frmula no for inserida como uma frmula de matriz, o nico resultado ser 2.
Quando inserida como uma matriz, a inclinao (2) e o ponto de origem y (1) so retornados.
Exemplo 2 Regresso Linear Simples
Talvez seja mais fcil de compreender o exemplo se voc copi-lo para uma planilha em branco.
Como copiar um exemplo

Ms

Vendas

3100

4500

4400

5400

7500

ms-help://MS.EXCEL.12.1046/EXCEL/content/HP10069838.htm

07/12/2008

PROJ.LIN

Page 6 sur 9

8100

Frmula

Descrio (resultado)

=SOMA(PROJ.LIN(B2:B7; A2:A7)*{9;1})

Vendas estimadas para o nono ms (11000)

Geralmente, SOMA({m.b}*{x.1}) igual a mx + b, o valor de y estimado para um determinado valor de x. Voc tambm
pode usar a funo TENDNCIA.
Exemplo 3 Regresso Linear Mltipla
Suponha que um empresrio esteja pensando em comprar um grupo de prdios de salas comerciais em um bairro
comercial.
O empresrio pode usar a anlise de regresso linear mltipla para fazer uma estimativa do valor de um prdio em
uma determinada rea, de acordo com as variveis a seguir.
Varivel

Refere-se a

Valor estimado do prdio

x1

rea til em metros quadrados

x2

Nmero de salas

x3

Nmero de entradas

x4

Idade do prdio em anos

Este exemplo considera que existe uma relao de linha reta entre cada uma das variveis independentes (x1, x2, x3,
e x4) e a varivel dependente (y), o valor dos prdios comerciais no bairro.
O empresrio escolhe aleatoriamente uma amostra de 11 prdios a partir de um conjunto de 1500 prdios possveis e
obtm os seguintes dados. "Meia entrada" significa que o prdio s dispe de uma entrada para entregas.
Talvez seja mais fcil de compreender o exemplo se voc copi-lo para uma planilha em branco.
Como copiar um exemplo

Salas

Entradas

Idade

Valor

rea til (x1)

(x2)

(x3)

(x4)

estimado (y)

2310

20

142.000

2333

12

144.000

2356

1,5

33

151.000

2379

43

150.000

2402

53

139.000

2425

23

169.000

2448

1,5

99

126.000

1
2
3
4
5
6
7
8
9

ms-help://MS.EXCEL.12.1046/EXCEL/content/HP10069838.htm

07/12/2008

PROJ.LIN

Page 7 sur 9

10

2471

34

142.900

11

2494

23

163.000

12

2517

55

169.000

2540

22

149.000

Frmula
=PROJ.LIN
(E2:E12;A2:D12;VERDADEIRO;VERDADEIRO)

OBSERVAO

A frmula no exemplo deve ser inserida como uma frmula de matriz. Aps copiar o exemplo para

uma planilha em branco, selecione o intervalo A14:E18 iniciando com a clula de frmula. Pressione F2 e, em
seguida, pressione CTRL+SHIFT+ENTER. Se a frmula no for inserida como uma frmula de matriz, o nico
resultado ser -234,2371645.
Quando inseridas como uma matriz, as estatsticas de regresso a seguir so retornadas. Use esta tecla para
identificar a estatstica desejada.

A equao de regresso mltipla, y = m1*x1 + m2*x2 + m3*x3 - m4*x4 + b, pode ser obtida usando os valores da linha
14:
y = 27.64*x1 + 12,530*x2 + 2,553*x3 - 234.24*x4 + 52,318
Agora, o empresrio poder fazer uma estimativa do valor para um prdio na mesma rea com 272 metros
quadrados, trs salas e duas entradas, e que tem 25 anos de idade, usando a seguinte equao:
y = 27,64*272 + 12.530*3 + 2.553*2 - 234,24*25 + 52.318 = $158.261
Ou copiar a tabela a seguir na clula A21 da pasta de trabalho de exemplo.
rea til (x1)

Salas (x2)

Entradas (x3)

Idade (x4)

Valor estimado (y)

2500

25

=D14*A22 + C14*B22 + B14*C22 + A14*D22 + E14

Voc tambm pode usar a funo TENDNCIA para calcular este valor.
Exemplo 4 Usando as estatsticas F e r2
No exemplo anterior, o coeficiente de determinao, ou r2, 0,99675 (consulte a clula A17 no resultado para
PROJ.LIN), o que indica uma forte relao entre as variveis independentes e o preo de venda. Voc pode usar a
estatstica F para determinar se esses resultados, com um valor de r2 to alto, ocorreram por acaso.
Suponha, por agora, que na verdade no h relao entre as variveis, mas que voc selecionou uma amostra rara
de 11 prdios que far com que a anlise estatstica demonstre uma forte relao. O termo "Alfa" usado para indicar

ms-help://MS.EXCEL.12.1046/EXCEL/content/HP10069838.htm

07/12/2008

PROJ.LIN

Page 8 sur 9

a probabilidade de se concluir erroneamente que existe uma relao.


F e df no resultado de LINEST pode ser usado para avaliar a probabilidade de ocorrer um valor mais alto de F por
acaso. F pode ser comparado a valores crticos em tabelas de distribuio F publicadas ou o FDIST do Excel pode ser
usado para calcular a probabilidade de ocorrer um valor de F maior por acaso. A distribuio apropriada de F possui
graus v1 e v2 de liberdade. Se n for o nmero de pontos de dados e const = VERDADEIRO ou omitido, ento v1 = n
df 1 e v2 = df. (Se const = FALSO, ento v1 = n df and v2 = df.) O FDIST(F,v1,v2) do Excel retornar a
probabilidade de ocorrer um valor de F mais alto por acaso. No Exemplo 4, df = 6 (clula B18) e F = 459.753674
(clula A18).
Supondo um valor de Alpha igual a 0.05, v1 = 11 6 1 = 4 e v2 = 6, o nvel crtico de F e 4.53. Como F =
459.753674 muito mais alto do que 4.53, extremamente improvvel que um valor de F to alto tenha ocorrido por
acaso (Com Alpha = 0.05, a hiptese de que no h relao entre os ys conhecidos e os xs conhecidos deve ser
rejeitada quando F excede o nvel crtico, 4.53.) Utilizando o FDIST do Excel voc pode obter a probabilidade de que
um valor F dessa magnitude tenha ocorrido por acaso. FDIST(459.753674, 4, 6) = 1.37E-7, uma probabilidade
extremamente baixa. Voc pode concluir, seja encontrando o nvel crtico de F em uma tabela ou usando FDIST do
Excel, que a equao de regresso til na previso do valor avaliado de prdios comerciais nesta rea. Lembre-se
que crtica a utilizao dos valores corretos de v1 e v2 calculados no pargrafo anterior.
Exemplo 5 Calculando o dado estatstico t
Outro teste hipottico pode determinar se um coeficiente de inclinao til para prever o valor estimado de um
prdio no exemplo 3. Por exemplo, para testar o coeficiente de idade para significncia estatstica, divida -234,24
(coeficiente de idade da inclinao) por 13,268 (o valor de erro estimado para os coeficientes de idade na clula A15).
A equao a seguir representa o valor de t observado:
t = m4 se4 = -234,24 13,268 = -17,7
Se o valor absoluto de t for suficientemente alto, poderemos concluir que que o eficiente da curva til na estimativa
do valor avaliado de um prdio comercial no Exemplo 3. A tabela abaixo mostra os valores absolutos dos 4 valores
observados de t.
Se consultar uma tabela em um manual de estatstica, voc descobrir que o valor t crtico e bicaudal com 6 graus de
liberdade e Alfa = 0,05 2,447. Este valor crtico tambm pode ser obtido por meio da funo TINV do Excel. TINV
(0.05,6) = 2.447. Na medida em que o valor t absoluto 17,7 maior que 2,447, a idade ser uma varivel importante
para prever o valor estimado de um prdio. Cada uma das outras variveis independentes pode ser testada para valor
estatstico de maneira semelhante. Na tabela a seguir, encontram-se os valores t observados para cada varivel
independente:
Varivel

valor de t observado

rea til

5,1

Nmero de salas

31,3

Nmero de entradas

4,8

Idade

17,7

Todos esses valores apresentam um valor absoluto maior que 2,447; dessa forma, todas as variveis usadas na
equao de regresso sero teis para prever o valor estimado dos prdios dessa rea.

Consulte tambm

ms-help://MS.EXCEL.12.1046/EXCEL/content/HP10069838.htm

07/12/2008

PROJ.LIN

Page 9 sur 9

CRESCIMENTO
Funes estatsticas
PROJ.LOG
TENDNCIA

ms-help://MS.EXCEL.12.1046/EXCEL/content/HP10069838.htm

07/12/2008

You might also like