You are on page 1of 16

Televisão Digital e HDTV – TV de Alta Definição

PSI-2222 - Práticas de Eletricidade e Eletrônica II – EPUSP

Prof. Guido Stolfi – Departamento de Telecomunicações e Controle – PTC


08/2004

1. Evolução Tecnológica e Motivações


Se traçarmos um paralelo entre a evolução do cinema e da televisão, vemos que o progresso de um sempre
impulsionou desenvolvimentos no outro. Desde a invenção do kinetoscópio por Thomas Edison em 1890, até a
implantação da TV de alta definição por satélite, ambos os formatos têm progredido de forma entrelaçada. Na tabela
abaixo, estão apresentados alguns marcos que podem ser ressaltados na evolução destas tecnologias.

Cinema TV
1884 – Varredura de Imagens por discos
1890 – “Kinetoscópio” permite rotativos (Paul Nipkov)
visualização de imagens em movimento
(Thomas Edison)
1895 – Cinematógrafo proporciona
projeção de imagens em telas de grandes 1900 – Conceito de “Televisão” (Constantin
dimensões (Irmãos Lumiére) Persky)
1925 – Primeiras transmissões de TV (J.
1926 – Cinema Falado (Lee de Forest) Baird, C. Jenkins)
1928 – Transmissões comerciais de TV
(Hugo Gernsback)
1939 – Cinema a Cores (Siegrist , Fisher)
1940 – Testes de transmissão de TV a cores
1941 – Transmissões no padrão “M” (CBS)
1951 – Cinema “Wide Screen” – 1948 – Padrão de 50 Hz / 625 linhas é
Cinerama (Fred Walker) adotado na Europa
1952 – Cinema em 3 dimensões com 1952 – Transmissão de TV em UHF
polarizadores; “Wide Screen” anamórfico 1953 – TV a Cores padrão NTSC (RCA)
(Cinemascope)
1965 – Sitema PAL de transmissão de TV a
1970 – Cinema formato IMAX Cores
1986 – Transmissão de som estéreo na TV
(BTSC)
1989 – Sistema Hi-Vision (NHK)

Após a introdução da TV a cores, em 1953, o formato da TV manteve-se praticamente inalterado até os nossos dias.
Um televisor fabricado naquela época é compatível com o sinal transmitido hoje, e vice-versa. Essa relativa
estagnação da tecnologia culminou, na década de 80, em uma situação de baixa lucratividade, patentes expiradas,
concorrência acirrada entre fabricantes de equipamentos e saturação do espectro de radiodifusão disponível. Some-
se a isso um certo desinteresse do espectador, devido à incompatibilidade com o formato “Wide Screen”, adotado
pela indústria cinematográfica desde os anos 50. Como resposta a esse quadro, estamos presenciando a implantação
de uma nova geração de sistemas de TV: a Televisão Digital e a TV de Alta Definição.

2. Elementos de Sistemas de Televisão

2.1 Amostragem de uma Imagem em Movimento


Uma imagem pode ser entendida como uma projeção óptica de uma região do espaço sobre um plano. Podemos
descrever essa projeção, de uma imagem em movimento, como uma função contínua de três variáveis:

u = f (x, y, t) (luminosidade × dimensão horizontal, vertical e temporal).

Televisão Digital e HDTV 1


No entanto, um sinal elétrico, na forma pela qual pode ser transmitido por um canal de comunicação convencional,
é unidimensional (voltagem × tempo). No caso da televisão, os processos de amostragem e varredura são
utilizados para reduzir a dimensionalidade daquela representação, criando um sinal análogo unidimensional.
1. Amostragem temporal: divisão da imagem em fotogramas
ou quadros (“frames”) sucessivos (processo já usado no
cinema).
2. Amostragem Espacial (Varredura, ou "Raster Scan"):
divisão da imagem em linhas horizontais, ao longo das
quais é feita a medida da luminosidade. O sinal temporal
resultante, proporcional à luminosidade de cada ponto da
linha, é denominado sinal de vídeo.
Este processo ocorre em uma câmara de TV convencional: a
imagem é projetada por um sistema de lentes sobre uma
superfície foto-sensível, na qual o iluminamento resultante gera Tempo
uma distribuição de cargas elétricas. Estas cargas são extraídas
seqüencialmente por um processo adequado, produzindo uma
Varredura e Amostragem Temporal
corrente elétrica proporcional ao iluminamento em cada ponto
dessa superfície.

2.2 Dimensionamento dos Parâmetros da Televisão


As características técnicas dos sistemas de TV convencionais são conseqüência de três fatores básicos:
•Aplicação: o que deve ser mostrado na imagem, qual a função do sistema;
•Percepção Visual: o que o olho humano consegue discernir na imagem;
•Limitações Tecnológicas: o que é viável de ser implementado, seja nos equipamentos ou no processo de
transmissão.
Quanto à aplicação, definiu-se que uma característica necessária para viabilizar comercialmente a TV seria a
capacidade de visualizar o rosto de uma pessoa, na distância típica em que essa pessoa estaria presente no ambiente,
como interlocutora. Dessa forma, seria passada a ilusão de que o ator estaria presente no ambiente do espectador.

A Aplicação da Televisão

Esse critério leva ao dimensionamento da dimensão aparente necessária para a imagem de TV. Além disso,
considerando que grande parte do material a ser veiculado pela TV consistiria de filmes cinematográficos, foi
adotada a mesma proporção (na época) de 4 : 3 (largura : altura) para a imagem de TV. Por estes critérios, a
imagem da televisão deve subentender um ângulo de cerca de 11 graus no sentido horizontal e 8 graus no sentido
vertical.
Considerando agora que a acuidade da visão humana é da ordem de 1 minuto de grau (capacidade limite de
separação entre elementos distintos), chega-se à conclusão que a imagem pode ser representada adequadamente por
um conjunto de aproximadamente 480 x 640 elementos de imagem (ou pixels, de picture elements).

Televisão Digital e HDTV 2


L = 640 pontos
Elemento de
Imagem (pixel)

1 minuto
A = 480 de grau
linhas

L/A = 4/3
D=7xA

Outro critério relacionado à percepção visual é a necessidade da apresentação seqüencial de pelo menos 20 imagens
por segundo para proporcionar ilusão de movimento. Já para evitar sensação de cintilação, ou flutuação de
luminosidade da imagem, são necessárias pelo menos 50 a 60 imagens por segundo.
Considerando critérios técnicos de interferência com a rede elétrica, adotou-se 60 imagens por segundo nos países
onde a energia elétrica é distribuída em 60 Hz (EUA, Japão, Canadá, Brasil, etc.) e 50 imagens por segundo nos
países de 50 Hz (Europa, África, Ásia, América Latina, etc.).

2.3 Transmissão de TV: Ocupação Espectral


No caso de 60 Hz, a transmissão de um sinal de TV exige a manipulação de 480 linhas x 60 imagens = 28.800
linhas por segundo. Como cada linha possui 640 elementos de imagem, são no total 18.432.000 elementos por
segundo.
A maior freqüência necessária na transmissão de um sinal de vídeo, nesse caso, ocorre quando tivermos uma
seqüência de elementos alternadamente pretos e brancos. Nesse caso, cada elemento corresponde a ½ ciclo da forma
de onda resultante. A freqüência máxima será, portanto,

1
f max = × 640 × 480 × 60 = 9,2 MHz
2
Este valor é muito elevado, sendo considerado impraticável para a tecnologia da época.
Os critérios de viabilidade tecnológica foram satisfeitos pela introdução de duas inovações: Entrelaçamento e
Modulação AM Vestigial.

2.3.1 Entrelaçamento
Este processo consiste em descartar as linhas pares ou ímpares,
alternadamente, em imagens sucessivas. Assim sendo, cada imagem
transmitida consistirá de um campo (par ou ímpar) com 240 linhas,
sendo que dois campos consecutivos constituem um “quadro”
completo.
Assim sendo, a freqüência máxima cairia para 4,6 MHz. Na prática,
outros fatores devem ser considerados, tais como o intervalo de
retraço (regiões invisíveis nas partes superior e lateral da imagem). O
valor padronizado hoje é de 4,2 MHz.

2.3.2 Modulação AM Vestigial


Um sinal contendo componentes até 4,2 MHz ocupa o dobro de banda quando modulado em AM. Para reduzir a
demanda espectral, é usada a modulação AM-VSB (Vestigial Side Band), que consiste na remoção de parte do
espectro do sinal modulado, através de filtros.

Televisão Digital e HDTV 3


No caso da TV, as freqüências que estiverem afastadas mais de 750 kHz abaixo da portadora são removidas; deste
modo, o sinal de TV pode ser transmitido por um canal de 6 MHz, incluindo uma portadora modulada em FM com
o sinal de áudio.

Vídeo Composto
(Banda Base)

0 4,2 MHz
Modulação AM

-4,2 MHz fo +4,2 MHz

Modulação VSB
+ Áudio
+4,5 MHz
-0,75 MHz

Modulação AM Vestigial Espectro Típico de um Sinal de TV

2.4 Contexto da Radiodifusão Analógica - Alocação de Canais


Por razões históricas e tecnológicas, o espectro reservado à radiodifusão terrestre (no Brasil, EUA e vários outros
países) é composto de 2 bandas em VHF (54 a 88 MHz para os canais 2 a 6, com um "gap" de 4 MHz entre o 4 e 5,
e 174 a 216 MHz para os canais 7 a 13) e uma banda em UHF (470 a 806 MHz para os canais 14 a 69). As
freqüências de 806 a 890 MHz, originalmente destinadas aos canais 70 a 83, foram realocadas para telefonia móvel
celular no início da década de 80.
A alocação de canais para emissoras de TV em uma determinada localidade está sujeita a restrições devidas às
características de seletividade e respostas espúrias dos receptores de TV convencionais. Como a seletividade dos
receptores analógicos é insuficiente para rejeitar transmissões em canais adjacentes, bem como em canais próximos
às freqüências imagens (distanciadas de 2 vezes a freqüência interrmediária) e outros espúrios, surgem uma série de
restrições para o aproveitamento pleno do espectro de radiodifusão. Numa determinada localidade, sendo que exista
transmissão em um canal N, há uma série de canais que não poderão ser utilizados, sob pena de provocarem
interferências no canal N:

Canal transmitindo Canais Sujeitos a Interferência (UHF)

N N-1, N+1, N+7, N+8, N+14, N+15

Considerando a baixa eficiência de ocupação espectral da transmissão analógica, o avanço da tecnologia de


telefonia celular foi considerado uma ameaça à expansão do serviço de radiodifusão de TV. Nos EUA, grupos
empresariais da área decidiram contra-atacar, solicitando à FCC (Federal Communications Commission,
equivalente à Anatel) a liberação de mais espectro para TV, que seria utilizado na veiculação de um novo serviço: a
TV de Alta Definição.

3. TV de Alta Definição: o Sistema Hi-Vision


Pesquisas feitas no Japão pela NHK, na década de 70, identificaram a viabilidade de um formato de TV capaz de
proporcionar “uma nova experiência visual” ao espectador, similar à sensação conferida pelo cinema de tela larga.
Estas pesquisas culminaram com a adoção de uma imagem com proporções de 16:9, dimensionada para
visualização sob um ângulo horizontal de 30 graus, formato este denominado Hi-Vision.

Televisão Digital e HDTV 4


Este formato (atualmente classificado como HDTV ou TV de Alta Definição), além de aproveitar melhor o material
cinematográfico disponível em tela larga, abrangeria ainda parte do campo de visão periférica do observador, o que
proporciona um nível mais intenso de ilusão de realidade.
O ângulo visual aproximado de 10 graus da TV convencional abrange a chamada visão central do observador. É a
parte da visão mais sensível a detalhes e à cor. A visão periférica, por outro lado, possui maior sensibilidade ao
movimento, e contribui para a sensação de equilíbrio do espectador.
O sistema Hi-Vision original, cuja radiodifusão comercial iniciou-se em 1985 no Japão, é caracterizado por 1035
linhas visíveis, com 1840 elementos de imagem por linha, 60 campos entrelaçados por segundo. Este formato exige
mais de 20 MHz de banda para transmissão, sendo que para isso era utilizado um canal de satélite de banda larga.
Atualmente, o formato preferencial para HDTV foi padronizado em 1080 linhas x 1920 pixels, mantendo a
proporção de 16 x 9.

1080

480 1’

640

1920

Deve ser ressaltado que, a rigor, o nome “Alta Definição” é inadequado, uma vez que o critério de resolução visual
é o mesmo da TV convencional (cada elemento de imagem ocupa um ângulo de 1 minuto de grau). O que diferencia
os dois formatos é essencialmente o maior ângulo de visualização da imagem, 30 graus na horizontal.
A proporção de 16:9 foi adotada para manter
16
compatibilidade com múltiplas imagens no formato
4:3, conforme figura ao lado, além de se aproximar
4×3
bastante da proporção utilizada na maioria dos filmes
produzidos na época.
A figura abaixo mostra as proporções relativas dos
formatos de TV convencional e HDTV, bem como 4×3 4×3
9
formatos correntes de filmes cinematográficos de tela (12 × 9)
larga.
4×3

Cinema (1.85:1) HDTV (16:9)

Cinemascope (2.35:1)
TV (4:3)

Televisão Digital e HDTV 5


3.1 O Problema do “Simulcasting”
O sistema Hi-Vision japonês é um serviço independente, com programação exclusiva, veiculado algumas horas por
dia. Já a intenção da FCC era autorizar um serviço de TV de alta definição com exibição simultânea, compatível
com o sistema NTSC convencional. Essa exigência de “Simulcasting” (Simultaneous Broadcasting) traz novos
problemas de compatibilidade, devido à natureza diferente dos dois meios, principalmente no que diz respeito ao
enquadramento e ao movimento de câmera.
Nas alternativas exemplificadas abaixo, ocorre perda de detalhes periféricos ou de nitidez da imagem, em qualquer
caso. Isso acontece sempre na telecinagem (exibição de filmes na TV convencional). O problema inverso também
ocorre; por exemplo, movimentos rápidos de câmera, bastante comuns em tomadas televisivas, tornam-se
desagradáveis quando exibidos em uma tela de alta definição.

Imagem de HDTV (16 x 9)

Centralizada Close “Letterbox”


(Ação) (Expressão) (Ação total)

Alternativas para “Simulcasting” de HDTV em um Televisor Convencional

3.2 A evolução da TV de Alta Definição nos EUA


Em resposta às solicitações de espectro adicional das redes de TV, para radiodifusão de HDTV, a FCC fez as
seguintes concessões:
• Liberação de um canal adicional de 6 MHz, não adjacente, para radiodifusão de HDTV;
• A transmissão de HDTV deveria manter compatibilidade com a TV convencional (Simulcast);
• O canal adicional estaria sujeito a interferências por parte de emissoras de TV convencional;
• O canal adicional não poderia interferir nos serviços de TV já existentes.

Televisão Digital e HDTV 6


Várias empresas desenvolveram protótipos totalmente analógicos respeitando essas exigências, porém com
resultados decepcionantes. Parecia impossível encaixar um sinal que exige 20 MHz de banda em dois canais de 6
MHz não contíguos. O impasse técnico foi resolvido com o uso de técnicas de compressão digital, que permitiram a
codificação de um sinal de HDTV em um único canal de 6 MHz.
Havia ainda um impasse político; 4 propostas digitais diferentes foram avaliadas pela FCC, a qual não reconheceu
superioridade técnica de nenhuma delas. A decisão de liberar 4 sistemas diferentes, para que o mercado definisse
qual seria o vencedor, foi considerada uma catástrofe para a indústria de TV, prevendo-se um fracasso comercial
semelhante ao já conhecido caso da rádio AM estéreo.
A solução encontrada pelos participantes foi retirar as 4 propostas, fundindo-as em uma única que, teoricamente,
teria as partes melhores de cada uma das originais. Essa união foi denominada “Grande Aliança”. A FCC não teve
outra alternativa a não ser homologar o sistema proposto, denominado ATSC.
Enquanto a TV de Alta Definição aguardava o desenrolar dos fatos políticos, as tecnologias de processamento e
compressão digital, desenvolvidas para a HDTV, encontraram aplicação imediata em sistemas de TV digital com
resolução convencional (SDTV, ou Standard Definition Television). Sistemas como Digisat, Sky, e DirecTV
utilizam técnicas de compressão digital para transmitir vários programas de TV, onde antes era possível transmitir
apenas um canal.

4. Elementos de Vídeo Digital


O processamento de sinais de vídeo por meios digitais era bastante comum desde a década de 80, mas apenas no
ambiente de estúdio e produção. O padrão digital mais difundido para sinais de TV de resolução convencional é o
CCIR-601. Neste formato, o sinal de vídeo consiste de 3 componentes:

• Luminância Y : corresponde à intensidade luminosa de cada


elemento de imagem, ponderada de acordo com a sensibilidade
do olho humano para cada comprimento de onda; esta
componente é amostrada na taxa de 13,5 MHz e quantizada
com resolução de 8 bits;

• Crominância U : este sinal corresponde à tonalidade de cor do


elemento de imagem, expressando a tendência ao azul
(positiva) ou amarelo (negativa). Esta componente é amostrada
na taxa de 6,75 MHz, e quantizada com 8 bits.

• Crominância V : este sinal também corresponde à tonalidade de


cor do elemento de imagem, expressando a tendência ao
vermelho (positiva) ou verde (negativa). Também é amostrada
na taxa de 6,75 MHz.

A taxa de bits correspondente para este padrão é de 8 x (13.5 + 6.75 +


6.75) x 106 = 216 Mbit/s. Para HDTV, a taxa atinge cerca de 1 Gbit/s.
Esta taxa é compatível com transmissão via cabo coaxial a curtas
distâncias, como ocorre na maioria dos estúdios de produção digital. No
entanto, é inviável para radiodifusão, pois necessitaria de canais com
banda muito maior que 6 MHz.

4.1 Capacidade de Transmissão de Canais Digitais


De acordo com o teorema de Shannon, a capacidade teórica de um canal de comunicação, em termos de bits por
segundo, pode ser calculada a partir da banda de freqüência e da relação Sinal/Ruído, disponíveis ao receptor. O
problema de engenharia consiste então em implementar um processo de modulação compatível com essas
características do canal, de forma a aproximar-se ao máximo do limite teórico.
Em canais ruidosos, como é o caso dos sistemas de TV via satélite, utiliza-se geralmente a modulação QPSK
(Quadrature Phase Shift Keying), com a qual consegue-se eficiência de aproximadamente 1 bit por Hertz. Um
transponder de satélite, com banda de 30 MHz, conseguiria então transmitir cerca de 30 Mbits/segundo.
Processos de modulação mais eficientes conseguem taxas maiores, porém às custas de uma relação Sinal/Ruído
mais elevada.

Televisão Digital e HDTV 7


No caso do canal de radiodifusão de TV, com banda de 6 MHz, vários fatores fazem com que a relação sinal/ruído
mínima garantida seja de 15 a 20 dB. Processos de modulação adequados a esse tipo de canal permitem taxas de 18
a 20 Mbits/segundo. Isso é insuficiente para transmitir um sinal de vídeo digital CCIR-601, e muito menos HDTV.
O desejo de transmitir HDTV num canal de 6 MHz exige portanto o desenvolvimento de técnicas de compressão,
capazes de reduzir a taxa bruta de 1 Gbit/s para 18 Mb/s (compressão de 50:1). Esses processos são necessariamente
do tipo “com perdas”, ou seja, o sinal recuperado após a descompressão não é exatamente igual ao sinal original. É
necessário então que o processo leve em consideração as características da visão humana, de modo que as perdas de
reconstrução tenham baixa visibilidade.
No entanto, a transmissão digital traz ainda outros benefícios, entre os quais a compatibilidade com vários meios de
comunicação diferentes ou com vários serviços diferentes no mesmo meio.

Imagens
Cabo
Canal de
Satélite Transmissão
Áudio
Radiodifusão
Legendas
Rede Digital
Programa
Usuário Lista de Usuário
CD-ROM Programas Criptografia
e Acesso
Dados Condicional

Compatibilidade de Meios de Transmissão e de Serviços

5. Compressão de Imagens – Processo MPEG

5.1 Codificador com Preditor


Todo processo de compressão de dados busca de alguma forma reduzir a redundância presente no sinal que é
fornecido pela fonte de informação. Um recurso bastante útil para isto é o uso de um codificador com preditor. Este
tipo de codificador procura determinar uma estimativa y$ ( t ) do sinal a ser transmitido, baseando-se nas entradas
anteriores y(t-1), y(t-2).... (vide figura abaixo). Desta forma, basta transmitir apenas o erro de predição e(t), ou
seja, a diferença entre a estimativa y$ ( t ) e o sinal real y(t). Se o preditor for eficiente, o erro de predição terá baixa
redundância e irá assumir valores próximos de zero, reduzindo a quantidade de informação a ser transmitida.
Não havendo erros de transmissão, o receptor da figura abaixo reconstrói integralmente o sinal original, desde que
os dois preditores sejam inicializados simultaneamente. Na prática, para evitar propagação de erros, deve-se
periodicamente desconectar o elo de predição (abrir as chaves S1 e S2) e inicializar os preditores.
y(t) e(t) y(t)
+
- Canal
^
y(t) ^
y(t)
Preditor Preditor
S1 S2

Transmissor Receptor
Um exemplo de preditor para aplicações em vídeo é o "frame store", que explora o fato de que um quadro
transmitido é geralmente muito semelhante ao quadro anterior. Um preditor deste tipo consiste de uma memória que
armazena o quadro anterior, sendo então transmitidas apenas as diferenças pixel a pixel entre dois quadros
consecutivos. É claro que este preditor falha quando há um corte de cenas, ou movimentos rápidos de objetos ou da
câmera.

5.2 Preditor com Compensação de Movimento


Um preditor mais eficiente, para aplicação em vídeo, deve procurar compensar os movimentos de objetos em
relação ao campo de visão da câmera. Neste processo, o codificador detecta o deslocamento relativo de partes da

Televisão Digital e HDTV 8


imagem entre dois quadros consecutivos, transmitindo essa informação na forma de vetores de movimento (com
componentes no sentido horizontal e vertical). O preditor, de posse dessas informações, monta uma estimativa da
imagem atual baseada em fragmentos obtidos de uma imagem de referência, reposicionados de acordo com os
vetores de movimento (figura abaixo). Normalmente são consideradas apenas translações lineares.
Uma vez que é impraticável determinar quantos objetos com movimentos independentes existem em uma imagem,
cada fotograma pode ser subdividido em blocos regulares, sendo então determinados vetores de movimento para
cada bloco.

Anterior Atual Erro de Predição


(referência) (sem compensação)

Vetor de Movimento Predição Erro de Predição


(com compensação) (com compensação)

O detetor de movimento é a unidade funcional responsável pela determinação dos vetores. Para cada bloco da
imagem atual a ser transmitida, esta unidade faz uma varredura sobre a imagem de referência, buscando o ponto de
maior semelhança com o bloco a ser analisado. A busca pode medir o erro quadrático médio ou, mais comumente, a
distorção média absoluta (DMA), expressa por
1
DMA( x , y ) =
N
∑ f ( x + i, y + j ) − ref ( x + i + dx, y + j + dy )
i, j

onde (dx,dy) é o deslocamento entre a imagem de referência ref(x,y) e o bloco da imagem de entrada f(x,y). O valor
de (dx,dy) para o qual a DMA é mínima é adotado como vetor de movimento do bloco de coordenadas (x,y).
Normalmente a busca é feita dentro de uma área restrita, e/ou utilizando processos hierárquicos, uma vez que uma
busca exaustiva sobre toda a imagem representa um esforço computacional elevado.

x Área de Busca
x

y y
Bloco a ser
Estimado
Bloco de Maior Vetor de
Semelhança Movimento

Imagem de Referência Imagem atual


Estimador de Movimento

5.3 Codificador MPEG (Moving Pictures Experts Group)

O padrão MPEG-1 (ISO-IEC 11172a) destina-se à compressão de vídeo não entrelaçado, com taxa de informação
até 1,5 Mb/s, aplicável a vídeo-conferência e multimídia em CD-ROM; já o padrão MPEG-2 (ISO13818) destina-se
à compressão de imagens entrelaçadas, com taxas de 1,5 a 100 Mb/s em aplicações de TV convencional e HDTV.

Televisão Digital e HDTV 9


O diagrama de blocos do codificador MPEG está apresentado na figura a seguir. Este codificador utiliza predição
com compensação de movimento, executada sobre blocos da imagem de tamanho fixo; sobre o erro de predição é
aplicada uma transformação denominada DCT (Transformada Discreta de Cossenos).
O processo inicia-se com uma conversão de formatos, na qual a imagem é desentrelaçada e convertida para uma
dimensão adequada, eventualmente com interpolação ou re-amostragem.

24 / 30 / 60
Conversão de Formatos
Quadros / s

BLOCOS

Deteção QUADRO
de RECONSTRUIDO
Movimento
ERRO DE PREDIÇÃO

Preditor
DCT Transformação Espacial

Reconstrução COEFICIENTES

-1 Fator de Escala
DCT Q
Truncamento

COEFICIENTES QUANTIZADOS

Compactação RLE
Huffman
VETORES DE
MOVIMENTO DADOS SAÍDA
MUX Buffer

Diagrama de Blocos do Codificador MPEG

Após a conversão de formatos, a imagem é subdividida em blocos de 8 x 8 pixels. Após detecção e compensação de
movimento, o erro de predição resultante é submetido a uma Transformada Discreta de Cossenos (DCT), descrita
por

C ( u ) C( v ) 7 7
( 2 x + 1)uπ   ( 2 y + 1)vπ 
F ( u, v ) =
2

2 y =0
∑ f ( x, y )cos 16  cos  16 
x =0

 1
C ( k ) = se k = 0
onde  2
C ( k ) = 1 se k > 0

O que esta expressão faz é decompor o bloco original da imagem em uma soma ponderada de funções primitivas,
que correspondem a componentes cossenoidais, bi-dimensionais, com freqüências espaciais sucessivamente
maiores. As funções primitivas da DCT estão representadas na figura abaixo. Cada coeficiente F(u,v) representa
então a semelhança relativa entre o bloco original e cada função primitiva correspondente.
Os coeficientes F(u,v) da DCT são quantizados (arredondados), sendo esta etapa a responsável pelas perdas do
processo. A idéia é que a maior parte dos coeficientes F(u,v) terão valores próximos de zero, sendo eliminados pela
quantização.
Os coeficientes “sobreviventes” representam as componentes mais importantes do bloco da imagem original. Eles
são em seguida reordenados e compactados através de um processo RLE (Run-Length Encoding), onde os
coeficientes nulos são eliminados. A seguir, é feita uma codificação estatística, pela qual os coeficientes de maior

Televisão Digital e HDTV 10


probabilidade de ocorrência são substituídos por códigos binários de menor comprimento, enquanto que seqüências
menos prováveis recebem códigos mais longos.
Os coeficientes compactados são combinados com os vetores de movimento, e formatados em pacotes para
transmissão.

Primitivas da Transformada Discreta de Cossenos

5.4 Fluxo de Transporte MPEG-2


O padrão MPEG-2 contempla a transmissão através de canais sujeitos a erros; para isso, define um Fluxo de
Transporte na forma de Pacotes Elementares (PES - Packetized Elementary Stream) de comprimento fixo, igual a
188 bytes. Os PES carregam fragmentos de áudio, vídeo ou dados, possuindo um cabeçalho (figura abaixo) que traz
informações de sincronismo e criptografia, além de um campo de identificação de programa (PID).
Pacotes de Transporte MPEG-2:
Header
Dados
(4 Bytes)

Sinc. Extensão
(opcional)
(Total: 188 Bytes)

Vídeo 1 Vídeo 1 Áudio 1 Vídeo 1 Áudio 2 Vídeo 1

Televisão Digital e HDTV 11


Estrutura do Header (4 bytes):

0 1 0 0 0 1 1 1 Sincronismo (047h)

0 0 0 X P P P P

Identificador de Pacote (PID)


Prioridade
Início de uma Sequencia de Dados
Pacote com Erro

P P P P T T T T Identificador de Pacote (PID)

0 0 0 1
Contador Sequencial (0-15)
Controle de Extensão de Header
Controle de Criptografia

O fluxo de transporte pode assim carregar vários programas independentes, que compartilham apenas o mesmo
canal de comunicação. A figura a seguir mostra um esquema de multiplexação de pacotes, no qual informações de
áudio, vídeo e dados (legendas, informações auxiliares, etc) são reunidas em um fluxo de programa; vários fluxos
de programa são a seguir reunidos em um fluxo de transporte, que inclui ainda pacotes de Mapa de Programação e
de Informações de Sistema (SI - System Information). Estes últimos trazem tabelas referentes aos sistemas de
transmissão e modulação usados, bem como mapas de canais virtuais e outras informações relevantes à rede de
distribuição.
Para o caso de transmissão por um canal de taxa fixa, o buffer (reservatório) de saída amortece as flutuações
estatísticas de taxa de bits de cada programa, e o ajuste dos quantizadores nos codificadores de vídeo pode ser feito
em função do grau de ocupação deste buffer, de forma a garantir uma taxa média constante.

Vídeo
Áudio 1 Programa 1
Áudio 2 MUX
Programa 2 Fluxo de
Dados Buffer
Programa 3 MUX
Transporte

Mapa de Programas

6. Padrão ATSC de TV Digital


O sistema ATSC (Advanced Television System Commitee) é o padrão adotado na América do Norte para
radiodifusão de TV digital. Utiliza a modulação 8-VSB (Vestigial Side Band com 8 níveis).
A compressão utilizada é MPEG-2 (vídeo) e Dolby AC-3 (áudio). Os dados comprimidos são formatados em
pacotes MPEG, multiplexados em um fluxo de transporte de 19,6 Mb/s.

Televisão Digital e HDTV 12


Codificador Formatador
MPEG-2 de Pacotes
1280 x 720 Buffer Multiplex
1920 x 1080
1440 x 1080 Video
60 / 30 / 24
fps

Codificador de Formatadores
Áudio de Pacotes
Dolby AC-3 19.6 Mb/s
Audio 1

Audio 2 384 kbps

Pacotes de
Dados 188 bytes

CODIFICAÇÃO TRANSPORTE

A etapa de Modulação inclui um randomizador, cuja função é tornar os bits equiprováveis, mesmo na ausência de
informação a ser transmitida; em seguida, dois códigos de correção de erros (Reed-Solomon e Convolucional) são
aplicados, introduzindo redundâncias de forma a permitir correção de erros no receptor. Isto eleva a taxa de bits para
32,3 Mb/s.
A seguir, os bits são agrupados formando símbolos; cada símbolo corresponde a um pulso de amplitude diferente (8
níveis), carregando 3 bits de informação. A taxa de símbolos é portanto 10,76 Ms/s.
Em seguida, são inseridos símbolos de sincronismo, e uma portadora piloto para auxiliar a sintonia do receptor. Os
símbolos modulam uma portadora e são filtrados para limitar a banda em 6 MHz, e encaminhados ao transmissor.

TRANSMISSÃO
32.3 Codificadores para Correção de Erros
Randomizador
Mb/s

19.6
Mb/s
Mapeador Convolucional Entrelaçamento Reed-Solomon
(8 níveis) Entrelaçado (4 ms) (207,187),t=10 PRS
12 x (2/3)
Sequencia
10.76 de 65535
Msymb/s Filtro de Nyquist Bytes
Inserção de Filtro
Sincronismo Piloto Equalizador Modulador Vestigial SAIDA 8-VSB
(F.I.)

Banda de 6 MHz
4 sy. 1.25 p/ Transmissor
44 MHz
Portadora 46.69
MHz

Sincronismo 92.9 ns

Televisão Digital e HDTV 13


Envoltória do sinal 8-VSB Espectro do sinal 8-VSB

O espectro resultante do sinal transmitido é plano, e a envoltória é similar a um ruído aleatório. O desempenho do
sistema é caracterizado pela curva abaixo, que indica a taxa de erros de bloco em função da relação sinal/ruído do
canal.
O limiar de visibilidade dos erros, determinado experimentalmente, ocorre para uma relação sinal/ruído de 14,9 dB.
Adicionalmente, o sistema ATSC tolera surtos de ruído impulsivo de 190 µs dentro de um período de 4 ms, graças
ao entrelaçamento temporal. O sistema VSB é bastante insensível a ruído de fase (erros aleatórios na fase da
portadora). O limiar de percepção de interferência co-canal de um sinal digital sobre o analógico ocorre para
potência média digital 45 dB abaixo da potência de pico do sinal analógico.

Desempenho do sistema ATSC / 8-VSB

Testes em campo demonstraram que o sistema ATSC é muito sensível a efeitos de multi-percurso, que ocorrem
quando o sinal transmitido chega ao receptor através de vários caminhos, com tempos de propagação diferentes (os
conhecidos “fantasmas” na transmissão analógica). A técnica usual para compensar o multi-percurso consiste na
equalização adaptativa, que procura compensar os vários “ecos” do sinal principal através da criação de “contra-
ecos” simulados no receptor. Esta abordagem infelizmente não funciona quando os ecos possuem amplitude
comparável ao sinal principal, o que costuma ocorrer quando há reflexão no solo.

Televisão Digital e HDTV 14


7. Modulação OFDM (Orthogonal Frequency Division Multiplex)
Este processo de modulação foi desenvolvido especificamente para vencer os problemas decorrentes do multi-
percurso, e é utilizado nos padrões europeu (DVB-T) e japonês (ISDB-T).
A modulação 8-VSB utiliza símbolos de curta duração (pouco menos de 100 ns) que ocupam todo o espectro
disponível (6 MHz). A modulação OFDM, por outro lado, utiliza símbolos de longa duração (até 1 mili-segundo)
porém ocupando banda estreita (a partir de 1 kHz). Milhares de símbolos são transmitidos em paralelo, ocupando
todo o canal disponível (6 MHz).

K Portadoras
Independentes Banda de cada Portadora

f f

Espaçamento
Banda Total Ocupada
1 / TU
Espectro do Sinal OFDM

TG
TU Modulação
de cada
Portadora
TS

Duração do símbolo (para cada portadora)

Cada símbolo consiste de uma determinada amplitude e fase de uma portadora; essas combinações podem
transportar de 1 a 6 bits por símbolo (modulações BPSK a 64-QAM).
A idéia é que ao ser transmitido um símbolo, o sinal propaga-se pelos vários percursos até chegar ao receptor.
Passado um intervalo de alguns micro-segundos, todos os percursos se estabilizam, e a partir daí o receptor passa a
demodular a informação daquele símbolo levando em conta a energia total resultante de todos os percursos. Assim
sendo, a duração total TS do símbolo consiste de uma duração útil TU mais um intervalo de guarda TG que será
descartado pelo receptor.
Os sistemas baseados na modulação OFDM podem operar mesmo com ecos com a mesma amplitude do sinal
principal. Isso permite o uso de repetidoras, operando na mesma freqüência, para cobrir regiões com problemas de
propagação.
Como desvantagem, o OFDM costuma exigir maior potência do transmissor (cerca de 2 a 4 dB acima do 8-VSB)
para mesma taxa de erros; além disso, é mais sensível a ruído de fase na portadora.

Televisão Digital e HDTV 15


Limiar S/R (dB)
40

38

36
8-VSB
34

32

30

28
COFDM 64-QAM 2/3 FEC
Banda de Guarda 1/8
26

24

22

20

18

16

14
0 2 4 6 8 10 12 14 16 18 20
Relação Sinal/Eco (dB)

Comparação de Desempenho entre 8-VSB (ATSC) e OFDM (DVB-T)

8. Referências:

8.1 Apostilas da disciplina PTC2547 – Princípios de Televisão Digital

– Em constante revisão, disponíveis na secretaria do PTC


– Site da disciplina: www.lcs.poli.usp.br/~gstolfi/ptc2547downloads.html

8.2 Referências adicionais:

– Michael Robin, Michel Poulin: Digital Television Fundamentals - McGraw-Hill, 1998


– Joan Mitchell, et.al.: MPEG Video Compression Standard - Chapman & Hall, 1997
– Andrew F. Inglis, Arch Luther: Video Engineering - McGraw-Hill, 1996
– Rafael C. Gonzalez, Richard E. Woods: Digital Image Processing - Addison Wesley, 1993
– NAB Engineering Handbook – National Association of Broadcasters, 1999
– K. Blair Benson, ed.: Television Engineering Handbook - McGraw-Hill, 2000
– Eugene R. Bartlett: Cable Television Technology and Operations - McGraw-Hill, 1990
– Jerry Whitaker: DTV Handbook – McGraw-Hill, 2001
– Joel Brinkley: Defining Vision – Harcourt Brace & Co., 1997

Televisão Digital e HDTV 16

You might also like