You are on page 1of 82

A/85:2011

26 juin 2011

Pratique recommande par lATSC : Techniques


dtablissement et de maintien de lintensit sonore
pour la tlvision numrique

Advanced Television Systems Committee


1776 K Street, N.W.
Suite 200
Washington, D.C. 20006
www.atsc.org
LATSC (Advanced Television Systems Committee, Inc.) est un organisme
international sans but lucratif, qui labore des normes volontaires visant la
tlvision numrique. Les organismes membres de lATSC reprsentent les
industries de la radiodiffusion, du matriel de radiodiffusion, du cinma, de
llectronique grand public, de linformatique, de la cblodistribution, des
satellites et des semi-conducteurs.
Plus particulirement, lATSC sefforce de coordonner les normes de
tlvision entre les divers mdias de communication en mettant laccent sur
la tlvision numrique, sur les systmes interactifs et sur les
communications multimdias large bande. LATSC labore aussi des
stratgies de mise en uvre de la tlvision numrique et prsente des
sminaires de sensibilisation sur ses normes.
LATSC a t form en 1982 par les organismes membres du Joint
Committee on InterSociety Coordination (JCIC) : lElectronic Industries
Association (EIA), lInstitute of Electrical and Electronic Engineers (IEEE), le
National Association of Broadcasters (NAB), la National Cable
Telecommunications Association (NCTA) et la Society of Motion Picture and
Television Engineers (SMPTE). Actuellement, il compte environ 150 membres,
qui reprsentent les industries de la radiodiffusion, du matriel de
radiodiffusion, du cinma, de llectronique grand public, de linformatique,
de la cblodistribution, des satellites et des semi-conducteurs.
Les normes ATSC sur la tlvision numrique portent sur la tlvision
haute dfinition (TVHD), sur la tlvision de dfinition standard (TVDS), sur la
radiodiffusion de donnes, sur laudio ambiophonique multicanal et sur la
radiodiffusion directe par satellite.

Note : Nous attirons lattention du lecteur sur la possibilit que la conformit


la prsente pratique recommande ncessite lutilisation dune invention
faisant lobjet de droits de brevet. La publication de ce document ne
constitue pas une prise de position lgard de la validit de cette
allgation ou des droits de brevets pouvant y tre lis. Toutefois, un ou
plusieurs titulaires de brevets ont pu dposer une dclaration concernant les
modalits suivant lesquelles le ou les titulaires de brevets consentiraient
accorder une licence dutilisation en vertu de ces droits des personnes ou
des entits souhaitant acqurir une telle licence. Les dtails peuvent tre
obtenus auprs du secrtariat de lATSC et du titulaire de brevet.
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

Table des matires


1 PORTE 8
1.1 Contexte et introduction 8
1.2 Structure9
2 RFRENCES 10
2.1 Rfrences informatives 10
3 DFINITION DES TERMES12
3.1 Indication de conformit 12
3.2 Traitement des lments syntaxiques 13
3.3 Sigles et abrviations 13
3.4 Termes 13
4 LE SYSTME AUDIO MULTICANAL AC-3 15
5 MESURE DE LINTENSIT SONORE 15
5.1 Aperu gnral de la mthode de mesure de lintensit sonore UIT-R
BS.1770 16
5.2 Mesure 17
5.2.1 Mesure durant la production ou la postproduction 17
5.2.2 Mesure en temps rel en cours de production (vnement en direct)
17
5.2.3 Mesure de contenu de longue dure fini 18
5.2.4 Mesure de contenu de courte dure 18
5.2.5 Mesure fonde sur des fichiers 18
6 NIVEAU SONORE CIBLE ET NIVEAU DE CRTE VRAI POUR LA DISTRIBUTION OU
LCHANGE DE CONTENU 18
7 POINTS CONSIDRER DANS LA GESTION DES MTADONNES AYANT UN EFFET SUR
LINTENSIT SONORE DES PROGRAMMES AUDIO 19
7.1 Importance de dialnorm 19
7.2 Modes de gestion des mtadonnes 20
7.3 Utilisation de mtadonnes dialnorm statiques 20
7.3.1 tablissement de la valeur dialnorm par la mthode de la moyenne longue
dure 21
7.3.2 tablissement de la valeur dialnorm pour la production 21
7.3.3 Contenu non conforme lIntensit sonore cible 21
7.3.4 Valeur dialnorm et contrle de qualit dintensit sonore 21
7.3.5 Rglage dialnorm dmission pour la conformit la norme A/53 21
7.3.6 Avantage du paramtre dialnorm statique 22
7.4 Utilisation de mtadonnes dialnorm prdfinies 22
7.4.1 Mise en uvre 23
7.4.2 Exigence de synchro trame AC-3 23
7.5 Utilisation de mtadonnes dialnorm dynamiques 23
7.5.1 Dploiement du systme24
7.5.1.1 Mtadonnes Dolby E sur liaison srie 25
7.5.1.2 Mtadonnes Dolby E en VANC 25
7.5.1.3 Mtadonnes et codecs 25

3
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

7.5.1.4 Mtadonnes enregistres dans des fichiers 25


7.5.2 Technique de production en direct 25
7.5.3 Technique de production en diffr 25
7.5.4 Contrle de la production 26
7.5.5 Mtadonnes semi-dynamiques 26
7.5.6 Incidence de la perte de mtadonnes sur le contenu 26
7.5.7 Hybride statique-dynamique 26
7.5.8 Avantages des mtadonnes dynamiques 27
8 MTHODES DE CONTRLE EFFICACE DE LINTENSIT SONORE ENTRE PROGRAMME ET CONTENU
INTERSTITIEL 27
8.1 Solutions efficaces 27
8.1.1 Pour les oprateurs employant un systme dialnorm statique (voir la section 7.2)
27
8.1.2 Pour les oprateurs employant un systme dialnorm dynamique (voir la section 7.5)
27
8.2 Conditions hostiles 28
8.3 Recommandations sommaires 28
8.4 Insertion de publicit locale par la station de tlvision et le MVPD 29
9 GESTION DE LA DYNAMIQUE 29
9.1 Systme de contrle de dynamique AC-3 ( rversible ) 30
9.1.1 DRC en mode ligne et en mode RF 30
9.1.2 Contrle 31
9.1.3 Relations avec dialnorm 31
9.1.4 Codage professionnel 32
9.1.5 DRC AC-3 : slection de None 32
9.2 Traitement de la dynamique avec interface de mtadonnes ( rversible ) 33
9.3 Traitement de la dynamique sans interface de mtadonnes (irrversible) 34
9.4 Exprience du consommateur 35
10 CONFIGURATION DE CONTRLE AUDIO 35
10.1 Contexte 36
10.2 Caractristiques des locaux et des espaces 36
10.3 Installation 37
10.4 talonnage du niveau de rfrence 38
10.5 Dtails des signaux dessai 40
10.5.1 Dfinition de 0 dB FS 40
10.5.2 Tonalit sinusodale 440 Hz 41
10.5.3 Bruit rose limit la bande 41
ANNEXE A: INTENSIT SONORE DE PROGRAMME 42
A.1 INTRODUCTION 42
A.2 INTENSIT SONORE DES PROGRAMMES 42
A.3 CRTE VRAIE 46

4
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

ANNEXE B: ACOUSTIQUE DE SALLE ET DISPOSITION DES HAUT-PARLEURS 48


ANNEXE C: CORRECTION ACOUSTIQUE 50
ANNEXE D: AIDE-MMOIRE DE CONFIGURATION DE CONTRLE DE RFRENCE POUR LA TLVISION
51
ANNEXE E: PLAGE DINTENSIT SONORE 53
ANNEXE F : DTAILS SUR LE CONTRLE DE GAMME DYNAMIQUE AC-3 55
F.1 APERU GNRAL DU DRC 55
F.2 PLACEMENT DES MTADONNES DANS LES FLUX BINAIRES DRC AC-3
57
F.3 CALCULS DES MOTS DE GAIN AC-3 58
F.4 PONDRATION DINTENSIT SONORE ET COURBES DENTRES-SORTIE DE
DRC 63
F.5 PARAMTRES DENCODEUR POUR LE RGLAGE DES MTADONNES DRC
64
F.6 COMMANDES EXCUTABLES AU DCODEUR DRC 65
ANNEXE G: PARAMTRES DE DONNES AC-3 66
ANNEXE H: AIDE-MMOIRE LINTENTION DES TECHNICIENS DE STATION ET DE MVPD GESTION DE
LINTENSIT SONORE 68
H.1 INTRODUCTION 68
H.2 PORTE 68
H.3 DFINITIONS 68
H.4 GESTION DE LINTENSIT SONORE 69
H.5 EXIGENCE DE LA FCC 69
H.6 MESURE DU CONTENU DISTRIBU 69
H.6.1 Contenu longue dure 69
H.6.2 Contenu courte dure 70
H.6.3 Bulletins de nouvelles ou autre programmation en direct 70
H.6.4 Contenu enregistr dans des fichiers 70
H.7 INTENSIT SONORE CIBLE POUR FACILITER LCHANGE DE PROGRAMMES
70
H.8 MTHODES DE CONTRLE EFFICACE DE LINTENSIT SONORE ENTRE
PROGRAMME ET CONTENU INTERSTITIEL 71
H.9 RGLAGE dialnorm PAR UNE STATION AFFILIE 71
H.10 INSERTION DE CONTENU PAR LA STATION DE TLVISION OU LE MVPD
72
H.11 CONTRLE DE GAMME DYNAMIQUE (DRC) AC-3 72
ANNEXE I: AIDE-MMOIRE LINTENTION DES MIXEURS ET DES MONTEURS SON QUI CRENT DU
CONTENU 73
I.1 INTRODUCTION 73
I.2 PORTE 73
I.3 DFINITIONS 73
I.4 ENVIRONNEMENT DE CONTRLE 74
I.5 CONTRLE DE NIVEAU UIT-R BS.1770 75
I.6 INTENSIT SONORE DE CONTENU DURANT LE MIXAGE 75
I.7 INTENSIT SONORE CIBLE POUR LE CONTENU SANS MTADONNES 75

5
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

I.8 EXIGENCE DE LA FCC 75


I.9 MESURE DE CONTENU POSTPRODUIT 76
I.9.1 Contenu longue dure 76
I.9.2 Contenu courte dure 76
ANNEXE J: EXIGENCES RELATIVES LTABLISSEMENT ET AU MAINTIEN DE LINTENSIT SONORE DES
MESSAGES PUBLICITAIRES LA TLVISION NUMRIQUE 77
J.1 INTRODUCTION ET PORTE 77
J.2 GESTION DE LINTENSIT SONORE 77
J.3 PARAMTRE dialnorm POUR LES SYSTMES AC-3 77
J.4 MESURE DE LINTENSIT SONORE DES MESSAGES PUBLICIATAIRES 77
J.5 MESSAGE PUBLICITAIRES AU POINT DINSERTION 77
ANNEXE K: EXIGENCES RELATIVES LTABLISSEMENT ET AU MAINTIEN DE LINTENSIT SONORE DES
MESSAGES PUBLICITAIRES LA TLVISION NUMRIQUE QUAND ON UTILISE DES CODECS
NON-AC-3 78
K.1. INTRODUCTION ET PORTE 78
K.2. GESTION DE LINTENSIT SONORE 78
K.3. INTENSIT SONORE DES CANAUX NON-AC-3 78
K.4. MESURE DE LINTENSIT SONORE DES MESSAGES PUBLICITAIRES 78
K.5. MESSAGE PUBLICIATAIRE AU POINT DINSERTION 78

6
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

Index des tableaux et des figures

Tableau 10.1 Catgories de rgies du son utilises en production


tlvisuelle 34
Tableau 10.2 Niveau de pression acoustique de rfrence 38
Tableau D.1 Niveau de pression acoustique de rfrence 51
Tableau G.1 Mtadonne de contrle critique
66
Tableau G.2 Mtadonne de contrle de base - Encodeur
66
Tableau G.3 Mtadonne de contrle de base - Dcodeur
66
Tableau G.4 Mtadonne informationnelle
67
Tableau 10.2 Niveau de pression acoustique de rfrence
74

Figure 5.1 Algorithme de mesure de lintensit sonore de lUIT-R BS.1770


15
Figure 7.1 Concept de mtadonnes statiques 19
Figure 7.2 Concept de mtadonnes prdfinies 21
Figure 7.3 Concept de mtadonnes dynamiques 22
Figure 7.4 Options dinsertion des mtadonnes 24
Figure 10.1 Courbe de rponse lectroacoustique dans une salle
fonctionnelle 37
Figure A.1 Schma fonctionnel de lalgorithme de mesure de lintensit
sonore multicanal 42
Figure A.2 Courbe de pondration RLB 43
Figure A.3 Rponse du prfiltre utilis pour tenir compte des effets
acoustiques de la tte 43
Figure A.4 Rsultats regroups pour les trois ensembles de donnes
(r = 0,977). 44
Figure A.5 Niveau de crte du signal continu et du signal chantillonn
45
Figure A.6 Structure de basede lalgorithme destimation de la crte vraie
dfini dans
UIT-R BS.1770-1 45
Figure E.1 Seuils dintensit sonore critiques 52

7
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

Figure F.1 Principe de base du contrle de gamme dynamique (DRC) AC-3


54
Figure F.2 Exigences relatives au dcodeur AC-3 (mode ligne) 55
Figure F.3 Exigences relatives au dcodeur AC-3 (mode RF). 56
Figure F.4 Placement des mtadonnes de DRC AC-3 dans le flux binaire
57
Figure F.5 Calculs des mots de gain AC-3 par lencodeur (partie 1). 58
Figure F.6 Calculs des mots de gain AC-3 par lencodeur (partie 2) 59
Figure F.7 Lissage du gain par la mthode chevauchement & addition
61
Figure F.8 Courbe de pondration dintensit sonore DRC 62
Figure F.9 Caractristiques dentre-sortie des profils DRC 63

8
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

Pratique recommande par lATSC :


Techniques dtablissement et de maintien de lintensit
sonore
pour la tlvision numrique
1 PORTE
La prsente pratique recommande (PR) de lATSC fournit des conseils aux
radiodiffuseurs et aux crateurs de bandes sonores pour le contenu
tlvisuel ATSC haute dfinition (HD) et de dfinition standard (DS). Elle
recommande les mthodes de production, de distribution et de transmission
ncessaires pour offrir les pistes sonores de la plus haute qualit aux
tlspectateurs du numrique.
Cette PR est centre sur les techniques de mesure, de production et de
contrle postproduction du son et des mthodes permettant de contrler
avec efficacit lintensit sonore dans la distribution ou lchange de
contenu. Elle recommande les mthodes visant contrler efficacement
lintensit sonore entre programme et contenu interstitiel, explique les
systmes de mtadonnes et leur utilisation et dcrit le contrle moderne de
la gamme dynamique. Cette PR contient aussi des renseignements
particuliers sur la gestion de lintensit sonore aux frontires entre les
programmes et le contenu interstitiel.
En outre, la PR est accompagne de deux annexes pouvant tre
dtaches et servir daide-mmoire deux communauts dintrts en
particulier : ingnieurs de station/distributeur multicanal de programmes
audiovisuels (MVPD) et personnel de production sonore.

1.1 Contexte et introduction


La pratique recommande A/85:2011, 25 juillet 2011 succde la pratique
recommande A/85:2009 datant du 25 mai 2011.
Malgr la fin de la transition la TVN, de nombreux radiodiffuseurs et la
communaut de la production ont t lents sadapter aux changements
ncessaires la transition des techniques sonores NTSC analogiques aux
pratiques audio numriques modernes. La gamme dynamique audible
tendue (plus de 100 dB) de la tlvision numrique ouvre la voie une
variation excessive du contenu sonore lorsque lintensit sonore de la TVN
nest pas gre de faon approprie.
Les consommateurs ne sattendent pas un grand changement
dintensit sonore entre un programme et un contenu interstitiel ou quand ils
passent dune chane une autre. Lutilisation abusive de la gamme
dynamique tendue disponible a entran des plaintes des consommateurs,
qui doivent garder leur tlcommande porte de la main et rgler le
volume pour le confort de lcoute.

9
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

Le systme de tlvision analogique NTSC a recours un traitement


conventionnel de la gamme dynamique sonore diverses tapes du trajet du
signal afin de grer lintensit sonore pour les radiodiffusions. Cette mthode
compense les limites de la gamme dynamique du matriel analogique et
contrle les divers niveaux dintensit du signal sonore reu des
fournisseurs. Elle aide aussi adoucir les passages des programmes aux
contenus interstitiels. Malgr sa simplicit et son efficacit, cette mthode
rduit en permanence la gamme dynamique et modifie les signaux sonores
avant quils atteignent le tlspectateur. Elle change les caractristiques du
son original, le modifiant par rapport ce que le fournisseur de programmes
avait prvu, pour ladapter aux limites du systme analogique.
Le systme audio AC-3 dfini dans la norme de tlvision numrique ATSC
fait appel aux mtadonnes, c.--d. aux donnes propos des donnes ,
pour contrler lintensit sonore et les autres paramtres audio de faon plus
efficace, sans modifier irrmdiablement la gamme dynamique du contenu.
Le fournisseur de contenu ou le tldiffuseur numrique code les
mtadonnes dans le contenu sonore. Du point de vue des tlspectateurs,
le paramtre de mtadonne Dialog Normalization (dialnorm) rgle les
diffrents contenus une intensit sonore uniforme de manire
transparente. Il permet datteindre un rsultat semblable lutilisation de la
tlcommande par le tlspectateur qui rgle le volume sonore un niveau
confortable en coutant des programmes tl disparates ou au passage dun
programme un message publicitaire ou dune chane une autre. Le
paramtre dialnorm et les autres paramtres de mtadonnes font partie
intgrante du flux binaire audio AC-3.
Le document ATSC A/53, partie 5:2010 [1] rend obligatoire le transport du
paramtre dialnorm et de valeurs dialnorm rgles de faon approprie.
Lindustrie reconnat quune nouvelle comptence en matire de mesure
de lintensit sonore, de contrle de la production, dutilisation des
mtadonnes et de pratiques modernes visant la gamme dynamique est
vitale pour rpondre aux attentes du fournisseur de contenu, du
radiodiffuseur, des tlspectateurs et des organismes de rglementation.
Le prsent document contient des recommandations et des
renseignements techniques relatifs aux lments suivants :
Mesure de lintensit sonore suivant la recommandation UIT-R BS.1770.
Intensit sonore cible pour lchange de contenu sans mtadonnes.
tablissement denvironnements de contrle de rfrence pour la
production avec la gamme dynamique tendue inhrente la
tlvision numrique, en prenant en compte les multiples
environnements dcoute la maison.
Prsentation de mthodes efficaces pour contrler lintensit sonore
lors de transitions entre programmes et contenus interstitiels.
Utilisation efficace des mtadonnes audio pour la production, la
distribution et la transmission de contenu numrique.

10
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

Contrle de la gamme dynamique lintrieur des signaux audio AC-3


et contrle moderne conventionnel de la gamme dynamique titre
dajout ou de solution de rechange, y compris des recommandations
visant la gestion de lintensit sonore et de la dynamique aux
frontires entre les programmes et le contenu interstitiel.

1.2 Structure
La structure de ce document est la suivante :
Section 1 Dfinition de la porte du document et introduction
gnrale.
Section 2 Liste des rfrences et des documents pertinents.
Section 3 Dfinition des termes, sigles et abrviations utiliss dans
le document.
Section 4 Explication du sommaire technique du systme audio
multicanal AC-3.
Section 5 Explication de la mesure de lintensit sonore fonde sur
les techniques dfinies dans la recommandation UIT-R BS.1770.
Section 6 Recommandations visant lchange de contenu sans
mtadonnes.
Section 7 Lignes directrices visant lutilisation pratique de
mtadonnes dynamiques et statiques dans les environnements de
production, de distribution et de transmission.
Section 8 Description des mthodes de contrle efficaces de
lintensit sonore lors de transitions entre programme et contenu
interstitiel.
Section 9 Examen des principaux problmes lis au contrle de la
gamme dynamique (DRC).
Section 10 Indication de la configuration des systmes audio pour la
tlvision numrique, y compris lalignement des haut-parleurs de
contrle de la rgie un niveau de pression acoustique de rfrence.
Annexe A Intensit sonore des programmes : donnes contextuelles
sur les algorithmes de mesure de lintensit sonore et des niveaux de
crte vrais de la recommandation BS.1770.
Annexe B Acoustique des salles et disposition des haut-parleurs :
explication des principes de base du contrle (monitoring) dans la
rgie.
Annexe C Correction de la salle : examen des problmes lis
linteraction entre le son provenant des haut-parleurs et la salle.
Annexe D Aide-mmoire sur le rglage du niveau acoustique de
rfrence pour les salles de contrle de tlvision.
Annexe E Plages dintensit sonore : examen de la plage dintensit
sonore lintrieur de laquelle un auditeur accepte les variations

11
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

dintensit sonore lintrieur dlments de contenu et entre des


lments de contenu.
Annexe F Dtails relatifs au contrle de la gamme dynamique AC-3.
Annexe G Paramtres de mtadonnes AC-3.
Annexe H Aide-mmoire lintention des ingnieurs de station et de
MVPD pour la gestion de lintensit sonore par les stations et les
oprateurs de MVPD.
Annexe I Aide-mmoire lintention du personnel de mlange audio
qui cre du contenu (messages publicitaires et programmes).
Annexe J Exigences relatives ltablissement et au maintien de
lintensit sonore des messages publicitaires en tlvision numrique.
Annexe K Exigences relatives ltablissement et au maintien de
lintensit sonore des messages publicitaires en tlvision numrique
au moyen de codecs audio non-AC-3.

2 RFRENCES
Les ditions indiques ci-dessous sont valides au moment de la publication
du document. Les documents cits en rfrence faisant tous lobjet de
rvisions, les utilisateurs de la prsente pratique recommande sont invits
vrifier sil est possible dappliquer une dition plus rcente du document
cit.

2.1 Rfrences informatives


Les documents suivants contiennent des renseignements pouvant tre utiles
dans lapplication de la prsente pratique recommande.
[1] ATSC. ATSC Digital Television Standard, Part 5 AC-3 Audio System
Characteristics, Doc. A/53 Part 5:2010, Advanced Television Systems
Committee, Washington, D.C., 6 juillet 2010.
[2] IEEE/ASTM SI 10-2002, Use of the International Systems of Units (SI):
The Modern Metric System, Institute of Electrical and Electronics
Engineers, New York, N.Y.
[3] Recommandation UIT-R BS.1770-1, Algorithmes de mesure de
l'intensit sonore des programmes audio et des niveaux de crte vrais
des signaux audio, Union internationale des tlcommunications,
Genve, 2007.
[4] ATSC, Digital Audio Compression (AC-3, E-AC-3) Standard, Doc. A/52B,
Advanced Television Systems Committee, Washington, D.C., 14 juin
2005.
[5] IEC 60268-17 (1990), quipements pour systmes lectroacoustiques.
Partie 17 : Indicateurs de volume normaliss.
[6] SMPTE. SMPTE RP 200 Relative and Absolute Sound Pressure Levels
for Motion-Picture Multichannel Sound Systems, Society of Motion
Picture and Television Engineers, White Plains, N.Y.

12
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

[7] SMPTE. SMPTE 302M-2007 Television Mapping of AES3 Data into


MPEG-2 Transport Stream, Society of Motion Picture and Television
Engineers, White Plains, NY, 2007.
[8] SMPTE. SMPTE 2020-1-2008 Format of Audio Metadata and Description
of the Asynchronous Serial Bitstream Transport, SMPTE 2020-2-2008
Vertical Ancillary Data Mapping of Audio Metadata Method A, SMPTE
2020-3-2008 Vertical Ancillary Data Mapping of Audio Metadata
Method B, Society of Motion Picture and Television Engineers, White
Plains, NY, 2008.
[9] Recommandation UIT-R BS.1534-1, Mthode d'valuation subjective du
niveau de qualit intermdiaire des systmes de codage, Union
internationale des tlcommunications, Genve, Suisse.
[10] Soulodre, G.A., Lavoie, M.C. et Norcross, S.G. The Subjective Loudness
of Typical Program Material, 115e convention de laudio Engineering
Society, 2003.
[11] Soulodre, G.A. Evaluation of Objective Loudness Meters, 116e
convention de lAudio Engineering Society, Berlin, Preprint 6161.
[12] Recommandation UIT-R BS.775-2, Systme de son strophonique
multicanal avec ou sans image associe, Union internationale des
tlcommunications, Genve, Suisse.
[13] Soulodre, G.A., and Lavoie, M.C, Stereo and Multichannel Loudness
Perception and Metering, 119e convention de lAudio Engineering
Society, San Francisco, Preprint 6618.
[14] AES. TD-1001, Multichannel sound systems and operations, Audio
Engineering Society, New York, NY,
www.aes.org/technical/documents/AESTD1001.pdf (tlchargement
gratuit). Il est noter quune exception a t faite dans ldition 2001
de ce document : les niveaux dcoute de rfrence de la section 7.4.1
du document ont t supprims.
[15] Recommendation UIT-R BS.1771, Spcifications des appareils de
mesure indiquant l'intensit sonore et les niveaux de crte vrais, Union
internationale des tlcommunications, Genve, Suisse.
[16] Eargle, J. M., Audio Monitoring in Contemporary Post-Production
Environments, SMPTE Journal, Society of Motion Picture and Television
Engineers, White Plains, NY, January, 2005.
[17] Holman, Tomlinson, Surround Sound Up and Running, Focal Press, 2e
dition, 2007, (original ISBN-10 0240808290), ISBN-13 978-
0240808291.
[18] AES. AES3-2003, Digital input-output interfacing - Serial transmission
format for two-channel linearly represented digital audio data, Audio
Engineering Society, New York, N.Y.
[19] Dolby. Model DP569 Dolby Digital Multichannel Audio Encoder Users
Manual, Dolby Laboratories, Inc., San Francisco, CA.
[20] Dolby. Dolby DP570 Multichannel Audio Tool Users Manual, Dolby
Laboratories, Inc., San Francisco, CA.

13
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

[21] AES.: AES17-1998 (r2004), AES standard method for digital audio
engineering - Measurement of digital audio equipment, Audio
Engineering Society, New York, N.Y.
[22] SMPTE. RDD 6-2008, Description and Guide to the Use of the Dolby E
Audio Metadata Serial Bitstream, Society of Motion Picture and
Television Engineers, White Plains, N.Y.
[23] SMPTE. SMPTE 337-2008, Format for Non-PCM Audio and Data in an
AES3 Serial Digital Audio Interface, Society of Motion Picture and
Television Engineers, White Plains, N.Y.
[24] ATSC. A/79, Conversion of ATSC Signals for Distribution to NTSC
Viewers, Advanced Television Systems Committee, Washington, D.C.,
12 dcembre 2008.
[25] CEA. CEA-CEB11-A, NTSC/ATSC Loudness Matching, Consumer
Electronics Association, Arlington, VA, septembre 2009.
[26] ANSI. ANSI C16.5-1942, Standard Volume Indicator, American National
Standards Institute, Washington, D.C.
[27] IEC. Norme IEC 60268-17, quipements pour systmes
lectroacoustiques Partie 17 : Indicateurs de volume normaliss,
Commission lectrotechnique internationale, Genve, 1990.
[28] IEC: Norme IEC 60268-10/Iia, IIb, 1991, quipements pour systmes
lectroacoustiques Partie 10 : Appareils de mesure des crtes de
modulation, Commission lectrotechnique internationale, Genve,
1991.
[29] ANSI. ANSI S1.4-1983 (R 2001) avec modif. S1.4A-1995, Specification
for Sound Level Meters, American National Standards Institute,
Washington, D.C.
[30] Commercial Advertisement Loudness Mitigation (CALM) Act, Pub. L.
111-311, 47 U.S.C. 621 (2011).

3 DFINITION DES TERMES


Les termes, abrviations et units utiliss sont ceux de la pratique de
lInstitute of Electrical and Electronics Engineers (IEEE), tels quils sont
exposs dans les normes publies par lInstitut [2]. Si une abrviation nest
pas employe par lIEEE ou si une pratique de lindustrie diffre de celle de
lIEEE, labrviation en question est dcrite dans la section 3.3 du prsent
document.

3.1 Indication de conformit


Cette section dfinit les termes de conformit utiliss dans le prsent
document :
Vital Ce mot qualifie une mesure devant tre suivie la lettre (aucun cart
nest autoris).
Devrait Ce mot indique quune mesure est privilgie, mais non
ncessairement exige.

14
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

Ne devrait pas Ce terme signifie que la possibilit ou la mesure est peu


souhaitable, mais non interdite.
titre daide supplmentaire, les recommandations essentielles de ce
document sont accompagnes de licne .

3.2 Traitement des lments syntaxiques


Ce document contient des rfrences symboliques aux lments de syntaxe
employs dans les sous-systmes de codage audio, vido et de transport.
Ces rfrences sont signales par lemploi dune police de caractres
distincte (p. ex. restricted), peuvent contenir le caractre de soulignement
(p. ex. sequence_end_code) et peuvent se composer dune chane de caractres
ne correspondant pas un mot franais (ou anglais) (p. ex. dynrng).

3.3 Sigles et abrviations


Les abrviations et sigles suivants sont employs dans le document.
AC-3 Norme de compression audio numrique (AC-3, E-AC-3), telle quelle
est dcrite dans le document ATSC A/52B [4]
ATSC Advanced Television Systems Committee
dB Dcibel
dB FS Dcibel par rapport une onde sinusodale pleine chelle (Full
Scale) (suivant AES17 [21])
dB TP Dcibel du niveau de crte vrai (True Peak) par rapport une mesure de
niveau de crte vrai pleine chelle de 100% (suivant UIT-R BS.1770, annexe 2 [3])
DRC Contrle de gamme dynamique
GPI Interface universelle
LKFS Intensit sonore (Loudness) avec pondration K, par rapport une
pleine chelle nominale (Full Scale), mesure au moyen dun appareil qui met
en uvre lalgorithme spcifi par lUIT-R BS.1770 [3]. Une unit LKFS est
quivalente un dcibel.
UIT Union internationale des tlcommunications
MVPD Distributeur multicanal de programmes audiovisuels (comprend les
oprateurs de service de radiodiffusion directe par satellite (DBS), les
cblodistributeurs locaux et les cblodistributeurs multirseaux)
SPL Niveau de pression acoustique (Sound Pressure Level) en dcibels par
rapport 20 N/m2
VU Vumtre [5]
PPM Modulomtre de crte (crte-mtre)

3.4 Termes
Les termes suivants sont employs dans le document.
lment dancrage (Anchor Element) Point ou lment de rfrence de la
sonie (intensit sonore perue) autour duquel les autres lments du
contenu sont quilibrs pour produire le mixage sonore final du contenu

15
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

ou qui importe le plus au tlspectateur raisonnable quand il rgle la


commande de volume.
BS.1770 Officiellement UIT-R BS.1770 [3]. Cette recommandation dfinit
un algorithme qui permet dobtenir une valeur numrique indiquant la
sonie du contenu mesur. Les sonomtres et les outils de mesure dans
lesquels est mis en uvre lalgorithme BS.1770 indiquent lintensit
sonore en LKFS .
Contenu (Content) Matriel ou substance du produit distribu par un
diffuseur.
Niveau de dialogue (Dialog Level) Lintensit sonore de llment
dancrage, exprime en LKFS.1
dialnorm Paramtre de mtadonnes AC-3, de valeur numrique gale la
valeur absolue du niveau de dialogue, transport dans le flux binaire AC-
3. Cest un code de 5 bits non sign qui indique lcart ngatif du niveau
de dialogue moyen par rapport 0 LKFS. Les valeurs valides vont de 1
31. La valeur 0 est rserve. Les valeurs 1 31 sont interprtes -1 -31.
Le dcodeur applique une valeur de rduction de gain gale la
diffrence entre -31 et la valeur dialnorm.
Dolby E Dolby E est une technique de rduction de dbit de donnes audio
conu pour lutilisation en contribution et en distribution, qui comporte
aussi des mtadonnes Dolby E.
Mtadonnes Dolby E Mtadonnes qui sont multiplexes dans le flux
binaire Dolby E. Chaque lment de mtadonnes est class dans le type
professionnel ou grand public . Les mtadonnes Dolby E sont
expliques dans le document SMPTE RDD 6 [22].
Profil DRC (DRC profile) Ensemble de paramtres dcrivant la faon dans
les mtadonnes de contrle de la gamme dynamique sont calcules.
Dispositif de contrle de gain dans les fichiers (file-based scaling
device) Dispositif servant appliquer une correction de gain globale au
contenu audio enregistr dans des fichiers.
Synchro trame (framesync) Abrviation de synchroniseurs de trame .
Couchage de la bande sonore finale (layback) tape de postproduction
o l'on runit la bande sonore finale avec l'image, aprs le montage, le
mixage ou le rehaussement du son final.
Contenu de longue dure (long form content) Matriel ou substance de
spectacle ou dmission (programme). En rgle gnrale, la dure
dpasse environ deux ou trois minutes.
Sonie (perceived loudness) Intensit sonore perue; importance de leffet
physiologique produit quand un son stimule loreille.

1
Le terme Niveau de dialogue est fond sur lutilisation rpandue du
dialogue comme ancrage pour le mixage du contenu; historiquement, on
a convenu que le dialogue constituait llment dancrage de la plupart
des programmes.

16
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

Intensit sonore (measured loudness) Grandeur dun signal audio


mesure au moyen dappareils mettant en uvre lalgorithme dfini dans
la recommandation UIT-R BS.1770 [3]. Il sagit dune approximation de la
sonie.
Niveau de mixage (mixing level) Paramtre de mtadonnes facultatif
dans le flux binaire AC-3, qui permet dindiquer ltalonnage du niveau de
pression acoustique absolu du studio de mixage qui a produit le contenu.
Oprateur (Operator) Tldiffuseur, radiodiffuseur, oprateur de service
DBS, cblodistributeur local ou cblodistributeur multirseau (MSO) ou
autre distributeur multicanal de programmes audiovisuels (MVPD).
Contenu de courte dure (short form content) Matriel ou substance de
messages publicitaires, commerciaux, promotionnels ou publics. Aussi
appel contenu interstitiel . Gnralement, la dure est infrieure
deux ou trois minutes.
Intensit sonore cible (Target Loudness) Valeur spcifie pour llment
dancrage (c.--d. Niveau de dialogue), tablie pour faciliter lchange de
contenu entre un fournisseur et un oprateur.
Crte vraie (true peak) Valeur maximale de la forme d'onde du signal
dans le domaine temporel continu, mesure suivant les indications de la
recommandation UIT-R BS.1770 [3]. Lunit de mesure est le dB TP (c.--d.
dcibels par rapport 100 % de la crte vraie nominale).

4 LE SYSTME AUDIO MULTICANAL AC-3


Le systme audio AC-3 de lATSC est conu pour fournir une reproduction du
contenu original (non trait) la sortie du dcodeur AC-3 dans un rcepteur,
normalise une intensit sonore uniforme. Il donne la possibilit aux
radiodiffuseurs de laisser chaque auditeur la libert dexercer un certain
contrle sur le degr de rduction de la gamme dynamique, au besoin, pour
ladapter au mieux ses conditions dcoute. La partie traitement de la
gamme dynamique du systme est dcrite la section 9, mais son
fonctionnement implique la rception dun contenu normalis de manire
approprie.
Le paramtre de mtadonnes dialnorm est transmis au dcodeur AC-3 en
mme temps que les signaux audio cods. La valeur du paramtre dialnorm
indique lintensit sonore de lElment dancrage du contenu. La valeur
dialnorm dun programme dun niveau sonore trs lev peut tre 12 et celle
dun programme de niveau sonore doux, 27. La sortie du dcodeur AC-3 est
dote dun attnuateur qui applique lattnuation approprie pour normaliser
lintensit sonore du contenu -31 LKFS.
Si le paramtre dialnorm correspond lintensit sonore gnrale du
contenu, les auditeurs sont en mesure de rgler leur commande de
volume au niveau dcoute (sonie) voulu et nauront pas la rgler de
nouveau chaque fois quil y a une pause publicitaire et au retour au
programme. Si tous les radiodiffuseurs utilisent le systme correctement,
lintensit sonore sera aussi uniforme dune chane lautre.

17
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

La section 7 dcrit trois mthodes dutilisation des mtadonnes audio :


mtadonnes statiques, prdfinies et dynamiques. Ces trois mthodes
assurent la livraison dune intensit sonore uniforme aux auditeurs; le
radiodiffuseur est libre demployer la technique qui convient le mieux ses
pratiques. Quelle que soit lapproche choisie, le bon fonctionnement du
systme repose sur la transmission dune valeur dialnorm qui reprsente bien
le Niveau de dialogue du contenu, cest--dire au dpart sur la mesure
prcise de lintensit sonore.

5 MESURE DE LINTENSIT SONORE


Lintensite sonore tant un phnomne subjectif, cest loue humaine qui
en est le meilleur juge. Placs dans un environnement de mixage connu, tel
que celui qui est dcrit dans la section 10 de la prsente RP, les mixeurs
audio chevronns se servant de leur oue peuvent produire un son (contenu
sonore) de programme bien quilibr, dune intensit sonore
remarquablement uniforme. Si tous les programmes et tous les messages
publicitaires taient produits avec une intensit sonore uniforme et si
lintensit sonore du mixage tait conserve durant les tapes de
production, de distribution et tout au long de la chane de livraison, les
auditeurs ne subiraient aucun changement contrariant de lintensit sonore
lintrieur des programmes et dun programme lautre.
Dans la mesure des signaux audio, il y a deux paramtres dintrt cls :
le niveau de crte vrai du signal et son intensit sonore. La mesure du
niveau de crte vraie permet au mixeur de protger le programme contre
lcrtage et la mesure de lintensit sonore, de protger lauditeur contre
les variations irritantes de sonie. Bien que le mixeur quilibre un mlange en
se servant de ses oreilles, la mesure objective de lintensit sonore aide
maintenir uniforme la sonie lintrieur dun programme et dun programme
un autre.
Les vumtres et les crtes-mtres courants ne mesurent ni lintensite
sonore, ni le niveau de crte vrai du signal. Les caractristiques de nombreux
appareils de mesure lectroniques courants disponibles ne sont pas
connues, ce qui contribue la situation dincohrence et de confusion que
lon retrouve dans la pratique aujourdhui.
Cette PR prsente des directives qui, sils sont suivies, assureront
luniformit de lintensit sonore tout en liminant les risques dcrtage du
signal. Les techniques de mesure recommandes sont fondes sur les
mesures dintensit sonore et de niveau de crte vrai dfinies dans la
recommandation UIT-R BS.1770 Algorithmes de mesure de l'intensit
sonore des programmes audio et des niveaux de crte vrais des signaux
audio [3]. Les dtails des deux mesures sont prsents lannexe A.

18
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

5.1 Aperu gnral de la mthode de mesure de lintensit sonore UIT-R


BS.1770
Lintensit sonore est mesure en intgrant la puissance pondre des
signaux audio dans tous les canaux, sur toute la dure du contenu. La
structure gnrale de lalgorithme est reprsente la figure 5.1.

Figure 5.1 Algorithme de mesure de lintensit sonore de lUIT-


R BS.17702

K Filter Filtre K
Average Power Puissance moyenne
Channel Weighting Pondration de canal
Measured Loudness Intensit sonore
L G
R D
C C
Ls Ambiance gauche
Rs Ambiance droite

La mthode BS.1770 a t valide au cours de tests dcoute, en


comparant les rsultats quelle donnait la sonie relative de squences
sonores mono, stro et multicanaux. Lintensit sonore est exprime en
LKFS. Une unit LKFS est identique un dcibel. Un programme de -15 LKFS
peut tre rgl pour correspondre la sonie dun programme moins fort de
-22 LKFS en laffaiblissant de 7 dB.
Lintensit sonore de llment dancrage (souvent le dialogue) du mixage
est utilise comme approximation de lintensit gnrale du contenu. La
mesure prcise de lintensit sonore de llment dancrage (Niveau de
dialogue) est ncessaire pour permettre aux oprateurs de distribuer le
contenu aux auditeurs des niveaux sonores uniformes.

2
Le canal d'effets basses frquences (LFE) n'est pas pris en compte
dans lalgorithme de mesure courant de lUIT-R BS.1770. Les utilisateurs
de la prsente PR devraient utiliser la version la plus rcente de la
recommandation UIT-R BS.1770.

19
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

Les dtails complets des mthodes de mesure de lintensit sonore et des


niveaux de crte vrais sont prsents lannexe A.

5.2 Mesure
La norme de tlvision numrique ATSC, A/53, exige la prsence dune
valeur dment tablie de dialnorm dans le flux lmentaire AC-3. Pour le
contenu ayant des signaux audio stendant sur une plage de valeurs
dintensit sonore, lobjectif est que la valeur du paramtre dialnorm
corresponde lintensit sonore de llment dancrage prdominant
(gnralement, le dialogue du programme).
Si le dialogue nest pas llment dancrage du contenu (p. ex. un
programme musical), cest lintensit sonore de llment du mixage son sur
lequel se fondera un tlspectateur raisonnable au moment de rgler sa
commande de volume qui devrait tre mesure et indique comme Niveau
de dialogue du contenu.
Dans les cas o il nest pas possible ou pratique de centrer la mesure sur
llment dancrage, une mesure intgre sur une longue dure de
lintensit sonore de tous les lments de la piste sonore devrait tre
excute.
tant donn que la mesure de lintensit sonore conformment la
recommandation BS.1770 est une mesure intgre, les passages silencieux
ont tendance abaisser la valeur mesure. Pour viter cette situation,
lintgration peut tre interrompue durant les segments de faible puissance.
Certains organismes, dont lUIT-R, tudient un procd arrt-pause-reprise
automatique, gnralement appel gating (dclenchement priodique),
que lUIT-R prvoit ajouter ultrieurement la recommandation BS.1770.
Certains appareils peuvent offrir une fonction de dclenchement priodique.
Toutefois, il nexiste pas encore de norme visant la mesure dintensit sonore
avec fonction de dclenchement priodique. Les utilisateurs devraient
employer la version courante de lUIT-R BS.1770 pour les mesures.
5.2.1 Mesure durant la production ou la postproduction
Durant le processus de production ou de postproduction, il est gnralement
possible didentifier llment dancrage (gnralement le dialogue) du
mixage son du programme et den mesurer lintensit sonore avec prcision.
Un chantillon reprsentatif de lancrage devrait tre mesur conformment
la recommandation BS.1770 [3]. Sil est impossible didentifier et de
mesurer seul llment dancrage, on devrait alors mesurer lintensit sonore
de longue dure de tous les lments de la piste sonore, sur toute la dure,
et la signaler comme Niveau de dialogue.
5.2.2 Mesure en temps rel en cours de production (vnement en direct)
Le but des mesures dintensit sonore durant un vnement en direct est de
guider le mixeur de son pour produire un contenu ayant lIntensit sonore
cible ou prtablie. Le principe de la mesure de lintensit sonore de
llment dancrage du contenu sapplique aussi aux productions en direct,

20
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

mais la mesure est faite en temps rel, mesure que progresse la


production.
Certains sonomtres BS.1770 prsentent un mode de mesure dite
fentre glissante ou moyenne mobile indiquant lintensit sonore dun
segment antrieur (en gnral de 3 10 secondes) du programme. Dautres
appareils peuvent utiliser une certaine reprsentation graphique de
lintensit sonore fonde sur la recommandation BS.1770 en complment
dune simple valeur numrique. Ces modes de mesure devraient tre
employs pour aider le mixeur de son obtenir lIntensit sonore cible. Ces
mesures sont particulirement utiles pour le mixage en milieu bruyant ou
quand il est impossible de maintenir un niveau de contrle uniforme.
La mesure fentre glissante est perturbe lorsque les priodes de
silence constituent une partie notable de la dure de la fentre, cest
pourquoi il convient demployer cette technique avec prudence.
La mesure continue de lintensit sonore du dbut de la production
jusqu un point ultrieur quelconque peut aussi fournir une indication de
lintensit sonore moyenne de la production.
5.2.3 Mesure de contenu de longue dure fini
Il peut tre difficile didentifier llment dancrage dun programme fini et
den mesurer lintensit sonore. Dans la mesure du possible, une partie du
contenu reprsentative de llment dancrage devrait tre isole et soumise
aux mesures. En labsence dun lment dancrage prcis, on devrait
mesurer lintensit sonore de llment de contenu sur lequel se fonderait un
tlspectateur raisonnable pour rgler le volume. Si aucune de ces mthodes
nest ralisable ou pratique, lintensit sonore de tous les lments du
contenu devrait tre mesure.
5.2.4 Mesure de contenu de courte dure
Les mixeurs de son de contenu de courte dure devraient suivre la pratique
dfinie pour la production/postproduction, telle quelle est dcrite dans la
section 5.2.1 ci-dessus. En rgle gnrale, toutefois, les oprateurs nont pas
accs au contenu de courte dure durant la production et llment
dancrage est rarement isol. Il est donc plus pratique de mesurer lintensit
sonore de tous les lments de la piste sonore sur toute la dure du contenu
de courte dure.
5.2.5 Mesure fonde sur des fichiers
Les mthodes de mesure dcrites ci-dessus sappliquent aussi au contenu
existant dans des fichiers numriques. En outre, le stockage dans des
fichiers facilite lautomatisation des mesures dintensit sonore et lexamen
de la valeur dialnorm (si le paramtre est dfini) qui a pu tre attribue au
contenu. Lintensit sonore du contenu peut tre ajuste au besoin la
valeur de lIntensit sonore cible ou dsire, en appliquant une correction de

21
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

gain globale3, ou la valeur dialnorm peut tre rcrite pour la faire


correspondre lintensit sonore mesure du contenu.

6 NIVEAU SONORE CIBLE ET NIVEAU DE CRTE VRAI POUR LA


DISTRIBUTION OU LCHANGE DE CONTENU
Pour la distribution et lchange de contenu sans mtadonnes (et lorsquil
nexiste pas de disposition pralable prise par les intresss visant lintensit
sonore), lIntensit sonore cible devrait tre de -24 LKFS. De faibles carts de
mesure par rapport cette valeur, allant jusqu environ 2 dB, sont prvus
en raison de lincertitude des mesures et sont acceptables (en raison de la
zone de confort voir lannexe E). Lintensit sonore du contenu ne devrait
pas tre ajuste dlibrment la limite infrieure ou suprieure de cette
plage. Le niveau de crte vrai devrait tre maintenu sous les -2 dB TP afin de
laisser une marge de scurit pour liminer les risques dcrtage en raison
du traitement aval (comme le codage audio utilis pour la distribution).

7 POINTS CONSIDRER DANS LA GESTION DES MTADONNES AYANT UN


EFFET SUR LINTENSIT SONORE DES PROGRAMMES AUDIO
Lencodeur AC-3 permet de dfinir 28 paramtres de mtadonnes portant
sur les caractristiques des signaux audio prsents dans le flux binaire (voir
lannexe G). Ces paramtres peuvent tre classs en trois groupes :
Mtadonnes informatives, groupe compos de sept paramtres
facultatifs pouvant tre employs pour dcrire le son cod. Ces
paramtres nont pas deffet sur le codage ou sur lexprience dcoute
du son dcod la maison.
Mtadonnes de contrle de base, groupe compos de 19 paramtres
dterminant la compression de la gamme dynamique, le mixage
rducteur, le dcodage de matrice et le filtrage utiliss dans certains
modes de fonctionnement de lencodeur professionnel et du dcodeur
grand public. Loptimisation du rglage de ces paramtres pour chaque
programme peut amliorer lexprience dcoute dans diverses conditions
dcoute et pour certains types de contenu. Toutefois, les valeurs par
dfaut peuvent tre employes sans nuire lexprience dcoute.
Mtadonnes de contrle essentielles, groupe compos de deux
paramtres qui sont cruciaux pour assurer lencodage et le dcodage
appropris :
Paramtre de mode canal (acmod), qui devrait tre choisi
correctement pour lancer le formatage de canaux appropri dans le
dcodeur, correspondant au contenu. La valeur errone de ce
paramtre peut modifier une transmission et entraner la perte de
dialogue au cours du codage dun programme 5.1; p. ex. codage dune
piste sonore 5.1 canaux avec la valeur de mtadonne 2/0.
3
Si le contenu est stock dans un format dbit binaire rduit (cod), il
peut tre ncessaire de dcoder le contenu, den modifier le niveau, puis
de le recoder.

22
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

Paramtre de Niveau de dialogue (dialnorm), que la norme A/53


exige de dment rgler pour liminer les risques de variation de sonie
(potentiellement grave) durant les transitions de contenu sur une
chane ou dans le changement de chane de TVN. Les valeurs errones
de dialnorm peuvent conduire une variation dintensit sonore
atteignant 30 dB.
Le paramtre dialnorm mis part, les valeurs par dfaut peuvent tre utilises
pour la plupart des autres paramtres de mtadonnes avec des rsultats
acceptables. Une fois que les mixeurs et les producteurs connaissent bien
ces paramtres grce un monitorage avec des systmes dmulation
disponibles, ils peuvent choisir des valeurs qui optimisent davantage la
prsentation du contenu de leurs programmes.

7.1 Importance de dialnorm


Le transport et le bon rglage de la valeur de dialnorm sont obligatoires en
tldiffusion numrique aux tats-Unis; voir le document ATSC A/53,
Part 5:2010, Section 5.5, Dialogue Level [1].
La prsente PR indique les mthodes permettant dassurer luniformit de
lintensit sonore en tlvision numrique grce lutilisation approprie de
la mtadonne dialnorm pour tous les contenus, et donc de se conformer la
norme A/53. Un grand nombre des principes pour la gestion efficace de
dialnorm sappliquent aussi la gestion dautres paramtres de mtadonnes
AC-3.
Comme lindique la section 6, de lgers carts de mesure pouvant
atteindre environ 2 dB sont prvus, et ils peuvent entraner de lgres
variations entre la valeur dialnorm et lintensit sonore relle du programme.
Ces faibles variations sont acceptables (en raison de la zone de confort voir
lannexe E); toutefois, les oprateurs ne devraient pas diffuser
intentionnellemnt la limite infrieure ou suprieure de cette plage.

7.2 Modes de gestion des mtadonnes


Lexigence visant lexactitude des valeurs de dialnorm, dacmod (mode canal)
et dautres mtadonnes peut tre remplie de trois faons diffrentes, la
discrtion de loprateur :
Mtadonnes statiques : le Niveau de dialogue de lencodeur AC-3
est rgl une valeur fixe et les Niveaux de dialogue de contenu
sont aligns sur cette valeur.
Mtadonnes prdfinies : des prrglages sont programms
dans lencodeur AC-3, chacun ayant une valeur dialnorm diffrente et la
valeur est applique par lintermdiaire dune interface
universelle (GPI) ou autre interface de contrle.
Mtadonnes dynamiques : lencodeur AC-3 est configur pour
recevoir des mtadonnes externes. Un systme de mtadonnes
dialnorm agile en amont peut tre utilis pour fournir des valeurs

23
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

dialnormdynamiques lencodeur, en fonction des variations de


lintensit sonore aux frontires des contenus.
Quand elles sont appliques judicieusement, les trois mthodes
fournissent un rsultat final conforme et acceptable pour le consommateur.
La majorit de lexplication de la prsente section de la PR est centre sur le
paramtre dialnorm. Le lecteur est invit consulter lAnnexe G et
rechercher les renseignements sur la faon dont les autres paramtres de
mtadonnes peuvent influer sur le codage.
Loprateur a aussi la possibilit dappliquer une mthode hybride en
choisissant une mthode pour la gestion de lintensit sonore et une autre
pour les autres mtadonnes, p. ex. utiliser une valeur dialnorm statique, mais
changer de mode de canal au besoin.

7.3 Utilisation de mtadonnes dialnorm statiques


Le concept de valeur dialnorm statique consiste simplement attribuer une
valeur fixe au paramtre dialnorm de lencodeur AC-3 pour le rseau ou le
systme de radiodiffusion et aligner le signal dentre audio de lencodeur
sur cette valeur. Loprateur peut choisir nimporte quelle valeur de dialnorm
de 31 1; toutefois, pour tre conforme la norme A/53, loprateur doit
employer une valeur gale lintensit sonore moyenne du dialogue de tout
le contenu. Voir la figure 7.1.

Figure 7.1 Concept de mtadonnes statiques

Source 1 Audio Audio source 1


Source n Audio Audio source n
Process, Storage, Distribution and Switching Traitement, stockage, distribution et commutation
Audio Audio

24
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

AC-3 Encoder Encodeur AC-3


Internal Metadata Values Valeurs de mtadonnes internes
ATSC Distribution Distribution ATSC
Consumer AC-3Decoder Dcodeur AC-3 du consommateur
Audio Audio

7.3.1 tablissement de la valeur dialnorm par la mthode de la moyenne longue


dure
Loprateur peut obtenir une premire approximation de conformit A/53
en mesurant lintensit sonore moyenne du matriel de longue dure la
sortie de la station et en attribuant cette valeur au paramtre dialnorm de
lencodeur AC-3. La priode pour ltablissement de la moyenne doit tre
choisie de manire inclure tous les types de contenu. Si le Niveau de
dialogue de segments particuliers de contenu scarte considrablement de
cette moyenne longue dure, le paramtre dialnorm ne correspondra pas au
Niveau de dialogue de ce contenu. Cette situation doit tre traite et
corrige par le crateur du programme ou par loprateur (voir les
sections 7.3.2 et 7.3.3.). Cette mthode peut ne pas sappliquer aux
oprateurs utilisant un contenu dont la gamme dynamique est
intentionnellement tendue.
7.3.2 tablissement de la valeur dialnorm pour la production
Les spcifications de distribution de contenu devraient prciser lIntensit
sonore cible de tous les contenus. Elles tablissent lancrage pour
superposer la musique et les effets sur la piste sonore. Lintensit sonore
devrait tre mesure au moyen dun sonomtre, suivant la recommandation
UIT-R BS.1770 [3], pour confirmer lintensit sonore moyenne du dialogue. Le
fournisseur devrait indiquer lintensit sonore moyenne relle avec le produit
livrable. Dans la mise en uvre de cette pratique, la collaboration entre le
fournisseur de contenu et le destinataire est ncessaire pour assurer la
bonne gestion de lintensit sonore.
7.3.3 Contenu non conforme lIntensit sonore cible
Si loprateur a besoin dutiliser un contenu non conforme la valeur de
lIntensit sonore cible tablie, un gain ou une perte de compensation doit
tre insr. Si la diffrence est inconnue, il faut mesurer lintensit sonore du
contenu avant dappliquer la compensation.
7.3.4 Valeur dialnorm et contrle de qualit dintensit sonore
Pour assurer la correspondance entre la valeur dialnorm et lintensit sonore,
loprateur doit avoir recours un sonomtre durant le contrle de qualit
et, au besoin, apporter les ajustements ncessaires pour faire en sorte que
lintensit sonore corresponde la valeur cible.
7.3.5 Rglage dialnorm dmission pour la conformit la norme A/53
Un oprateur recevant un contenu dintensit sonore fixe et qui ne fera
lobjet daucun traitement ou ajustement de gain aprs le rcepteur, devrait

25
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

rgler la valeur de dialnorm dans lencodeur AC-3 dmission la valeur de


lintensit sonore spcifie par le crateur du contenu (souvent indique
dans un contrat, un document de spcification des signaux, etc.). Si un gain
ou une perte fixe est applique dans la chane de signaux, la valeur dialnorm
de lencodeur AC-3 devrait tre compense en consquence de lintensit
sonore indique par le crateur.
Par exemple, si le crateur livre un contenu audio ayant une intensit
sonore de -24 LKFS et quaucun gain ou perte nest produit dans la chane, la
valeur dialnorm serait fixe 244. Cependant, si un gain de 3 dB est ajout,
ramenant lintensit sonore -21 LKFS, la valeur de dialnorm serait fixe 21.
Si cest plutt une perte de 2 dB qui est introduite, lintensit sonore
passerait -26 LKFS, et la valeur de dialnorm serait de 26.
Si un processeur dintensit sonore est employ, la valeur dialnorm de
lencodeur AC-3 devrait tre fixe la valeur du Niveau de dialogue la
sortie du processeur audio.
7.3.6 Avantage du paramtre dialnorm statique
Un systme avec dialnorm fixe prsente un risque minimal pour le contenu. Le
paramtre dialnorm statique a lavantage dtre simple, sans ncessiter la
gestion de donnes ou de matriel de mtadonnes supplmentaire. Cette
approche peut tre utilise avec tous les encodeurs AC-3 et elle est la seule
possible quand on utilise un encodeur sans entre de mtadonnes ou
commande GPI externe.

7.4 Utilisation de mtadonnes dialnorm prdfinies


Si loprateur doit composer avec un petit nombre de modifications discrtes
de la valeur dialnorm ou dautres paramtres de mtadonnes, certains
systmes dencodage AC-3 peuvent tre configurs pour permettre la
slection dune valeur de mtadonnes dans une liste prdfinie, par
lintermdiaire dune commande externe; p. ex. au moyen dune fermeture
de contact avec une GPI. Cette mthode exige des dclencheurs externes de
GPI pour la signalisation de valeurs prdfinies prcises partir de la liste de
lecture ou du commutateur dautomatisation. Elle est souvent employe
pour changer de mode de codage, de stro 5.1, mme lorsque dialnorm est
statique et ne prend quune seule valeur. Voir la figure 7.2.

4
Comme il est signal dans la section 3.4, dialnorm est exprim comme un entier
non sign.

26
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

Figure 7.2 Concept de mtadonnes prdfinies

Source 1 Audio Audio source 1


Source n Audio Audio source n
Process, Storage, Distribution and Switching Traitement, stockage, distribution et commutation
Audio Audio
Automation Automatisme
External Control Commande externe
AC-3 Encoder Encoder AC-3
Internal Metadata Presets Valeurs de mtadonnes internes prdfinies
ATSC Distribution Distribution ATSC
Consumer AC-3 Decoder Dcodeur AC-3 de consommateur
Audio Audio

7.4.1 Mise en uvre


La mise en uvre de mtadonnes prdfinies est semblable celle des
mtadonnes statiques. Les valeurs prtablies sont charges dans
lencodeur AC-3 en fonction des diffrences connues dintensit sonore du
contenu. La conformit la norme A/53 exige que lintensit sonore du
contenu livr corresponde lune des valeurs prdfinies et que le systme
dautomatisation soit programm pour changer de valeur prdfinie en
fonction de diffrentes valeurs dintensit sonore de contenu et de mode de
canal.
7.4.2 Exigence de synchro trame AC-3
Certains encodeurs AC-3 rinitialisent et perturbent la sortie du flux binaire
audio quand un prrglage est chang. Selon le type dencodeur ATSC
utilis, cette modification peut produire un bruit parasite audible en ondes.
Pour liminer ce risque, il peut tre ncessaire de prvoir un synchro trame
AC-3 la sortie de lencodeur AC-3 pour stabiliser la source AC-3 de
lencodeur ATSC.

27
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

7.5 Utilisation de mtadonnes dialnorm dynamiques


Un systme de mtadonnes agile permet dattribuer diffrentes valeurs
dialnorm diffrents contenus ayant une intensit sonore diffrente.
Lopration consiste incorporer le paramtre dialnorm dans le flux binaire de
mtadonnes accompagnant le contenu dans un emplacement en
amont . Les mtadonnes sont extraites juste avant lencodeur AC-3 et
raccordes une entre de mtadonnes srie externe. La valeur dialnorm
change de faon approprie aux frontires des contenus. Voir la figure 7.3.

Figure 7.3 Concept de mtadonnes dynamiques

Source 1 Source 1
Source n Source n
Process, Storage, distribution and Switching Traitement, stockage, distribution et commutation
Embed Incorpore
Metadata Values Valeurs de mtadonnes
De-Embed Extrait
Metadata Mtadonnes
Audio Audio
AC-3 Encoder Encodeur AC-3
ATSC Distribution Distribution ATSC
Consumer AC-3 Decoder Dcodeur AC-3 du consommateur

7.5.1 Dploiement du systme


Quand un oprateur de rseau utilise la mthode dattribution dynamique
des mtadonnes, la mme mthode doit tre adopte dans toutes les
installations des stations de radiodiffusion ou de la tte de rseau du MVPD
qui reoit le contenu du rseau. Cette technique ncessite le dploiement de
matriel dencodage et de dcodage complexe tous les points dentre, de

28
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

sortie, de contrle et de traitement de la chane de distribution, et ce, du


point dorigine des mtadonnes jusqu tous les encodeurs AC-3. Il est
essentiel que les mtadonnes dynamiques atteignent lencodeur AC-3.
Plusieurs mthodes de distribution et de stockage de mtadonnes
dynamiques sont disponibles, qui peuvent tre utilises de manire
autonome ou combine les mtadonnes AC-3 (comme il est dcrit dans
lannexe G) constituent un sous-ensemble grand public des mtadonnes
Dolby E dcrites dans le document SMPTE RDD 6 [22]. Ces donnes peuvent
tre transportes sur des liaisons de donnes srie, comme donnes
auxiliaires verticales (VANC) ou comme donnes transportes dans les flux
binaires compresss. Elles peuvent aussi tre stockes dans des systmes de
fichiers.
7.5.1.1 Mtadonnes Dolby E sur liaison srie
Les mtadonnes Dolby E dans leur forme bande de base peuvent tre
transportes par liaison srie. Ce procd ncessite une couche srie
rserve demeurant troitement synchronise dans le temps avec les
signaux audio et vido.
7.5.1.2 Mtadonnes Dolby E en VANC
Les mtadonnes Dolby E peuvent aussi tre incorpores dans les VANC des
systmes numriques srie de dfinition standard ou haute dfinition, puis
extraites en aval suivant les indications de la norme SMPTE 2020 [8]. Cette
mthode peut ncessiter des multiplexeurs et des dmultiplexeurs et exige
la prise en charge par le matriel de stockage vido, de codage, de
traitement et de distribution et la capacit de passer le signal VANC en le
laissant intact. Certains dispositifs de stockage ont une capacit VANC
limite ou nulle.
7.5.1.3 Mtadonnes et codecs
Certains systmes utiliss pour les applications de liaison secondaire, de
distribution et de stockage ont aussi la capacit de transporter les
mtadonnes Dolby E. Ces systmes incluent le flux binaire Dolby E
compress lui-mme et des formats propritaires 5 qui ncessitent lemploi
dencodeurs et de dcodeurs audio spcialiss. Ils peuvent aussi ncessiter
du matriel capable de dcaler la synchronisation vido pour compenser la
latence dencodage et de dcodage introduite. La plupart des quipements
de vido numrique professionnels peuvent tre configurs pour passer ces
signaux cods dans des canaux audio numriques standard, conformes
SMPTE 337 [23].
7.5.1.4 Mtadonnes enregistres dans des fichiers
Il existe un grand nombre de techniques de stockage de mtadonnes Dolby
E dans des fichiers, certaines tant normalises et quelques-unes,
exclusives. Ce sujet est hors du propos du prsent document.

5
P. ex. e-squared de Linear Acoustic et Quad Phase Aligned de Tandberg.

29
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

7.5.2 Technique de production en direct


Dans la production en direct avec la mthode des mtadonnes dynamiques,
lingnieur du son au mixage de la production tlvisuelle slectionne une
intensit sonore cible particulire, mais arbitraire, pour chaque programme,
en tenant compte de la dynamique, de la ,marge de scurit et du type
dambiance du programme. Ce paramtre tablit lancrage de lintensit
sonore pour la superposition de la musique et des effets sur la piste sonore.
Suivant la spcification du produit livrable, lIntensit sonore cible est soit
transporte dans le signal cod par la valeur du paramtre dialnorm, soit
communique au distributeur pour codage ultrieur.
7.5.3 Technique de production en diffr
Dans la postproduction, avec la mthode des mtadonnes dynamiques,
lintensit sonore du mixage final est dtermine soit durant la production du
programme ou une fois la production termine. Suivant la spcification du
produit livrable, lIntensit sonore cible est soit transporte dans le signal
cod par la valeur du paramtre dialnorm, soit communique au distributeur
pour codage ultrieur. Linsertion dans le produit livrable peut tre excute
dans un processus de renregistrement ou en ayant recours la fonction de
prlecture offerte dans certains magntoscopes. Voir la figure 7.4.

Figure 7.4 Options dinsertion des mtadonnes

Dub Insertion Insertion en cours de renregistrement


Playback VTR Magntoscope de lecture
VANC Embedder Incorporateur de VANC
Metadata Source Source de mtadonnes
Record VTR Magntoscope denregistrement
Pre-Read Insertion Insertion en prlecture
Pre-Read VTR Magntoscope de prlecture

7.5.4 Contrle de la production


La piste sonore doit faire lobjet de mesures, conformment la
recommandation UIT-R BS.1770 [3], pour confirmer que lintensit sonore
moyenne pour toute la dure de la production correspond la valeur dialnorm
choisie. (Voir la section 5.)

30
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

7.5.5 Mtadonnes semi-dynamiques


Un oprateur peut employer un systme de mtadonnes dynamiques, mais
choisir de simplifier la cration et linsertion des mtadonnes en prcisant
les valeurs dIntensit sonore cible statiques que devront utiliser les
fournisseurs de contenu.
7.5.6 Incidence de la perte de mtadonnes sur le contenu
Un risque li lutilisation dun systme de mtadonnes dynamiques est la
possibilit quil existe un cart lev dintensit sonore dun programme un
autre et entre les chanes en cas de perte des mtadonnes. Tous les
encodeurs AC-3 ayant une entre de mtadonnes externe prsentent une
fonction de retour aux paramtres dfinis, dite de rversion , destine
attnuer lincidence de la perte de mtadonnes. Dot de cette fonction,
lencodeur peut tre configur pour conserver la valeur de mtadonne la
plus rcente ou revenir aux valeurs prdfinies par loprateur. Bien que la
rversion puisse rduire au minimum les effets sur le consommateur, lerreur
dans les paramtres dintensit sonore ou dautres mtadonnes (comme le
mode de canal) peut tout de mme tre grave. Le paramtre de rversion
devrait tre choisi de manire rduire au minimum lincidence de la perte
de mtadonnes sur le contenu prsent.
7.5.7 Hybride statique-dynamique
Dans certains cas, un oprateur peut choisir dutiliser intentionnellement la
fonction de rversion pour traiter un contenu sans mtadonnes.
Il est crucial que les oprateurs choisissent les rglages appropris pour
tous les paramtres de mtadonnes prdfinis pour la fonction de rversion
et quils veillent particulirement ce que lintensit sonore du contenu
distribu sans mtadonnes corresponde au paramtre dialnorm prdfini
pour la rversion. La fonction de rversion peut aussi servir de protection
contre la perte de mtadonnes, mme si les paramtres de mtadonnes
de la rversion ne concident pas exactement avec ceux du contenu. En cas
de perte de mtadonnes, tout le contenu cod aprs la rversion est soumis
ces paramtres. Il est particulirement crucial que le mode de canal soit
rgl de manire protger tout le contenu dans nimporte quelle situation.
Lutilisation accidentelle du mode de canaux 2/0 pour un contenu 5.1 aurait
pour effet dliminer les canaux 3 6 de laudio cod et de compromettre le
contenu.
7.5.8 Avantages des mtadonnes dynamiques
Le systme dynamique prsente la plus grande souplesse pour le fournisseur
de contenu sans imposer de limites la crativit.

8 MTHODES DE CONTRLE EFFICACE DE LINTENSIT SONORE ENTRE


PROGRAMME ET CONTENU INTERSTITIEL
En raison de sa gamme dynamique tendue et des nouvelles techniques de gestion de lintensit
sonore, le systme audio de tlvision numrique ATSC (AC-3) prsente la possibilit de

31
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

changements dintensit sonore indsirables dans les transitions de contenus (passage dun
lment de contenu un autre) si le systme nest pas gr de faon approprie. Cette situation
est une cause de contrarit connue des tlspectateurs, qui les force souvent rgler le volume
de leur appareil durant les transitions pour maintenir lintensit sonore un niveau confortable.
Lapplication dune bonne gestion de lintensit sonore des programmes de TVN permet de
remdier ce problme.
Le systme AC-3 intgre la technologie ncessaire pour attnuer les variations dintensit
sonore se produisant au passage des programmes aux contenus interstitiels. Les techniques
prvues sont dcrites ci-dessous.

8.1 Solutions efficaces


La variation importante dintensit sonore durant les transitions peut tre contrle efficacement
en veillant ce que le paramtre dialnorm corresponde bien au Niveau de dialogue de tout le
contenu :
8.1.1 Pour les oprateurs employant un systme dialnorm statique (voir la section Error:
Reference source not found)
a) Veiller ce que tout le contenu rponde lIntensit sonore cible et que lintensit sonore
longue dure corresponde la valeur dialnorm.
b) Employer un dispositif de contrle de gain de fichiers pour faire correspondre la valeur
cible lintensit sonore longue dure du contenu de fichiers non conformes.
c) Employer un dispositif de traitement de lintensit sonore en temps rel pour faire
correspondre la valeur cible le contenu en temps rel non conforme.
8.1.2 Pour les oprateurs employant un systme dialnorm dynamique (voir la section 7.5)
a) Veiller ce quau cours de la production, de la postproduction ou de lingestion,
lintensit sonore du contenu soit mesure (voir section 5.2) et que le contenu soit
tiquet de la bonne valeur dialnorm, correspondant lintensit sonore relle du contenu
particulier.
b) Employer un dispositif de mesure et de cration mdia de fichiers pour rgler dialnorm
lintensit sonore moyenne du contenu particulier.
c) Employer un dispositif de traitement en temps rel servant faire correspondre le
contenu une intensit sonore prcise. Appliquer une valeur dialnorm correspondant
lintensit sonore de tout le contenu trait par ce dispositif.

8.2 Conditions hostiles


Conditions notables pouvant nuire aux transitions entre les programmes et le contenu
interstitiel aux extrmits des contenus :
Les fournisseurs de contenu augmentent souvent leffet dramatique en utilisant la
dynamique de programme et en manipulant lintensit sonore pour obtenir un effet voulu
sur les auditeurs. Cette opration est parfois excute la fin des segments de
programmes prcdant une pause publicitaire.
Une variation extrme, allant au-del des limites de la zone de confort (voir lannexe E),
peut ncessiter quun auditeur rgle le volume pour compenser le changement important,
temporaire, de lintensit sonore. Quand un message publicitaire ou dautopublicit est
prsent lentre ou la sortie des pauses, lauditeur peut devoir rgler de nouveau le

32
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

volume pour lcoute du contenu de courte dure. Cette situation sest avre contrariante
pour les tlspectateurs.

8.3 Recommandations sommaires


Voici les recommandations visant diminuer lincidence ngative des variations dintensit
sonore au passage des programmes aux contenus interstitiels :
1) Dans un systme mtadonnes statiques, veiller bien cibler lintensit sonore moyenne,
ou
2) Dans un systme mtadonnes dynamiques, veiller ce que la valeur dialnorm de cration
mdia corresponde lintensit sonore mesure du contenu.
3) Sensibiliser le fournisseur de contenu lutilisation potentiellement abusive de la gamme
dynamique et la possibilit que les tlspectateurs se plaignent en cas de variation
importante dintensit sonore.
a) Expliquer cette situation dans les spcifications de distribution de contenu que loprateur
exige du fournisseur :
i) Dcrire lincidence ngative que produit sur les tlspectateurs le mixage dpassant
les limites de la zone de confort dcoute (voir lannexe E) au passage et au retour des
pauses.
ii) Dcrire lintensit sonore prvue du matriel interstitiel lintention du fournisseur
de programmes, dans un effort de sensibilisation cette situation, linsatisfaction
possible de lauditeur et aux rpercussions ngatives potentielles sur la prsentation.
b) Veiller utiliser le niveau de pression acoustique (SPL) appropri dans les salles utilises
pour le mixage et le contrle des pistes sonores de contenu.
i) Renvoyer les fournisseurs de contenu la section 10 de la prsente PR, appuyant
lutilisation dun niveau de contrle SPL convenable durant la postproduction de
contenu. Le niveau de contrle SPL choisi devrait tre appropri pour les dimensions
de la salle de mixage et tenir compte de lenvironnement dcoute du tlspectateur
type de TVN. Un niveau bas de contrle SPL en salle de contrle postproduction
entrane des mixages dont lintensit sonore sera plus leve et dont la dynamique
sera plus contenue et approprie, que les environnements sonores classiques, plus
forts . Il est essentiel de bien choisir lenvironnement de contrle de
postproduction ou de reproduction pour tablir des niveaux de mixage appropris
pour la tlvision numrique.
ii) Songer spcifier une valeur de crte vraie maximale pour la piste sonore. Cette
pratique limite la gamme dynamique en rduisant la marge de scurit. Elle permet
aux tlspectateurs de rgler le volume gnral avec un risque rduit de variation
importante dintensit sonore.
4) On ne devrait pas compter sur le systme de DRC AC-3 pour contrler les variations
dintensit sonore au passage des programmes au contenu interstitiel.

8.4 Insertion de publicit locale par la station de tlvision et le MVPD


Dans le cas dinsertion de messages publicitaires ou de segments locaux par la station de
tlvision ou le MVPD, loprateur devrait veiller ce que le Niveau de dialogue de linsertion
locale concide avec le rglage dialnorm du flux audio insr.

33
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

Si le produit du crateur destin au rseau est dcod en bande de base, il faut mesurer
lintensit sonore du flux audio dcod et rgler la valeur dialnorm du r-encodeur AC-3 pour
quelle corresponde lintensit sonore mesure, pour ltape de codage suivante. Dans ce cas,
soit que loprateur modifie lintensit sonore du contenu du crateur pour quelle corresponde
la valeur cible du systme de loprateur, soit quil utilise la valeur dintensit sonore du contenu
du crateur (mesure) pour rgler la valeur dialnorm de ltape suivante dencodage AC-3. cette
tape de recodage, il est crucial que les autres paramtres de mtadonnes soient rgls
uniformment et de faon approprie.

9 GESTION DE LA DYNAMIQUE
Le systme audio de TVN est capable de fournir une gamme dynamique (intervalle entre les sons
les plus faibles et les sons les plus forts) trs large. Les producteurs de contenu se servent
souvent de la gamme dynamique comme une des mthodes de communication de lintention
artistique.
Toutefois, il pourrait y avoir un conflit entre le producteur dsirant distribuer un contenu de
gamme dynamique tendue et le tlspectateur qui ne peut pas, ou ne veut pas profiter de cette
gamme dynamique accrue. Limpossibilit peut provenir de lquipement du tlspectateur qui
nest pas en mesure de reproduire la gamme de sons voulue ou dun environnement dcoute qui
ne permet pas de jouir de la gamme dynamique tendue. Ainsi, lobjectif de conserver la gamme
dynamique originale du contenu et celui de satisfaire les tlspectateurs ne vont souvent pas de
pair.
Un des objectifs du systme AC-3 est de doter les producteurs de contenu de la plus grande
libert et de la plus grande souplesse dans le choix du contrle de la gamme dynamique (DRC)
au moment de crer leur contenu. Le systme AC-3 transmet ces options de DRC au
tlspectateur, dont les choix agiront avec le systme DRC dune faon connue et reproductible.
Il existe plusieurs mthodes de contrle de la gamme dynamique. Certaines sont appliques
avant lencodage du signal audio, dautres, aprs le dcodage et dautres encore, dans les deux
domaines :
1) Une approche est la compression classique et (ou) la limitation, o le rglage du gain est
appliqu aux signaux audio avant lencodage.
2) Une autre approche est lemploi du systme de codage AC-3, qui gnre des mots de contrle
de gain durant lencodage, mais qui napplique le rglage du gain aux signaux audio
quaprs le dcodage, ce qui permet lutilisateur de choisir facultativement ltendue de
la plage dynamique quil souhaite.
La principale diffrence entre les deux approches est que la mthode AC-3 produit un rsultat
rversible et lautre, un rsultat permanent. Une mthode hybride peut aussi tre adopte, qui
combine une partie de traitement permanent et une partie rversible dans une proportion
tablie par le radiodiffuseur.

9.1 Systme de contrle de dynamique AC-3 ( rversible )


Pour donner la possibilit la plus grande partie des tlspectateurs dapprcier le contenu dans
la plus grande diversit de conditions dcoute, un mcanisme intgr au systme audio de TVN
est conu pour permettre de restreindre la gamme dynamique du contenu. En termes simples, le
systme de contrle de dynamique (DRC) AC-3 peut tre considr comme un
compresseur/limiteur divis en deux; le signal de contrle est gnr dans lencodeur et le signal
de contrle peut tre appliqu dans le dcodeur. Dans ce systme, le signal audio nest pas

34
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

modifi de loriginal avant datteindre le dcodeur du consommateur, de sorte que le contrle de


la gamme dynamique peut tre considr comme rversible . Les dtails du fonctionnement
du DRC sont prsents lannexe F.
Les mtadonnes sont toujours transmises comme partie du flux audio cod. Les encodeurs
AC-3 ncessitent le rglage prcis de certains paramtres de mtadonnes. Le DRC est un de ces
paramtres et dialnorm, ou le paramtre dintensit sonore indique, en est un autre. Bien quil soit
distinct de dialnorm, le bon fonctionnement du systme DRC est trs dpendant dune mesure
juste du contenu et de lindication galement juste de lintensit sonore de ce contenu. On
trouvera les lignes directrices sur les mesures dans la section 5 du prsent document.
Le systme DRC modifie la gamme dynamique du contenu dcod en abaissant le niveau des
parties trs fortes du contenu pour viter de gner le tlspectateur et en levant le niveau des
parties trs faibles pour en amliorer ladaptation lenvironnement dcoute. Si, toutefois, le
tlspectateur a un cinma maison ou autre environnement dcoute pouvant reproduire toute la
gamme dynamique, il peut choisir de mettre hors fonction le systme DRC pour recevoir le
contenu dans sa version mixe originale.
Quand le tlspectateur met hors fonction le systme DRC, la gamme dynamique du contenu
est identique la dynamique dentre dans lencodeur AC-3. tant donn que lutilisation du
systme DRC est slectionnable par le tlspectateur, le systme AC-3 peut fournir plusieurs
options dcoute au tlspectateur, pour rpondre divers systmes de reproduction et
environnements dcoute.
9.1.1 DRC en mode ligne et en mode RF
Dans lencodeur audio AC-3, deux signaux de commande sont calculs par le systme DRC :
1) Un signal de commande est employ pour rduire lgrement la gamme dynamique du
contenu (convient aux composantes audio directement raccordes).
2) Lautre signal de commande est employ pour le contrle plus nergique de la gamme
dynamique (convient au matriel raccord avec signaux analogiques moduls RF ou au
matriel autrement incapable de grer la gamme dynamique tendue potentielle du signal
original).
Le fabricant du matriel choisit lun de ces deux signaux comme mode par dfaut, en
fonction de la conception et de lutilisation prvue du produit. Pour les tlspectateurs dsirant la
gamme dynamique intgrale du signal original, il est possible de ne pas tenir compte de ces
signaux de commande et dobtenir la reproduction du contenu exactement comme le producteur
la cr. Cette mthode demploi de signaux de commande et audio distincts rsulte en un
systme DRC rversible , capable de satisfaire simultanment des tlspectateurs diffrents,
dans des conditions dcoute et des situations diffrentes.
Deux types de signaux de commande DRC sont calculs, car il existe deux scnarios suivant
lesquels la rduction/laugmentation de gain peut tre souhaite.
Dans la premire situation, une rduction lgre de la gamme dynamique est voulue. Cest le
mode par dfaut de nombreux dispositifs qui utilisent les interconnexions analogiques bande de
base (souvent disponibles sur les sorties rouge et blanche des connecteurs de sortie RCA ).
Ces connexions ne constituent pas une interface professionnelle, mais sont souvent acceptables
comme interface consommateur. Ce signal de commande DRC est appel mode ligne dans
linterface de commande dencodeur dans la plupart des produits professionnels, car il fait
souvent rfrence au processus dinterconnexion au niveau lignes. Le nom du paramtre de
mtadonnes correspondant est dynrng.

35
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

Un deuxime signal de commande DRC, plus nergique, est calcul en mme temps. Il est
conu pour lemploi dans les produits pouvant tre interconnects par un signal analogique
modul RF. La gamme dynamique des signaux moduls RF est gnralement plus troite que
celle des signaux utilisant le processus dinterconnexion au niveau lignes. En mode RF, un gain
de 11 dB est appliqu aux fins dharmonisation de lintensit sonore avec celle des anciens
systmes analogiques. Ce mode est le mode par dfaut des dcodeurs de MVPD ainsi que des
tlviseurs quips de syntoniseurs numriques et de petits haut-parleurs intgrs. Le nom du
paramtre de mtadonnes correspondant est compr. Pour obtenir plus de renseignements propos
des recommandations visant lharmonisation de lintensit sonore pour les produits grand public,
voir le document CEA-CEB11 [25]. Les recommandations du prsent document et du document
CEA-CEB11 ont t coordonnes et sont complmentaires.
9.1.2 Contrle
Lemploi dun systme dans lequel les mots de gain (voir annexe F) de DRC sont calculs
dans lencodeur et appliqus dans le dcodeur prsente des avantages. Un des avantages de ce
type de conception systme est quil permet de visualiser, ou dmuler, les fonctions de
compresseur/limiteur en cours de production, bien avant que le contenu soit cod. Les
producteurs peuvent vrifier le contenu au fur et mesure quil est produit pour en entendre le
rsultat selon des modes de dynamique prtablis.
Les effets de ce systme DRC seront audibles aux mixeurs travaillant dans un environnement
de contrle professionnel, mais le processus devrait tre considr dans le contexte du
consommateur type, dans un environnement domestique type, o la rduction et laugmentation
de gain dont il est question passent gnralement inaperues. Dans la plupart des situations, les
effets du DRC en mode ligne amliorent le rendu gnral du contenu en adaptant mieux les
signaux audio aux capacits de reproduction de lquipement et de lespace dcoute du
tlspectateur.
9.1.3 Relations avec dialnorm
Tous les calculs de DRC sont fonds sur lintensit sonore indique du contenu et relatifs cette
intensit, reprsente par le paramtre de mtadonnes dialnorm. En dautres mots, lencodeur doit
connatre le niveau sonore prvu du contenu pour dterminer quand le contenu est trop fort
ou trop faible . Le paramtre dialnorm dfinit efficacement ce niveau cible. En consquence, il
est trs important que dialnorm indique avec prcision lintensit sonore du contenu.
Le paramtre dialnorm est aussi utilis pour tablir le seuil dun processus de protection contre
les surcharges quelque peu dissimul et invitable, conu pour empcher les signaux audio
rduits par mixage de surcharger le matriel du consommateur. La protection contre la surcharge
utilise une balistique approprie pour liminer les risques de surcharge, mais elle est beaucoup
moins quidale pour la qualit sonore. Il convient dviter la protection contre les surcharges. Il
est possible de le faire en veillant ce que le paramtre dialnorm reprsente avec prcision
lintensit sonore relle du contenu audio.
9.1.4 Codage professionnel
Dans les encodeurs AC-3, les caractristiques de rduction et daugmentation de gain des modes
DRC RF et de ligne sont dtermines par un groupe de profils DRC. Ces profils dcrivent de
nombreux paramtres, y compris la plage de rduction de gain, la plage daugmentation de gain
ainsi que les temps dattaque et de relchement. Entre ces plages se trouve une plage linaire
(dite zone sans correction ) o aucune rduction ou augmentation de gain na lieu. Il est prvu
que la majorit des contenus mixs de manire professionnelle se trouvera dans la plage sans

36
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

correction , o le contenu sera distribu exactement tel quil est produit, sans modification
supplmentaire (ou continue). Les excursions au-del de cette zone sans correction peuvent
servir communiquer une intention artistique particulire. Il est noter que le paramtre dialnorm
dtermine la position de la zone sans correction, ce qui indique, une fois de plus, quil est
essentiel que le paramtre dialnorm reprsente avec prcision lintensit sonore du contenu.
Cinq profils sont dfinis dans lencodeur AC-3, qui sont les suivants :
Music Light (Musique lger)
Music Standard (Musique standard)
Film Light (Film lger)
Film standard
Speech (Parole).
La diffrence entre les options de DRC musique et film peut tre subtile pour un auditeur
type, mais lun ou lautre peut convenir davantage certains types de contenu. La meilleure
faon de le dterminer est de contrler au moyen dun mulateur appropri. Les versions
lgres des profils ont une zone sans correction beaucoup plus large. Ainsi, la rduction ou
laugmentation de gain commence plus loin du niveau audio moyen du programme, ce qui rduit
la rduction ou laugmentation de gain par rapport la version standard du profil.
Comme son nom lindique, le profil parole est prvu pour les programmes ne contenant que
de la parole (un format de station radio interactive , par exemple). Ce profil peut introduire un
phnomne parasite de DRC perceptible dans les programmes ayant de la musique et des effets
sonores. Pour obtenir plus de renseignements sur les profils DRC, veuillez consulter lAnnexe F.
9.1.5 DRC AC-3 : slection de None
Il y a aussi un choix appel None (aucun), qui a pour effet de ne slectionner aucun des
profils DRC nomms. La slection de loption None (par loprateur) empche la cration
des mots de commande DRC.
Loption None est un choix acceptable dans la mesure o lon comprend bien les
implications de ne pas choisir de profil DRC :
La caractristique de rversibilit du systme DRC ne sera pas offerte au consommateur.
La slection de None empche le tlspectateur de choisir une option DRC ou
dactiver des fonctions comme Late Night (fin de soire) ou Midnight (nuit) dans
certains appareils qui utilisent le mode DRC RF.
La gamme dynamique devrait tre contrle dune autre faon par loprateur ou par le
crateur du programme.
Dans certains rcepteurs de TVN ayant une capacit de volume limite, il est possible que
la limite de reproduction soit dpasse.
Les mots de commande DRC du mode RF sont aussi utiliss pour tablir des limites de
protection. Un limiteur de protection empche lcrtage dans les dcodeurs des
consommateurs, qui pourrait tre entran par un rglage dialnorm erron conjugu avec
une programmation trs dynamique. La slection de loption None nempche pas la
cration de mots de commande DRC de limite de protection, qui sont trs nergiques et
peu artistiques. Le processus de limitation de protection a un temps dattaque trs court et
un temps de relchement trs long, ce qui peut produire des phnomnes parasites
audibles dsagrables.

37
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

Les systmes qui utilisent les signaux ATSC comme source de distribution DS (p. ex.
cblodistribution analogique DS) ne seront pas en mesure demployer le DRC en mode
RF pour tablir un signal analogique DS de gamme dynamique rduite. Pour plus de
conseils, voir la pratique recommande ATSC A/79 [24].
Pour que le systme de contrle de gamme dynamique AC-3 soit fonctionnel, les oprateurs
devraient choisir un autre profil que None lorsquappropri.

9.2 Traitement de la dynamique avec interface de mtadonnes ( rversible )


Des processeurs de mtadonnes audio ont t dvelopps, qui permettent la cration de
plusieurs valeurs de gain en mode ligne et en mode RF pouvant tre enregistres dans des
prrglages ou profils dfinis par lutilisateur. Il est possible dexcuter un traitement
supplmentaire dans le domaine des mtadonnes pour obtenir des rsultats beaucoup plus
proches de ceux du traitement classique, mais avec lavantage de la rversibilit . Ces
technologies fonctionnent de pair avec lencodeur AC-3, mesurant les signaux audio et calculant
les valeurs de gain, puis les passant lencodeur pour insertion dans le flux binaire AC-3.
Lapplication est analogue aux fonctions de ligne et RF dcrites ci-dessus, mais elle a recours
des profils diffrents pour remplir des objectifs de traitement de la dynamique diffrents.
Ces profils de remplacement permettent de prvoir un rapport traitement DRC permanent-
traitement DRC par mtadonnes rglable. un extrmit de lajustement, le traitement audio
multibande permanent est appliqu au flux audio aprs quil a t dabord prconditionn, par
application des mtadonnes, pour rduire au minimum le degr de traitement permanent
pouvant tre ncessaire.
Les signaux audio rsultants sont encods AC-3 avec une valeur dialnorm statique et lun des
profils DRC classiques peut tre slectionn. lautre extrmit du rapport rglable, le flux
audio qui a t prconditionn par application de mtadonnes est ensuite analys et les mots de
commande de gain DRC pour le mode de ligne et le mode RF sont gnrs par slection par
loprateur.
Les paramtres classiques tels que temps dattaque (attack) et de relchement (release), seuil
(threshold), plage de commande automatique de gain (CAG), fentre antiparasite (gate) et
maintien (freeze) peuvent tre rgls de manire trs semblable celle dun processeur audio
permanent, mais les rsultats sont plutt inclus dans le flux binaire AC-3, accompagnant le
programme audio cod. Il est ainsi possible de raliser un traitement plus nergique que celui qui
est prvu dans les cinq profils dorigine. Le programme audio original est livr au consommateur
et les valeurs DRC sont appliques au signal audio par dfaut, mais le tlspectateur peut les
dsactiver sil le souhaite.

9.3 Traitement de la dynamique sans interface de mtadonnes (irrversible)


En diffusion radio AM analogique, les systmes de CAG ont t crs pour assurer la modulation
approprie de la frquence de porteuse des stations de radiodiffusion. Une modulation errone
pouvait rduire la couverture si le niveau moyen tait trop bas et pouvait provoquer de
linterfrence si le niveau de crte tait trop lev. Cette opration est devenue plus difficile pour
les systmes FM, qui utilisent la praccentuation pour augmenter le niveau des hautes frquences
avant lmission afin de rduire le bruit au minimum. Essentiellement, ces systmes de CAG
(souvent appels contrleurs de modulation ) contrlaient le rapport valeur de crte sur valeur
moyenne des signaux audio, et donc, la dynamique. la diffrence des approches mtadonnes

38
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

dcrites plus haut, les modifications de gain sont appliques immdiatement au signal dentre,
avant la transmission aux consommateurs, et les rsultats sont donc jugs irrversibles.
Les premiers systmes de CAG taient des systmes large bande comportant un seul
dtecteur de niveau et un seul lment de gain pour contrler toute la largeur de bande audio.
Dans les dbuts de la radiodiffusion, cette pratique pouvant tre acceptable, parce que la largeur
de bande audio tait limite et que des oprateurs comptents ralisaient des programmes audio
plus uniformes. Toutefois, en raison de laugmentation de la largeur de bande audio et de la
diminution de lintervention des oprateurs, il fallait dvelopper dautres techniques pour
maintenir le contrle et rduire au minimum les effets secondaires audibles du processus de
CAG.
Un phnomne parasite potentiel de la CAG large bande est la possibilit que le niveau dune
partie du spectre audio soit modifi cause dune autre partie du spectre audio sans rapport avec
la premire, qui a plus de puissance. Pour reprsenter ce phnomne, on peut imaginer un signal
audio contenant les sons dune grosse caisse basse frquence et dune flte de frquence plus
leve. En rponse lnergie leve de la grosse caisse, le systme de CAG large bande simple
ferait varier le signal de commande, et donc le niveau, de toutes les frquences. Cette
modification de niveau pourrait tre approprie pour la grosse caisse, mais entranerait une
fluctuation inapproprie dans le niveau du signal de la flte, un effet communment appel
pompage . Le dveloppement de systmes de traitement multibandes a remdi largement ce
problme, car le signal dentre est divis en deux bandes de frquences ou plus et une CAG est
applique chacune des bandes. Les systmes multibandes permettent un plus grand contrle
accompagn de moins dinteraction entre les diffrentes parties du spectre audio, mais peuvent
aussi modifier lquilibre spectral du signal appliqu.
Dautres techniques ont volu pour rduire au minimum les effets secondaires comme le
pompage , la surcharge entrane par la praccentuation et laugmentation du bruit de fond. Il
sagit notamment du traitement en srie, du traitement en prlecture, de lcrtage et du fentrage
antiparasites. Le traitement en srie consiste mettre en srie deux sections de CAG ou plus, de
vitesse diffrente, pour contrler sparment les crtes et les signaux de niveau moyen. Le
traitement en prlecture prvoit un dlai entre les parties dtection et rglage de la CAG de
manire ce que les modifications de gain soient appliques au moment prcis o il le faut.
Lcrtage est un processus au cours duquel les crtes des signaux sont tronques; il peut
entraner une distorsion audible. Les fentres antiparasites empchent les signaux de trs faible
niveau et le bruit dtre inutilement amplifis par la CAG et peuvent tre utilises avec des seuils
dautres phases pour crer une zone sans traitement. Ensemble, toutes ces techniques dpassent
considrablement les objectifs initiaux de protection simple contre la sous-modulation ou la
surmodulation et dans de nombreux cas, elles ont t utilises pour produire un son trs diffrent
de loriginal.
Le but des systmes modernes de contrle de gamme dynamique en tlvision numrique est
diffrent de celui de leurs prdcesseurs analogiques. Llimination de la ncessit de
praccentuation rduit normment la quantit de traitement ncessaire. Les appareils rcents
peuvent aussi faire appel des modles de dtection complexes, fonds sur la recommandation
UIT-R BS.1770 [3] ou compatibles avec elle. Si lobjectif est simplement de grer lintensit
sonore en produisant une incidence minimale sur le contenu des programmes, lexprience a
dmontr quun processus plusieurs phases de traitement subtil peut tre trs efficace tout en
permettant de conserver dans une large mesure lintgrit des programmes. En outre, il est
possible de rgler les problmes survenant aux extrmits des programmes et du matriel

39
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

interstitiel au moyen dun traitement de gamme dynamique irrversible, qui ne fait pas partie du
systme AC-36.

9.4 Exprience du consommateur


Les tlspectateurs peuvent agir de plusieurs faons sur le processus de DRC lintrieur des
flux binaires AC-3. En rgle gnrale, les dcodeurs des MVPD et les tlviseurs numriques
syntoniseur/dcodeur intgr fonctionnent dans un mode DRC par dfaut. Il sagit gnralement
du mode RF, car ces appareils contiennent un modulateur RF ou alimentent directement des
tlviseurs qui ne permettent quune gamme dynamique minimale. Souvent, le prix et la
souplesse de lquipement dterminent le nombre doptions dont dispose le tlspectateur.
Les rcepteurs audio-vido de cinma maison prsentent souvent le plus grand nombre
doptions dcoute DRC, mais les menus intgrs pour naviguer dans la slection peuvent
manquer de cohrence et dinteroprabilit avec dautres produits. Dans ce contexte, manque
dinteroprabilit signifie que la terminologie employe pour dcrire les options peut diffrer
dun appareil un autre, voire tre contradictoire. Par exemple, les notions de wide
(tendue), standard (ou normal ) et narrow (troite) sont couramment utilises. Ii,
wide signifie quaucun DRC nest activ et que le rsultat est la reproduction de la gamme
dynamique tendue du produit original. Standard signifie lapplication du profil slectionn
pour le mode ligne durant lencodage. Narrow signifie lapplication du profil slectionn
pour le mode RF durant lencodage. Comme nous lavons mentionn plus tt, en mode RF, une
accentuation du signal de 11 dB est applique pour faire correspondre lintensit sonore celle
des anciens systmes analogiques.

10 CONFIGURATION DE CONTRLE AUDIO


La prsente section dcrit la configuration recommande des systmes audio pour la tlvision
numrique, y compris lalignement des systmes de contrle de la rgie sur un niveau de
pression acoustique de rfrence, correspondant un niveau lectrique particulier, ainsi que
lgalisation de ces systmes audio. Les conditions de contrle visant plusieurs espaces utiliss
pour la production et la postproduction tlvisuelles sont indiques dans le tableau 10.1.
Cette section nest pas destine remplacer la recommandation SMPTE RP 200 [6] pour le
contrle sonore cinmatographique dans de plus grands espaces.
Elle dcrit les conditions de configuration initiale recommandes pour le contrle, ainsi que
les mesures et les rglages devant tre excuts de temps autre aux fins de contrle de qualit
du contrle dans les espaces utiliss pour la production tlvisuelle et le contrle de la qualit.
Elle sadresse aux planificateurs, aux ingnieurs concepteurs, aux techniciens dinstallation, aux
techniciens de maintenance et aux utilisateurs.
Un aide-mmoire pour le rglage des niveaux de contrle est prsent lannexe D.
Note : Les signaux dessai indiqus dans le prsent document sont tirs de la srie
de disques TMH Test Disc Series distribue par The Hollywood Edge et sont
protgs par droit dauteur. Lutilisation gratuite est accorde aux studios de vido
et de tlvision, aux rseaux et aux maisons de postproduction aux fins
dalignement. Tous autres droits rservs. La srie TMH Test Disc Series propose
de nombreux autres signaux dessai pour les essais acoustiques et lectriques.

6
Pour obtenir plus de renseignements, consulter les fabricants dappareils conus
cette fin.

40
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

10.1 Contexte
Comme nous lavons signal dans la section 1.1, les consommateurs ne sattendent pas
percevoir de grandes variations dintensit sonore au passage dun programme un contenu
interstitiel et quand ils changent de chane. Deux fonctions lies au niveau sonore sont intgres
au systme AC-3 spcifi dans la norme ATSC : la normalisation du dialogue et le contrle de la
gamme dynamique. Si ces fonctions sont bien rgles et bien utilises, elles permettent
datteindre dans une large mesure les objectifs de maintien de lintgrit artistique des mixages,
tout en livrant une gamme dynamique convenant aux conditions dcoute du consommateur.
Lutilisation dune disposition de haut-parleurs de contrle normalise, de niveaux de rfrence
lectriques et acoustiques standard et dune rponse spectrale de rfrence par tous les
fournisseurs de programmes et de contenu interstitiel produit une base commune pour le
contrle. Outre les fonctions intgres au systme AC-3, ladoption pratique des
recommandations de cette section de la PR devrait contribuer satisfaire aux besoins rciproques
des producteurs et des consommateurs.
Lobservation universelle est quun niveau de pression acoustique donn est peru comme
tant plus fort dans de petits locaux, comme une rgie, que dans de grandes salles comme les
cinmas. Linterchangeabilit du niveau de pression acoustique de rfrence utilis dans ce
document avec le niveau SMPTE RP 200 [6] employ dans les grands espaces a t teste.
Il a t dmontr que lutilisation de conditions de contrle de rfrence amliore
linterchangeabilit des programmes, des messages commerciaux et dautres mixages interstitiels
et quelle est donc souhaitable.

10.2 Caractristiques des locaux et des espaces


Cinq catgories de rgies audio et despaces de postproduction sont dfinies. Elles sont
prsentes dans le tableau 10.1, accompagnes de leurs caractristiques.

Tableau 10.1 Catgories de rgies audio utilises en


production tlvisuelle
Catgori Caractristiques
e
Rgie audio principale, dote dune acoustique et de systmes audio spcialiss. Gamme de canaux
pouvant atteindre 5.1 (3 avant/2 ambiance/0,1 enrichissement basses frquences). Bien isole dautres
activits. Gamme de frquences et dynamique les plus tendues, gales aux meilleurs cinmas maison
aligns de faon approprie. Ce type de local peut tre utilis pour le contrle de la qualit lchelle du
I
rseau, par exemple pour vrifier la conformit du matriel aux exigences de distribution quand une
question est souleve dans les stations dingestion. La qualit du contrle audio dpasse les exigences
de production dans les locaux de cette catgorie. On peut sattendre ce que les entreprises de
radiodiffusion naient quun petit nombre de ces locaux.
Espace de production avant tout audio, ayant des besoins dquipement et un positionnement qui
remplacent les conditions absolues de contrle audio, bien que le contrle audio y soit en principe bon.
Nombre de canaux gal au plus grand nombre utilis pour le matriel cr dans le local. Bonne isolation
II des autres activits. Ce type de local peut tre utilis pour la cration de programmes, les produits qui en
sortent devant loccasion tre soumis un contrle dans un local de catgorie I. La gamme de basses
frquences et la marge de scurit peuvent tre quelque peu limites par rapport celles permises dans
un local de catgorie I.
Espace de montage audio, locaux de prmixage parole et de prmixage effets-ambiance et autres
espaces dont il est gnralement prvu que les produits soient intgrs aux programmes crs dans un
III
local de catgorie II ou mieux. Si lespace est utilis pour le mixage final, appliquer la pratique
recommande pour les niveaux et lgalisation indique dans le prsent document.

41
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

Camions et cabines de mixage de programmes. Ces espaces exigent des mesures particulires en
IV raison de leur petit volume, du niveau lev de bruit de fond, dun niveau lev de premires rflexions
et des besoins de communication dans un environnement de production.
Recommandations visant les systmes de contrle casque dcoute. Utiliss dans les stations
V dingestion , dans des environnements encombrs, pour le contrle de qualit dans les salles de
machinerie et dans les endroits semblables.

10.3 Installation
Les systmes audio des espaces de catgories I, II et IV devraient tre installs, pour autant que
ce soit ralisable, suivant les pratiques recommandes dans les documents de rfrence (voir
rfrences [12], [14], [16] et [17]). Les espaces de catgorie III devraient aussi remplir les
exigences des pratiques recommandes sils sont utiliss pour le mixage final.
Il convient de souligner limportance de placer les haut-parleurs gale distance de
lemplacement de contrle de mixage principal ou, si ce nest pas possible, dutiliser une
temporisation de faon ce que le temps darrive lemplacement de mixage soit constant pour
tous les canaux de haut-parleur. Cette mesure est ncessaire en raison de la trs grande prcision
de loue humaine dans la localisation dimages fantmes apparaissant entre les paires adjacentes
de haut-parleurs. Cette exigence est particulirement importante pour les canaux avant et, si les
haut-parleurs dambiance sont plus prs de lemplacement dcoute que les haut-parleurs avant,
il convient dy appliquer une temporisation.
Les documents de rfrence prsentent la rponse en frquence anchoque prvue des haut-
parleurs et des systmes de contrle. Des mesures des haut-parleurs sur place, dans les rgies,
indiquent toutefois de forts carts dans la rponse anchoque des haut-parleurs, particulirement
en raison des conditions de charge aux zones limites des salles trs basse frquence,
accompagns deffets modaux donde stationnaire, gnralement dans la gamme de frquences
allant de 80 Hz 500 Hz. Cest pourquoi lgalisation de la salle est hautement souhaitable et
mme ncessaire pour les espaces de qualit suprieure. Les problmes lis lgalisation des
salles sont dcrits lannexe C.
Il a t observ que les plus grands carts en balance octave octave des mixages diffuss se
situent dans les frquences des extrmits, sous 100 Hz et au-dessus de 8 kHz. Ce phnomne est
probablement imputable aux rponses variables des systmes de contrle dans ces gammes de
frquences. Cest pourquoi la courbe de rponse dans une salle fonctionnelle prsente la
figure 10.1 sapplique aux espaces de contrle de la catgorie I. La gamme basses frquences et
la marge de scurit des espaces de catgories II et IV peuvent tre rduites par rapport celles
des espaces de catgorie I.

42
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

Figure 10.1 Courbe de rponse lectroacoustique dans une salle


fonctionnelle

Frequency response in relative dB Rponse en frquence (dB relatifs)


1/3-octave band center frequency, Hz Frquence de centre de largeur 1/3 octave (Hz)
31.5 31,5

La figure 10.1 est lindication dune mesure dtat quasi statique excuter au moyen dun
ou de plusieurs microphones faible diffraction placs tour tour la position dcoute
principale et proximit, pour chaque canal principal (gauche, droite, centre, ambiance gauche et
ambiance droite). Le lecteur trouvera de plus amples renseignements lannexe C.
Il faut aussi porter attention lalignement des niveaux des effets basses frquences ou du
canal 0,1. Il existe une certaine confusion en raison du besoin de prvoir 10 dB de gain
intrabande par rapport aux canaux principaux. Cela ne signifie toutefois pas que lindication de
pression acoustique doit dpasser de 10 dB celle des canaux principaux au moment de
ltalonnage. tant donn que la largeur de bande LFE est plus troite que celle des canaux
principaux, le niveau mesur durant la lecture dune source de bruit rose des bons niveaux
spectral et lectrique sera suprieur denviron 4 dB celui des canaux principaux.

10.4 talonnage du niveau de rfrence


La procdure dtalonnage du niveau de pression acoustique de rfrence prvoit des niveaux et
des mthodes diffrentes suivant la catgorie despace, lobjectif tant de rendre les programmes
interchangeables dans diverses conditions dcoute. Les tapes devraient tre excutes comme
suit.

43
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

tape 1. Excuter lalignement lectrique du systme talonner au moyen de lessai suivant :


Signal 1. Tonalit sinusodale 440 Hz 20 dB FS enregistre sur le canal gauche de ce
fichier stro. Importer le fichier dans le poste de travail audio numrique et le dupliquer
pour chaque canal.
http://www.atsc.org/refs/a85/440Hz_left_Ch-20dB.wav.
Utiliser cette tonalit pour aligner les indicateurs de sortie de lquipement utilis pour
20 dB FS sur les appareils de mesure numriques. Utiliser un appareil de mesure de
rsolution approprie. La meilleure configuration est que lappareil de lecture et les
indicateurs dentre, de canal et de sortie du pupitre puissent tous tre rgls avec
prcision sur le gain unitaire.
Sur les appareils de mesure analogiques, ce niveau est rgl sur 0 VU (ANSI C16.5-1942
[25], IEC 60268-17 [27]), sur 4 lchelle de 7 du crte-mtre BBC (IEC 60268-10/Iia,
IIb: 1991 [28]) (bien quil soit noter que ce crte-mtre affiche 4 dB/pas, de sorte que la
valeur talonne maximale correspond 8 dB FS; ce problme est attnu par le fait que
le crte-mtre PPM a un temps dattaque de 80 pour cent de lindication en 10 ms,
beaucoup plus lent quun vrai crte-mtre) et sur les valeurs correspondantes pour les
autres variantes dappareils de mesure.
Pour plus de dtails sur ce signal dessai, voir la section 10.5.1.
tape 2. Si on ne dispose pas dun sonomtre, passer ltape 3. Aligner le niveau sonore du
systme talonner au moyen de lessai suivant :
Signal 2. Bruit rose limit la bande 500 Hz - 2 kHz 20 dB FS enregistr sur le canal
gauche de ce fichier stro. Importer le fichier dans le poste de travail audio numrique et
le copier sur les canaux gauche, droite, centre, ambiance gauche et ambiance droite, un
la fois et tour tour. Maintenir la structure de gain unitaire tablie avec la tonalit
sinusodale. Pour plus de dtails sur ce signal dessai, voir la section 10.5.3.
http://www.atsc.org/refs/a85/MidRngPinkNoise_-20dB.wav
Ne pas tenir compte des indications du pupitre ou dautres appareils de mesure
lectriques, qui seront diffrentes pour le bruit et pour la tonalit, car le niveau de crte de
cette source de bruit stochastique (alatoire) est plus lev que sa valeur quadratique
moyenne, qui est elle-mme plus leve que le niveau moyen. Sur les crtes-mtres, la
plage se situe autour de 10 dB de plus que la tonalit sinusodale, alors que sur le vumtre
(qui est un instrument de rponse moyenne talonn sur la valeur efficace) conforme
IEEE C16.5-1954, le niveau indiqu sera environ 1 dB plus bas.
Appliquer ce signal sur chaque canal, tour tour, et ajuster les commandes appropries ne
touchant que le niveau de contrle, sur le niveau acoustique standard. Dans nimporte
quelle installation, les lments pouvant toucher le niveau acoustique de contrle sont la
commande de niveau de sortie de contrle du pupitre, quil est suggr de rgler sur un
standard marqu, ainsi que les commandes de niveau dgaliseur de salle/haut-parleurs et
les commandes de gain damplificateur de puissance ou commandes de sensibilit
dentre de haut-parleurs amplifis pouvant tre utiliss. Les problmes ordinaires de
marge de scurit et de rapport signal-bruit dans une chane de plusieurs appareils
sappliquent.
Le niveau de pression acoustique standard devrait tre mesur au moyen dun sonomtre, de
prfrence conforme au type 2 de la norme ANSI S1.4-1983 [29], en mode de mesure lente
(temps dintgration de 1 s) et avec pondration C. Il devrait tre mesur en un point

44
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

correspondant au centre de la tte dun auditeur assis lemplacement de mixage principal, le


sonomtre tant orient vers le canal talonner. Il est noter que le corps de la personne
effectuant la mesure devrait se trouver dun ct de lappareil de mesure, non derrire lappareil
par rapport la source, o la rflexion des ondes peut modifier la mesure.
Les niveaux de rfrence acoustique normaliss pour chaque catgorie et pour des locaux de
divers volumes lintrieur des catgories sont prsents dans le tableau 10.2.

Tableau 10.2 Niveau de pression acoustique de rfrence


Catgorie Volume du local en pieds cubes Niveau de pression acoustique en dB relatifs 20 N/m2
s
> 20 000 85*
10 000 < 19 999 82
I, II 5 000 < 9 999 80
1 500 < 4 999 78
< 1 499 76
Est fonction de lutilisation du local. Pour le montage, peut tre ajust par le monteur selon lutilisation
III du matriel dont il dispose. Pour le mixage final de programme, suivre les recommandations visant les
catgories I et II ci-dessus.
IV < 1 500 76
Utiliser un coupleur 2 cm et rgler le niveau du signal 440 Hz
V
74 dB.
* Conformment SMPTE RP 200 [6]

tape 3. Repiquer le fichier de parole original tlcharg (voir ci-dessous), en gain unitaire, dans
le canal du centre ou mono de lappareil de lecture utilis. Dans le cas o lon ne peut
excuter que le contrle stro sur deux canaux, reproduire le fichier de parole original dans
les canaux gauche et droit avec attnuation de 3 dB dans chaque canal et confirmer quils
sont synchroniss dans lchantillon. Veiller ce que le trajet du signal soit le mme qu
ltape 1 ci-dessus, de manire ce que cette lecture se fasse dans les mmes conditions de
gain que ltape 1 et de bruit que ltape 2. Faire jouer lenregistrement de parole, dont
lintensit sonore mesure est de 24 LKFS et observer si le niveau est normal. Si on ne
dispose pas de sonomtre et que lon a pass ltape 2, sassurer davoir excut ltape 1 si
lon dispose de lquipement indiqu et ajuster cette piste pour obtenir le niveau dcoute le
plus confortable possible.
Le niveau sonore de cet enregistrement de parole a t rgl 24 LKFS, conformment
la norme BS.1770 [3].
http://www.atsc.org/refs/a85/Speech_sample.wav
tape 4. Sil y a un caisson dextrmes graves, alimenter le canal deffets basses frquences
lectriquement au moyen du signal ci-dessous et rgler le niveau du caisson pour +4 dB par
rapport aux canaux principaux, quand on excute la mesure au moyen dun sonomtre
lecture lente et pondration C.
http://www.atsc.org/refs/a85/LFPinkNoise_-20dB.wav.

10.5 Dtails des signaux dessai


10.5.1 Dfinition de 0 dB FS
Lincertitude des mesures de niveau de bruit au moyen dappareils de mesure dlectricit est
dcrite ci-dessus la section 10.1. La dfinition de niveau dans les systmes audio numriques

45
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011

est indique dans le document AES17-1998 (R2004) [21], o une onde sinusodale pleine chelle
est dfinie 0 dB FS; cette dfinition sapplique dans le prsent document. Toutefois, de
nombreux logiciels indiquent le niveau sur des appareils virtuels en se fondant sur des calculs de
valeurs efficaces classiques, donnant une indication donde sinusodale pleine chelle de
3,01 dB FS, ce qui est erron dans le contexte du prsent document.
10.5.2 Tonalit sinusodale 440 Hz
http://www.atsc.org/refs/a85/440Hz_left_Ch-20dB.wav
La tonalit sinusodale est le signal dessai audio le plus simple et le plus largement employ.
Les utilisations types comprennent le contrle du cheminement des signaux et le rglage du
niveau. Une onde sinusodale prsente deux caractristiques utiles pour les essais :
premirement, elle est de niveau constant, ce qui permet de la mesurer avec une plus grande
prcision et deuximement, une tonalit sinusodale de frquence moyenne nimpose aucune
contrainte aux limites des systmes et les traverse sans subir de traitement.
Le niveau est de 20 dB par rapport au maximum (dB FS).
La frquence de 440 Hz a t choisie pour trois raisons : elle se situe dans la portion la plus
plate de la courbe de rponse en frquences dgalisation de la norme BS.1770 [3], elle est
musicalement pertinente comme rfrence A sur lchelle musicale et elle nest pas
harmoniquement lie aux diverses frquences dchantillonnage utilises, ce qui permet
lexploitation de toutes les valeurs de code de sa porte. Utiliser une tonalit une frquence de
syntonie prcise facilite les essais en permettant didentifier de faon audible les erreurs pouvant
exister dans la frquence dchantillonnage de lecture par rapport la frquence
dchantillonnage enregistre.
Durant le dveloppement de ce signal dessai, on a dcouvert que la production dune onde
sinusodale dessai prcisment 20 dB FS, suivie de lajout dun bruit blanc vibratoire de
fonction de densit de probabilit triangulaire de 1 LSB, comme il est ncessaire pour obtenir
un signal dessai sans distorsion, dclenchait dans certains appareils de mesure une indication
dune graduation au-dessus de 20 dB FS, pouvant produire une erreur atteignant 2 dB dans ces
appareils. Le niveau a donc t rduit dun bit en amplitude, puis la vibration ajoute, de sorte
que le niveau de crte du signal est prcisment 20 dB FS, bruit inclus.
10.5.3 Bruit rose limit la bande
http://www.atsc.org/refs/a85/MidRngPinkNoise_-20dB.wav
Un bruit rose bande limite est prfr un bruit bande intgrale pour plusieurs raisons.
basse frquence, sous la frquence de Schroeder 7 dans les salles, les ondes stationnaires ont une
forte influence sur le niveau et linclusion de telles frquences dans la bande de mesure ajoute
une incertitude. De plus, le contenu nergtique des basses frquences dans un signal
stochastique entrane de plus grandes variations de niveau en fonction du temps. plus haute
frquence, lincertitude inhrente la rponse du microphone en fonction de langle, de la courbe
de rponse de la salle et de labsorption de la salle contribue rduire la prcision. Dautre part,
les bruits ou tonalits bande troite subissent une trop grande influence de la rponse des haut-
parleurs et de lacoustique de la salle. Il a donc t tabli quune bande de deux octaves centre
sur la frquence de 1 kHz serait le plus utile pour les canaux principaux et quune bande centre
sur 40 Hz serait le plus utile pour le canal deffets basses frquences.

7
Schroeder, Manfred: The Schroeder Frequency Revisited, JASA, vol. 99, no 5, p. 3240-3241.

46
Annexe A :
Intensit sonore de programme

1. INTRODUCTION
La prsente annexe expose le contexte des algorithmes de mesure de lintensit sonore et de la
crte vraie dfinis dans la pratique recommande BS.1770. Le lecteur trouvera la description
dtaille de ces algorithmes dans le document de rfrence [3].

2. INTENSIT SONORE DES PROGRAMMES


Lintensit sonore perue dun signal audio, ou sonie, peut tre examine de diverses faons. Les
changements dintensit sonore de courte dure sont la manifestation de la nature frquemment
changeante du contenu audio. Les changements de moment moment au cours dun programme,
qui communiquent des changements datmosphre ou de contexte, en sont un exemple. Les
changements dintensit sonore de courte dure peuvent aussi se produire au passage dun
programme un autre. Certains de ces changements peuvent tre intrinsques, tant donn que
chaque programme peut avoir t cr dans un but distinct. Ils peuvent aussi provenir du fait que
les programmes ont t crs suivant des mthodes de production diffrentes.
Lintensit sonore dun signal audio peut aussi tre examine sur une plus grande chelle.
Pour la distribution dun programme, il est souvent ncessaire dobtenir une valeur dintensit
sonore compose , qui prend en compte tous les changements dintensit sonore de courte
dure intermdiaires survenant au cours de ce programme. Ce type de renseignements peut tre
ensuite utilis par le radiodiffuseur pour appliquer une correction de niveau sonore globale dans
un effort pour amliorer luniformit des niveaux dintensit sonore dans tous les programmes et
dans les passages dun programme un autre. Cette intensit sonore compose, dite de longue
dure, peut aussi servir comparer les divers lments de programme, quils reprsentent la
parole, de la musique ou tout autre type de contenu audio.
En 2001, le secteur de la Radiocommunication de l'Union Internationale des
Tlcommunications (UIT-R) a entam une tude visant identifier une mesure objective de la
sonie de programmes sonores types utiliss en tldiffusion. Ltude a abouti ladoption dune
mthode permettant de calculer lintensit sonore de longue dure dun signal audio. Cette
mesure vise les signaux mono, stro et multicanaux. Des tudes sont toujours en cours pour
bien comprendre les proprits de lintensit sonore de courte dure.
La premire phase de ltude de lUIT-R a consist mettre au point une mthode dessai
subjective pour examiner la sonie de programmes monophoniques types. Un groupe de trois
personnes form de membres du groupe de travail 6P SRG3 de lUIT-R a choisi 48 squences
dessai, consistant en une vaste gamme de matriel de radiodiffusion; une squence de rfrence
contenant une voix fminine anglaise a t choisie pour tablir une intensit sonore cible. Le
niveau de lecture de la squence de rfrence a t fix 60 dBA SPL. Outre lutilisation dune
seule squence de rfrence commune, les auditeurs de lessai ont t encourags comparer
toutes les squences dessai les unes avec les autres. Cette approche dessai est analogue celle
ATSC A/85:2011 PR en matire dintensit sonore, annexe B 26 juin 2011

du document de rfrence [9], o lauditeur est en mesure de comparer divers lments de test
entre eux durant un essai. Chacune des squences dessai a t rpte deux niveaux
damplitude, crant ainsi au total de 96 squences audio monophoniques que les auditeurs
devaient apparier. Un total de 97 auditeurs ont particip lessai, cinq emplacements diffrents.
Les rsultats des essais subjectifs [10] ont constitu la base pour lvaluation du rendement de
divers algorithmes ou appareils de mesure de lintensit sonore.
Sept entits ont prsent dix appareils/algorithmes de mesure de lintensit sonore
monophonique pour valuation. En plus des sonomtres, deux algorithmes de mesure dintensit
sonore ont t soumis par le laboratoire dvaluation pour servir de point de rfrence de
rendement. Ces deux algorithmes sont de simples calculs de valeur quadratique moyenne : le
premier a recours un filtre pondration en frquence simple et le deuxime est sans
pondration. Le filtre pondration simple utilise une courbe de pondration B basse frquence
rvise (RLB). La comparaison des sonomtres/algorithmes de mesure de sonie soumis avec la
base de donnes subjectives a rvl que lalgorithme valeur quadratique moyenne pondr en
frquence simple a prsent le meilleur rendement [11].
Pour vrifier les performances de cet algorithme, une deuxime base de donnes subjectives
a t cre partir dessais subjectifs formels conduits dans lun des emplacements dessai. Pour
cet essai, 20 auditeurs ont valu la sonie des 96 squences audio monophoniques suivant la
mme mthode subjective que la premire ronde dessais. Lanalyse des rsultats enregistrs
dans cette deuxime base de donnes subjectives a confirm les performances de lalgorithme
des valeurs moyennes pondres en frquence.
Dans le but dtendre lapplication de lalgorithme aux signaux audio multicanaux, une
troisime srie dessais a t mene, portant sur 144 squences audio (48 squences
monophoniques, 48 stro et 48 multicanaux) prsentes 20 auditeurs. La mme mthode
subjective a t employe que dans les deux premiers essais. La squence de rfrence tait une
voix fminine anglaise accompagne dune ambiance stro sur fond musical de faible niveau
sonore. Les haut-parleurs taient disposs suivant la configuration dcrite dans la
Recommandation UIT-R BS.775 [12]. Les rsultats de ce troisime essai subjectif [13] ont
abouti la conception de lalgorithme de mesure de lintensit sonore multicanal reprsent la
figure A.1.

Figure A.1 Schma fonctionnel de lalgorithme de mesure de


lintensit sonore multicanal

48
ATSC A/85:2011 PR en matire dintensit sonore, annexe B 26 juin 2011

L'intensit sonore de chaque canal est mesure de manire indpendante et les valeurs sont
additionnes pour donner lintensit sonore rsultante. Outre la courbe de pondration RLB,
reprsente la figure A.2, un prfiltre est ajout pour tenir compte des effets de la tte humaine.
La rponse en frquence de ce prfiltre est reprsente la figure A.3.

-5
Relative Level, dB

-10

-15

-20

-25

-30 1 2 3 4
10 10 10 10
Frequency, Hz

Figure A.2 Courbe de pondration RLB

Relative Level, dB Niveau relatif (dB)


Frequency, Hz Frquence (Hz)

49
ATSC A/85:2011 PR en matire dintensit sonore, annexe B 26 juin 2011

Figure A.3 Rponse du prfiltre utilis pour tenir compte des effets
acoustiques de la tte

Relative Level, dB Niveau relatif (dB)


Frequency, Hz Frquence (Hz)

Les performances de lalgorithme peuvent tre reprsentes en comparant les valuations


subjectives de lintensit sonore aux valeurs mesures. Cette reprsentation fait lobjet de la
figure A.4, o lintensit sonore mesure de chacune des 240 squences audio prsentes au
cours des trois essais subjectifs est reporte sur une courbe avec les valeurs de sonie. Sil y avait
correspondance parfaite, les points se trouveraient tous sur la diagonale du diagramme. Dans ce
diagramme, la corrlation entre les valuations subjectives et les valeurs mesures est de 0,977.

50
ATSC A/85:2011 PR en matire dintensit sonore, annexe B 26 juin 2011

2D Graph 1

20

1st dataset
15 2nd dataset
3rd dataset

Objective Loudness, dB
10

-5

-10

-15
-15 -10 -5 0 5 10 15 20
Subjective Loudness, dB

Figure A.4 Rsultats regroups pour les trois ensembles de donnes


(r = 0,977).

Objective Loudness, dB Intensit sonore objective (dB)


Subjective Loudness, dB Intensit sonore subjective (dB)
1st dataset Premier ensemble de donnes
2nd dataset Deuxime ensemble de donnes
3rd dataset Troisime ensemble de donnes

3. CRTE VRAIE
Les systmes audio numriques ont considrablement simplifi la manipulation et la distribution
des signaux audio. La mesure de la crte de ces signaux prend gnralement la forme dune
reprsentation de la valeur absolue maximale dun chantillon sur une priode de mesure donne.
Cet accent mis sur les valeurs dchantillons de crte a favoris labsence dintrt pour la forme
donde continue sous-jacente. Cette omission peut conduire des surcharges audio
imprvues, des indications de crte contradictoires et dautres problmes dissimuls. Les
mesures de niveau de crte vrai donnent une description plus prcise du signal audio, qui peut
tre utile pour prvenir ces problmes.
La figure A.5 reprsente la possibilit dindications imprcises quand on utilise des crtes-
mtres dchantillons types. Dans ce diagramme, le niveau maximum de la forme donde
continue dpasse la valeur dchantillon maximale. Cette sous-indication du niveau audio est
faible en basses frquences, mais peut tre importante dans les frquences plus hautes ou pour les
signaux contenant des transitoires abrupts. Des incohrences dans les indications de crte
dchantillons peuvent se produire lorsque les chantillons ne tombent pas aux mmes endroits
dans le signal audio. Dans le diagramme, un lger dcalage de phase dans le signal audio peut
produire des indications de crte dchantillon diffrentes.

51
ATSC A/85:2011 PR en matire dintensit sonore, annexe B 26 juin 2011

Crte du signal audio


Crte dchantillon indique

Temps

Figure A.5 Niveau de crte de signal continu et de crte dchantillon

Lannexe 2 de la recommandation UIT-R BS.1770-1 dcrit un algorithme permettant


d'estimer le niveau de crte vrai dans un signal audionumrique MIC linaire. Une description
simplifie de lalgorithme est reprsente la figure A6.

Facultatif

Entre Surchantillonne Praccentuation


Maxi absolu Sortie 1
ur HF

- ou -
Facultatif

Bloc DC Maxi absolu Sortie 2

Figure A.6 Structure de base pour lalgorithme destimation de la crte


vraie dfini dans UIT-R BS.1770-1

Les signaux entrants sont surchantillonns 192 kHz pour obtenir une reprsentation plus
prcise du signal audio. Cela signifie un quadruple surchantillonnage pour les signaux
chantillonns 48 kHz. tant donn que la possibilit dune sous-lecture des niveaux de crte
dchantillon est plus leve dans les hautes frquences, un filtre de praccentuation facultatif
peut tre ajout pour tenir compte de leffet que produisent sur les hautes frquences du signal
audio les filtres de protection contre le repliement de spectre que lon retrouve frquemment dans
lquipement, dans toute la chane de radiodiffusion.
Les signaux audio comportant une composante DC peuvent avoir une incidence sur les
niveaux de crte, les levant ou les abaissant suivant la nature du signal. Un deuxime lment
facultatif de lalgorithme de mesure de crte vraie supprime la composante DC, permettant
loprateur dvaluer les niveaux tels qu'ils seraient dans un dispositif qui bloque la composante
DC.

52
ATSC A/85:2011 PR en matire dintensit sonore, annexe B 26 juin 2011

Annexe B :
Acoustique de salle et disposition des haut-parleurs

La prsente PR na pas pour objet de discuter en dtail de lacoustique des salles et de la


disposition des haut-parleurs, mais la qualit du contrle dans les rgies peut tre normment
amliore par lobservation de quelques principes fondamentaux.

Contrler les modes propres en basse frquence des salles en utilisant des dimensions
irrgulires et des matriaux dabsorption de basse frquence efficaces

Chaque salle a son mode propre de rsonance , dtermin par la gomtrie, qui entrane la
rsonance du son certaines frquences. liminer le paralllisme des murs nlimine pas ce
phnomne. Dans les petites pices utilises pour le contrle, la frquence de rsonnance la plus
basse se situe dans la gamme audible et les crtes de rsonance sont trs cartes. Si le
phnomne nest pas contrl, il produit des anomalies importantes dans la rponse en
frquence, qui varie de canal en canal, quelle que soit la qualit des haut-parleurs. Lgalisation
seule nest pas trs utile pour rsoudre ce problme, car les crtes de rsonance sont trs troites.
Dans ces conditions, le mixage est difficile, chaque note dun mlange musical pouvant ressortir
et tre beaucoup trop forte, alors que les notes adjacentes ne le sont pas.
Dans les salles contenant peu de gros objets, choisir les trois dimensions ingales en vitant
les rapports simples entre les dimensions dau moins 5 pour cent. Toujours prvoir labsorption
des basses frquences pour amortir la rponse de la salle dans les frquences de rsonance. Les
basses frquences ne peuvent tre absorbes que par des matriaux de qualit suprieure dau
moins 2 po dpaisseur ou par un revtement de 2 po couvrant un creux dair plus profond. La
pose de tapis sur les murs ou les planchers ne donne pratiquement rien. Les plafonds suspendus
raliss au moyen de carreau absorbant haute performance revtement intrieur de matriau
absorbant de 4 po dpaisseur peuvent absorber efficacement les basses frquences pour amortir
le mode propre de rsonnance de la salle dans un plan. Labsorption de coins profonds, soit
langle mur-mur ou mur-plafond, peut aussi tre efficace.

Distribuer les matriaux dabsorption acoustique et diffusifs de qualit suprieure de manire


alatoire et viter les surfaces parallles dures

Dans une salle o la rverbration est excessive, il est difficile dentendre le dtail dun mixage.
De plus, leffet doscillations parasites, o une srie de frquences moyennes hautes rsonnent,
se produit si deux surfaces dures sont parallles, particulirement si les autres surfaces de la salle
sont absorbantes.
Pour rduire les deux effets, rpartir alatoirement sur les murs et les plafonds des matriaux
dabsorption de qualit suprieure de 2 po dpaisseur, de manire liminer les surfaces
parallles o deux zones opposes sont rflchissantes. Rduire au minimum lutilisation de tapis
muraux et dautres matriaux absorbants minces, qui ne sont utiles qu trs haute frquence. Sil
est impossible de rendre les surfaces absorbantes, dans le cas des fentres, par exemple,

53
ATSC A/85:2011 PR en matire dintensit sonore, annexe B 26 juin 2011

linclinaison de la vitre intrieure peut liminer le paralllisme des surfaces. Les lments
diffusifs sont aussi utiles pour produire un espace ayant une rverbration raisonnable, mais
contrle.

Placer les haut-parleurs et labsorption de manire empcher les rflexions discrtes

Une surface dure plane situe derrire la position de mixage cre un effet de filtre-peigne
provenant des haut-parleurs de contrle principaux. La nature du filtre-peigne change en
frquence avec le dplacement du technicien de mixage vers lavant ou larrire de la salle. Un
effet analogue, frquences plus hautes, se produit lorsque le son direct du haut-parleur est
rflchi sur une grande face de pupitre. Leffet sur le technicien de mixage peut dissimuler les
problmes rels de filtre-peigne dans le mixage.
Les rflexions discrtes sur le mur arrire devraient tre limines par la pose dune
combinaison de matriau dabsorption et de diffusion sur cette surface. Songer placer les haut-
parleurs de manire empcher les rflexions contre la face du pupitre datteindre les oreilles du
technicien de mixage.

Rduire la rsonance de la gamme mdiane/basse par le positionnement et lgalisation

Un haut-parleur rponse parfaitement uniforme soumis une mesure anchoque peut avoir un
son trs diffrent dans la gamme basse-mdiane dans des installations, suivant sa position dans la
salle, en raison du renforcement et de la suppression entrans par les rflexions provenant de
surfaces rflchissantes adjacentes proximit du haut-parleur.
On peut attnuer cet effet en vitant de placer les haut-parleurs gale distance de deux
murs, en loignant les haut-parleurs des surfaces rflchissantes ou en posant un matriau
absorbant les frquences moyennes sur les murs adjacents. tant donn que les effets sont plutt
larges, lgalisation peut tre trs utile pour uniformiser la rponse.

Choisir des haut-parleurs ayant une rponse uniforme et une large dispersion acoustique

La mesure ci-dessus ne peut corriger la situation lorsque les haut-parleurs ont une rponse en
frquence irrgulire ou si la rponse varie normment suivant langle dcoute. On ne peut
compter sur de tels haut-parleurs pour reprsenter la balance des frquences du mixage final.
Choisir des haut-parleurs qui ont un son uniforme quand on se dplace de la position centrale
dcoute dans laxe du haut-parleur jusquau bord de la zone dcoute. Rechercher la preuve que
la rponse en frquence des haut-parleurs est uniforme sur toute la gamme audio. Songer
utiliser un caisson dextrmes graves pour tendre la rponse en basse frquence.
Pour obtenir de plus amples renseignements, consulter les documents de rfrence Audio
Monitoring in Contemporary Post-Production Environments [16] et Surround Sound: Up and
Running [17].

54
:Annexe C
Correction acoustique

La correction acoustique des salles est ncessaire dans les environnements de contrle pour
sattaquer de nombreux problmes survenant en raison de linteraction du son produit par les
haut-parleurs et de la salle. Les effets ngatifs de lacoustique dune petite salle produisent
plusieurs phnomnes secondaires audibles, dont la distorsion dimagerie due aux rflexions non
voulues et aux anomalies de rponse en frquence, qui sont particulirement graves dans les
basses frquences.
Traditionnellement, lgalisation des salles tait excute au moyen de systmes analyseurs/
galiseurs ayant recours la mesure dun bruit rose au moyen dun microphone et dgaliseurs
paramtriques ou graphiques. Ces systmes prsentent de srieuses limites, pour les raisons
suivantes :
1) Une seule mesure dans une salle ne peut fournir suffisamment de renseignements sur les
performances basse frquence dans la zone dcoute.
2) Le bruit rose ne peut servir mesurer que la rponse en amplitude et ne fournit aucune
information sur la rponse dans le temps.
3) Les galiseurs paramtriques ou graphiques nont pas assez de rsolution, mme avec
30 bandes de frquences.
4) Les filtres IIR utiliss dans ces galiseurs peuvent souffrir danomalies de phases,
particulirement lorsquils deviennent plus troits.
Pour tre efficace, la correction acoustique des salles doit :
Saisir des donnes du domaine temporel pour pouvoir bien prendre en compte les effets
de la rflexion.
Saisir des donnes du domaine frquentiel avec une rsolution suffisamment leve dans
les basses frquences pour sattaquer aux problmes types des petits locaux.
Combiner plusieurs mesures prises dans la zone dcoute pour tenir compte des variations
de basse frquence entranes par les ondes stationnaires.
Rduire la rverbration dans les basses frquences (modal ringing).
Les exigences relatives la correction acoustique efficace des salles peuvent tre remplies
par lutilisation de filtres FIR dans la solution dgalisation. Toutefois, les approches FIR
classiques standard ne suffisent pas. Des mthodes comprenant la pondration frquentielle sont
typiquement employes dans la conception des filtres FIR pour distribuer la puissance des filtres
de faon non linaire avec les frquences, permettant dobtenir davantage de puissance de
correction aux basses frquences. De plus, la moyenne spatiale de plusieurs mesures ne suffit pas
non plus. La distribution des problmes acoustiques dans lespace nest pas uniforme et certains
lieux prsentent des problmes plus graves que dautres. Il faut donc aussi employer une
mthode de pondration spatiale non-linaire quand on combine les mesures.
ATSC A/85:2011 PR en matire dintensit sonore, annexe D 26 juin 2011

Volume de la salle (pi) SPL (dB relatifs 20 N/m2)


85*
82
I, II 80
(Salles de mixage)
78
76
III (Salles de montage Est fonction de lutilisation de la pice. Pour le montage, doit tre command par le
parfois utilises pour le monteur pour utilisation avec le matriel dont il dispose. Pour le mixage final de
mixage) programme, suivre les recommandations visant les catgories I et II ci-dessus.
< 1,500 76
Utiliser un coupleur 2 cm et rgler le niveau du signal 400 Hz 78 dB.

Premire tonalit dessai, onde sinusodale :


http://www.atsc.org/refs/a85/440Hz_left_Ch-20dB.wav
Deuxime tonalit dessai, bruit rose bande limite :
http://www.atsc.org/refs/a85/MidRngPinkNoise_-20dB.wav

Aide-mmoire trs bref :


Sil est impossible dutiliser le bruit rose bande limite pour talonner les niveaux de contrle,
on peut employer lchantillon de parole mentionn dans la section 10.4 pour rgler le niveau de
contrle de faon approprie. Veiller ce que le trajet du signal de lappareil de lecture mettant
lchantillon de parole au systme de contrle soit rgl sur le gain unitaire. Monter le fichier
source mono dans le canal simple pour la lecture mono, dans les canaux gauche et droit 3 dB
chacun pour la lecture stro et dans le canal central des systmes 5.1 canaux et autres
systmes multicanaux. Faire jouer lchantillon de parole et rgler le gain de contrle gnral de
manire obtenir le meilleur confort dcoute de la voix. tant donn que lintensit sonore de
lchantillon de parole est de 24 LKFS, les programmes mixs de manire ce que llment
dancrage du programme tel que le dialogue corresponde ce niveau, auront approximativement
la mme sonie.
http://www.atsc.org/refs/a85/Speech_sample.wav

56
: Annexe E
Plage dintensit sonore

La zone de confort est la plage dintensit sonore dans laquelle un auditeur accepte les
changements de sonie lintrieur dlments de contenu et entre des lments. Une exprience
subjective a t conduite pour tablir cette plage ainsi que les autres points de tolrance la
sonie . Les rsultats de lexprience sont indiqus dans la figure E1.

Figure E.1 Seuils dintensit sonore critiques

Annoyingly Loud Trop fort, contrariant


Turn Volume Down Baisser le volume
Louder, but Acceptable Fort, mais acceptable
Softer, but Acceptable Faible, mais acceptable
Turn Volume Up Monter le volume
Annoyingly Soft Trop faible, contrariant
Comfort Zone Zone de confort
Relative Loudness (in dB) of the Listening levels Intensit sonore relative (dB) des niveaux dcoute
investigated, with 95% confidence intervals tudis, avec intervalles de confiance de 95 %

Lexprience reproduisait les passages entre les contenus de longue dure et de courte dure
dune mme chane et dune chane une autre. Les auditeurs taient placs dans une situation
dcoute ou de visionnement type et ils taient invits passer dun chantillon de contenu un
autre, de longue et de courte dure. On leur avait prsent cinq paires dlments monophoniques
ATSC A/85:2011 PR en matire dintensit sonore, annexe E 26 juin 2011

composes dun lment de rfrence et dun lment dessai reproduits par un seul haut-parleur
situ devant eux.
Les auditeurs devaient rgler le niveau de lecture gnral jusqu ce que llment de
rfrence soit reproduit au niveau sonore quils considrent comme un volume confortable , le
point zro sur le schma. Lexprimentateur leur aura demand ensuite de rgler la commande de
volume dessai (le terme volume est plus familier quintensit sonore pour la plupart des
auditeurs) sur lun des six niveaux reprsents sur le schma. Les auditeurs pouvaient couter les
lments dessai et de rfrence tour de rle volont. Une fois quils avaient dcid du niveau
o se trouvait la diffrence dintensit sonore demande, le dcalage tait enregistr. Les
questions taient poses de faon alatoire et lordre de prsentation des paires dlments de
rfrence et dessai tait aussi alatoire dun auditeur lautre. Les lments de rfrence et
dessai provenaient dune autre exprience qui fournissait une sonothque de contenus de sonie
constante.
tant donn que les lments de rfrence et de test taient rputs dgale intensit sonore,
le dcalage de gain que les auditeurs ont appliqu llment de test en rponse aux questions de
lexprimentateur constitue une mesure directe de la zone de confort des auditeurs et des autres
seuils dintensit sonore critiques tudis.
Il est intressant de noter quune augmentation de gain de deux ou trois dB dans le niveau
sonore suffit faire passer la sonie dun programme type de la zone de confort de lauditeur vers
le point o il aimerait baisser le volume. Il y a plus dcart du ct bas du point de volume
confortable (reprsent par 0 ici).
Le niveau de bruit ambiant dans la salle dcoute o ont eu lieu les essais tait assez faible;
analogue celui du salon dune maison situe en campagne, par une soire tranquille. tant
donn que lon peut raisonnablement croire que le point trop faible, contrariant se situe
quelque part au-dessus du niveau de bruit ambiant de lenvironnement dcoute, le chiffre de
19,1 dB est probablement troitement fonction du niveau du bruit ambiant. Les autres points sont
suffisamment carts du niveau ambiant pour que leur rpartition relative ne soit pas touche.

58
ATSC A/85:2011 PR en matire dintensit sonore, annexe F 26 juin 2011

Annexe F
Dtails sur le contrle de gamme dynamique AC-3

F.1 APERU GNRAL DU DRC


Le systme AC-3 NA PAS pour but de reproduire le traitement audio utilis dans le systme de
tlvision analogique courant. Il vise plutt 1) fournir une intensit sonore de dialogue
uniforme entre les programmes et 2) permettre aux auditeurs de rduire les excursions de la
dynamique autour de ce niveau sonore commun sils le souhaitent.

Figure F.1 Principe de base du contrle de gamme dynamique (DRC) AC-


3

59
ATSC A/85:2011 PR en matire dintensit sonore, annexe F 26 juin 2011

Decoder Applications Applications de dcodeur


STB / TV / AVR Bote numrique/TV/RAV
AC3 Bitstream Flux binaire AC3
Decode & DeMux Dcodage et dmultiplexage
Down mix ? Mixage rducteur
2 to 6 Line or Speaker Outputs 2 6 lignes ou sorties haut-parleurs

Quand des dcodeurs sont utiliss, deux modes principaux sont ncessaires. Le premier,
reprsent la figure F2, constitue une source de signaux de niveau ligne servant fournir les
signaux audio destins aux cinmas-maison et autres applications haute fidlit. Dans ce cas,
seule une lgre compression est ncessaire, voire aucune.

Figure F.3 Exigences relatives au dcodeur AC-3 (mode RF).

Decoder Applications Applications de dcodeur


STB / TV / AVR Bote numrique/TV/RAV
AC3 Bitstream Flux binaire AC3
Decode & DeMux Dcodage et dmultiplexage
Down mix Mixage rducteur
RF Modulator (Ch 3 or 4) Modulateur RF (chane 3 ou 4)

Le deuxime mode (figure F.3) est utilis pour alimenter un modulateur RF. Dans ce cas, le
programme doit subir une rduction par mixage et lintensit sonore doit tre accentue pour
assurer une correspondance raisonnable avec les autres signaux analogiques hertziens utiliss par
le tlviseur. Le systme doit aussi rduire davantage la gamme dynamique que dans le cas
prcdent, en raison du niveau de signal programme amplifi, pour la faire correspondre la
gamme dynamique rduite des missions de tlvision existantes typiques, et possiblement en
raison des conditions dcoute.

60
ATSC A/85:2011 PR en matire dintensit sonore, annexe F 26 juin 2011

F.2 PLACEMENT DES MTADONNES DANS LES FLUX BINAIRES DRC AC-3
Le systme AC-3 fournit des instructions de gain pour les deux types de rduction de dynamique
ainsi quune fonction de limitation au cas o laugmentation de niveau inhrente au mixage
rducteur serait suffisante pour produire lcrtage.
Les mots de gain du mode dit de ligne reprsent la figure F.2 sont appels mots dynrng .
Ceux qui sont destins au mode dit RF reprsent la figure F.3 sont appels mots compr .
Le flux binaire AC-3 transporte les deux types de mots de gain, dynrng et compr (comme
lindique la figure F.4) ainsi que les mots de gain de limitation, au besoin. Les dcodeurs AC-3
peuvent appliquer le contrle de dynamique RF ou de ligne, suivant la prfrence de lauditeur
(bien que certains fabricants dquipement grand public limitent les options dans certains
appareils).

Figure F.4 Placement des mtadonnes de DRC AC-3 dans le flux binaire

SI SI
BSI BSI
dialnorm dialnorm
compr compr
Aux Aux.
CRC CRC
Sync Frame (32 ms) Synchro trame (32 ms)
dynrng values carried in each of the 6 Audio Blocks Valeurs dynrng transportes dans chacun des 6 blocs
audio (AB)

Tous les mots de contrle de gamme dynamique, y compris les instructions de limite de gain,
sont gnrs dans lencodeur AC-3, envoys au dcodeur AC-3 et appliqus dans le dcodeur
AC-3. Les donnes transmises comprennent les donnes dialnorm, qui sont utilises pour

61
ATSC A/85:2011 PR en matire dintensit sonore, annexe F 26 juin 2011

normaliser lintensit sonore du dialogue ou point dancrage de chaque programme dans son
ensemble.
Les mots de gain dialnorm et compr sont envoys au dcodeur intervalles de 32 ms, tandis que
les mots de gain dynrng sont transports six fois ce rythme, c.--d. environ toutes les 5,3 ms.

F.3 CALCULS DES MOTS DE GAIN AC-3


Comme le reprsente la figure F.5, la premire tche consiste calculer lintensit sonore et les
niveaux de crte normaliss du contenu du programme (dautres dtails sont indiqus la
figure F.6). Le paramtre acmod indique lencodeur le nombre de canaux que contient le
programme.

Figure F.5 Calculs de mots de gain AC-3 par lencodeur (partie 1).

Measure Loudness Mesure de lintensit sonore


Apply dialnorm Application de dialnorm
Normalized Loudness Intensit sonore normalise
Multichannel Audio program Programme audio multicanal
Dialnorm value Valeur dialnorm
cmixlev surmixlev acmod & profile(s) cmixlev, surmixlev, acmod et profil(s)
Measure peak level & calculate worst case downmix Mesure du niveau de crte et calcul du pire cas de
mixage rducteur
Normalized Peak Crte normalise
* Required User inputs *Intervention de lutilisateur ncessaire

62
ATSC A/85:2011 PR en matire dintensit sonore, annexe F 26 juin 2011

Figure F.6 Calculs de mots de gain AC-3 par lencodeur (partie 2)

Compute Static Gain Calcul du gain statique


compression gain gain de compression
max boost amplification maxi
boost ratio taux damplification
null band bande sans correction
input level niveau dentre
max cut attnuation maxi
cut ratio taux dattnuation
Normalized Loudness Intensit sonore normalise
Compute Time Constant Constante de temps de calcul
Attack threshold Seuil dattaque
Decay threshold Seuil de chute
fast rapide
slow lent
Attack range Gamme dattaque
Decay range Gamme de chute
Smooth and Limit Gain Words Adoucir et limiter les mots de gain
dynrng and compr dynrng et compr
Compute Maximun Gain before Clipping Calcul du gain maximum avant crtage
Clip Level Niveau de saturation
Normalized Peak level Niveau de crte normalis

63
ATSC A/85:2011 PR en matire dintensit sonore, annexe F 26 juin 2011

Pour les mots de gain dynrng, lintensit sonore est calcule pour chaque sous-ensemble de
256 chantillons (les blocs audio reprsentent 512 chantillons 5,3 ms daudio, mais en
raison de la structure de blocs de chevauchement-addition , lintensit sonore de chaque bloc
est reprsente par la moyenne de deux mesures de 256 chantillons). Les valeurs dintensit
sonore sont donc produites intervalles de ~5,3 ms.
Lintensit sonore de chaque canal est calcule individuellement, puis les rsultats sont
additionns pour obtenir lintensit sonore globale du programme. La courbe de pondration de
lintensit sonore est reprsente la figure F.8.
Le calcul du niveau de crte doit tenir compte des coefficients de rduction par mixage du
canal du centre et des canaux dambiance (cmixlev et surmixlev) slectionns (idalement) durant le
processus de production. La sortie du calcul est le niveau de crte maximum du pire cas de
rduction par mixage.
Les valeurs dintensit sonore et de crte sont normalises au moyen de la valeur dialnorm de
programme avant dtre passes aux tages de calcul suivants.
Les donnes dintensit sonore et de niveau de crte utilises pour les calculs de mots de gain
compr reprsentent ces valeurs sur toute ltendu dune synchro trame AC-3 (32 ms).
Le dcodeur audio comprend une fonction de chevauchement-addition, ce qui permet
dappliquer les mots de gain compr en douceur mme lorsquils sont synchroniss abruptement.
La partie DRC du systme AC-3 doit traiter des contenus de programme de tous genres, cest
pourquoi elle comprend une mthode dajustement des constantes de temps dattaque et de chute
dtermines automatiquement suivant le contenu du programme.
Les donnes audio aprs normalisation de lintensit sonore sont mises en correspondance
dans le profil DRC slectionn pour gnrer une valeur de gain statique. Elles sont aussi utilises
pour slectionner lune des quatre constantes de temps, selon que lintensit sonore dentre est
plus leve (attaque) ou plus basse (chute) que lintensit sonore ajuste, et de combien.
Si lintensit sonore dentre est plus leve que lintensit sonore ajuste et que la diffrence
est plus grande que le seuil dattaque, alors la constante de temps choisie est lattaque rapide
(fast attack). Il sagit gnralement dune constante de temps trs rapide, conu pour assurer la
convergence rapide du compresseur pour les vnements trs forts.
Si lintensit sonore dentre est plus leve que lintensit sonore ajuste, mais dune valeur
ne dpassant pas le seuil dattaque, alors la constante de temps choisie est lattaque lente (slow
attack). Il sagit gnralement dune constante de temps modrment rapide, conue pour fournir
une convergence assez rapide du contrleur de dynamique pour les vnements modrment
forts.
Si lintensit sonore dentre est plus basse que lintensit sonore ajuste, mais dune valeur
ne dpassant pas le seuil de chute, alors la constante de temps choisie est la chute lente (slow
decay). Il sagit gnralement dune constante de temps trs lente, conue pour fournir un
relchement lent et donc inaudible du compresseur durant les passages calmes.
Si lintensit sonore dentre est plus basse que lintensit sonore ajuste et que la diffrence
est plus grande que le seuil de chute, alors la constante de temps choisie est la chute rapide (fast
decay). Il sagit gnralement dune constante de temps modre, conue pour fournir un
relchement rapide la fin dvnements trs forts.
Lautre principale partie du processus de gnration des donnes DRC est la fonction de
limitation de crte. Le niveau de saturation est connu (0 dB FS), ainsi la diffrence entre ce
niveau et le niveau de crte normalis du programme est le gain maximum admissible avant

64
ATSC A/85:2011 PR en matire dintensit sonore, annexe F 26 juin 2011

lcrtage. Si les mots de gain statique appellent davantage de gain, le bloc dadoucissement et
de limite restreint les mots de gain statique au gain maximum admissible. La constante de temps
qui vient dtre calcule fait en sorte que les changements de gain ne seront pas suffisamment
abrupts pour produire des phnomnes parasites dsagrables et quils sont appropris pour le
contenu du programme.
Il est noter que deux processus sexcutent en parallle : lun au dbit des blocs audio
(~5,3 ms) et gnrant les mots de gain dynrng et lautre au dbit de la synchro trame (32 ms),
gnrant les mots de gain compr.

Figure F.7 Adoucissement du gain

Gain smoothing by the overlap & add process Adoucissement du gain par processus de
chevauchement-addition
Cross fades between audio blocks Enchans entre les blocs audio

Il sagit dune trs simple reprsentation de la faon dont les transitions de chevauchement-
addition entre les blocs audio se produisent et de leffet quelles ont sur les pas de gain
(quantifi en pas de 0,2 dB pour dynrng et en pas de 0,4 dB pour compr) appliqus par le systme de
contrle de gamme dynamique.
La forme triangulaire prsente la figure F.7 est une approximation (pour faciliter le dessin)
de la fonction de fentrage relle applique aux donnes.
Les mots dynrng sappliquent un groupe entier de 512 chantillons, mais chacun de ses
groupes chevauche de moiti le groupe adjacent, de sorte que leffet produit lorsque les valeurs
des chantillons sont additionnes est un enchan entre les groupes, qui adoucit les pas de gain
qui les sparent.
Les mots compr sappliquent une trame de synchronisation entire, mais les trames de
synchronisation sont aussi soumises au processus de chevauchement-addition, ce qui a pour effet
dadoucir aussi les pas de gain compr.

65
ATSC A/85:2011 PR en matire dintensit sonore, annexe F 26 juin 2011

F.4 PONDRATION DINTENSIT SONORE ET COURBES DENTRES-SORTIE DE DRC


La courbe de pondration DRC accentue davantage les basses frquences que la courbe de
pondration B, qui est normalement utilise pour pondrer les sons de niveau modr (c.--d.
prs des niveaux dcoute de la tlvision). (Voir figure F.8.)

Figure F.8 Courbe de pondration dintensit sonore DRC

DRC loudness weighting Pondration dintensit sonore DRC


IEC B-Weighting Pondration B de lIEC
IEC A-Weighting Pondration A de lIEC

Lintensit sonore totale dune source multicanal est calcule comme la somme des niveaux
de puissance des valeurs quadratiques moyennes pondres de chaque canal. La pondration et
laddition des valeurs dintensit sonore sont des calculs antrieurs aux mesures dintensit
sonore de lUIT, qui peuvent tre considres comme un perfectionnement de cette mthode.

66
ATSC A/85:2011 PR en matire dintensit sonore, annexe F 26 juin 2011

Figure F.9 Caractristiques dentre-sortie des profils DRC

Input Loudness Intensit sonore dentre


dBFS dB FS
Gain Boost Amplification de gain
Gain Cut Attnuation de gain
Notes Notes
The Speech curve has been moved up a bit to separate La courbe du profil de parole (Speech) a t dplace
it from the Film Standard curve. lgrement vers le haut pour la distinguer de la courbe
du profil Film standard
speech parole
music light musique lgre
film standard film standard
dialnorm dialnorm
0 dB 0 dB

Les zones linaires (sans correction) des profils Film standard et Speech ne sont pas
symtriques autour de la valeur dialnorm, parce que dans les contenus de programmes types et
avec le degr de rduction de gamme dynamique voulu, lattaque de zone damplification
relativement rapide conjugue avec un temps de chute plus lent a tendance laisser le
programme dans la zone linaire asymtrique (voir figure F.9).

F.5 PARAMTRES DENCODEUR POUR LE RGLAGE DES MTADONNES DRC


Voici quelques-unes des options de menu que lon retrouve au panneau avant de lencodeur AC-3
Dolby 569. Il existe un logiciel de commande distance compatible PC pour le Dolby 569, qui
prsente tous les paramtres sur un mme cran. Lappareil de cration et de visualisation de
mtadonnes Dolby 570 a des menus de panneau avant analogues ainsi quun logiciel de
commande distance (beaucoup plus facile utiliser).

67
ATSC A/85:2011 PR en matire dintensit sonore, annexe F 26 juin 2011

Parmi les paramtres de rglage signalons:

Menu principal Setup -> Audio Service -> Channel Mode -> Choisir une des options 1/0, 2/0,
3/2, etc.

Menu principal Setup -> Audio Service -> Dialog Level -> Rgler sur -1 dB to -31 dB.

Menu principal Setup -> BSI Parameters -> Center Downmix level -> Choisir une des
options -3.0 dB, -4.5 dB, -6.0 dB.

Menu principal Setup -> BSI Parameters -> Surround Downmix level -> Choisir une des
options -3.0 dB, -4.5 dB, -6.0 dB.

Menu principal Setup -> Dynamic Range -> Line Mode -> Choisir une des options :
Speech, Music Light, Music Standard, Film Light, Film Standard, Disabled.

Menu principal Setup -> Dynamic Range -> RF Mode -> Choisir une des options :
Speech, Music Light, Music Standard, Film Light, Film Standard, Disabled.

F.6 COMMANDES EXCUTABLES AU DCODEUR DRC


Il est noter que :
Il y a peu de terminologie commune entre les appareils grand public pour les modes
DRC de ligne, RF ou hors fonction.
Dans le dcodeur type, le mode ligne est appel Normal , le mode RF, Late
Night (fin de soire) et labsence de compression de dynamique, Theatre
(cinma).
En rgle gnrale, le consommateur peut choisir un de ces trois modes.
Dans certains dcodeurs (haut de gamme), lauditeur peut rgler le pourcentage de
compression applique dans les modes ligne et RF.

68
ATSC A/85:2011 PR en matire dintensit sonore, annexe G 26 juin 2011

Description
LFE Channel (Canal LFE) Indique si le canal LFE est prsent. Disponible seulement dans les modes
de canaux 3/2, 3/1, 3/0, 2/2 et 2/1.
(Profil DRC de mode ligne) Indique la configuration de compression de DRC prdfinie
pour le dcodage du mode ligne.
DRC RF Mode Profile (Profil DRC de mode RF) Indique la configuration de compression de DRC prdfinie
pour le dcodage du mode RF.
Dolby Surround Mode (Mode Dolby Surround) Indique si le flux binaire cod deux canaux contient un
programme Dolby Surround (Lt/Rt) et doit tre dcod en Dolby Pro Logic.
(Mode Dolby Surround EX) Indique si laudio est encod en tant que flux Dolby
Surround EX et ncessite le dcodage Surround EX.
Preferred Stereo (Rduction stro prfre) Indique la rduction par mixage prfre : Lt/Rt (cod Pro
Downmix* Logic) ou Lo/Ro (stro seulement).
Center Downmix Level (Niveau de rduction centre) Indique le niveau de rduction visant le canal C lorsque
lutilisateur final na pas de haut-parleur central.
Lt/Rt C Downmix Level* (Niveau de rduction C Lt/Rt) Lorsque la rduction stro est Lt/Rt, indique le niveau de
rduction visant le canal C lorsque lutilisateur final na pas de haut-parleur central.
Lo/Ro C Downmix Level* (Niveau de rduction C Lo/Ro) Lorsque la rduction stro est Lo/Ro, indique le niveau
de rduction visant le canal C lorsque lutilisateur final na pas de haut-parleur central
Surround Downmix Level (Niveau de rduction ambiance) Indique le niveau de rduction visant les canaux
dambiance lorsque lutilisateur final na pas de haut-parleurs dambiance. Il est noter
que le rglage 0 (-999 dB) limine les canaux dambiance.
Lt/Rt S Downmix Level* (Niveau de rduction ambiance Lt/Rt) Lorsque la rduction stro est Lt/Rt, indique le
niveau de rduction visant les canaux dambiance lorsque lutilisateur final na pas de
haut-parleurs dambiance.
Lo/Ro S Downmix Level* (Niveau de rduction ambiance Lo/Ro) Lorsque la rduction stro est Lo/Ro, indique le
niveau de rduction visant les canaux dambiance lorsque lutilisateur final na pas de
haut-parleurs dambiance.

Tableau G.4 Mtadonnes informatives


Fonction Description
Audio Production Info (Info de production audio) Indique si les valeurs des paramtres Mixing Level (niveau de
mixage) et Room Type (type de salle) sont transports dans le flux binaire.
Bitstream Mode (Mode de flux) Dcrit le service audio transport dans le flux binaire.
Copyright (Droit dauteur) Indique si le flux binaire cod est protg par droit dauteur.
Mixing Level (Niveau de mixage) Indique le niveau de pression acoustique absolu du canal de
dialogue principal durant la session de mixage final.
Room Type (Type de salle) Indique la taille et ltalonnage de la salle de mixage utilise pour le
mixage final.
Original Bitstream (Flux original) Indique si le flux binaire AC-3 cod est la version matresse.
A/D Converter Type* (Type de convertisseur A-N) Indique le rglage du type de convertisseur analogique-
numrique.

69
ATSC A/85:2011 PR en matire dintensit sonore, annexe G 26 juin 2011

70
ATSC A/85:2011 PR en matire dintensit sonore, annexe G 26 juin 2011

71
ATSC A/85:2011 PR en matire dintensit sonore, annexe H 26 juin 2011

Cet aide-mmoire est fond sur lutilisation dun systme de mtadonnes statiques 8 (voir la
section Error: Reference source not found de la PR).

Point retenir : Rgler le paramtre dialnorm de lencodeur AC-3 de la station pour quil
corresponde lintensit sonore du niveau de dialogue moyen du contenu.

H.6MESURE DU CONTENU DISTRIBU


Voir la section 5 de la PR.
H.6.1 Contenu longue dure
Une partie reprsentative du contenu domine par le dialogue type (c.--d. non par des cris ou
des chuchotements) devrait tre isole et mesure. En labsence de dialogue, lintensit sonore de
llment du contenu sur lequel se fonderait un tlspectateur raisonnable pour rgler le volume
devrait tre mesure. Si aucune des deux techniques nest possible ou pratique, lintensit sonore
de tout le contenu devrait tre mesure. Si le contenu contient des priodes importantes de
silence, consulter la section 5.2 de la PR.

Point retenir : Mesurer lintensit sonore du contenu longue dure dans les passages
o il y a des dialogues. Il sagit de la valeur du Niveau de dialogue du contenu. Le
Niveau de dialogue (en units LKFS) devrait correspondre la valeur dialnorm de
lencodeur AC-3.

H.6.2 Contenu courte dure


Voir la section 5.2.4 de la PR.

Point retenir : Mesurer lintensit sonore de tous les canaux audio 10 et de tous les
lments intgrs de la piste sonore, sur toute la dure du contenu de courte dure. La

8
Les mtadonnes dynamiques constituent une solution de rechange au
systme de mtadonnes statiques (fixes). Consulter la section 7.5 pour
obtenir plus de dtails sur lutilisation des mtadonnes dynamiques.
10
Le LFE nest pas compris.

72
ATSC A/85:2011 PR en matire dintensit sonore, annexe H 26 juin 2011

valeur de la mesure de lintensit sonore (en units LKFS) devrait correspondre la


valeur dialnorm de lencodeur AC-3.

H.6.3 Bulletins de nouvelles ou autre programmation en direct


Le principe de mesurer lintensit sonore du dialogue du contenu sapplique aux productions en
direct ralises en temps rel au fur et mesure que la production progresse.
Lobjet des mesures dintensit sonore excutes durant un vnement en direct est de guider
le mixeur pour quil puisse produire le contenu une intensit sonore correspondant au rglage
dialnorm de lencodeur AC-3 de la station.
Un sonomtre BS.1770 peut tre utile dans les mixages effectus dans un milieu bruyant ou
lorsquil est impossible de maintenir un niveau de contrle uniforme. Voir la section 5.2.2 de la
PR.

Point retenir : Utiliser un sonomtre BS.1770 pour faciliter lalignement de lintensit


sonore du contenu en temps rel sur le rglage dialnorm de lencodeur AC-3.

H.6.4 Contenu enregistr dans des fichiers


Le stockage dans des fichiers facilite lautomatisation des mesures dintensit sonore et
lajustement de lintensit sonore du contenu ou de la valeur dialnorm pouvant avoir t attribue
au contenu. Voir la section 5.2.5 de la PR.

Point retenir : Veiller ce que le contenu enregistr dans un fichier corresponde au


rglage dialnorm de la station, dfini dans lencodeur AC-3.

H.7INTENSIT SONORE CIBLE POUR FACILITER LCHANGE DE PROGRAMMES


Voir la section 6 de la PR.
LIntensit sonore cible est une valeur spcifie pour le Niveau de dialogue et tablie pour
faciliter lchange de contenu entre un fournisseur et un oprateur.
Pour la distribution ou lchange de contenu sans mtadonnes (et en labsence daccord
pralable entre les parties en matire dintensit sonore), lATSC dfinit une valeur dIntensit
sonore cible de 24 LKFS, qui sert tablir un niveau de fonctionnement commun employer
avec cette valeur fixe de dialnorm. De lgers carts de mesure par rapport cette valeur, de lordre
de 2 dB, sont prvus en raison de lincertitude des mesures, et ils sont acceptables. Le niveau
dintensit sonore cible des contenus ne devrait pas tre fix au-dessus ou au-dessous de cette
plage.

Point retenir : Pour le contenu sans mtadonnes, utiliser la valeur dIntensit


sonore cible de 24 LKFS.

73
ATSC A/85:2011 PR en matire dintensit sonore, annexe H 26 juin 2011

H.8MTHODES DE CONTRLE EFFICACE DE LINTENSIT SONORE ENTRE


PROGRAMME ET CONTENU INTERSTITIEL
Une grande variation dintensit sonore durant les transitions peut tre gre avec efficacit en
adoptant les pratiques ci-dessous.
Pour les oprateurs qui utilisent un systme dialnorm statique, voir la section Error: Reference
source not found de la PR :
a) Veiller ce que tout le contenu rponde lIntensit sonore cible et que la valeur dialnorm
corresponde ce niveau.
b) Employer un dispositif de commande de gain de fichiers pour faire correspondre la
valeur cible le Niveau de dialogue des contenus non conformes.
c) Employer un appareil de traitement de lintensit sonore en temps rel pour faire
correspondre la valeur cible le Niveau de dialogue des contenus non conformes.

Point retenir : Veiller ce que tous les contenus audio de programmes et de


messages publicitaires correspondent la valeur dialnorm de lencodeur AC-3. Utiliser un
sonomtre BS.1770 pour vrifier le Niveau de dialogue du contenu audio.

H.9RGLAGE dialnorm PAR UNE STATION AFFILIE


Voir la section 7.3.5 de la PR.
Un oprateur (station, station affilie, MVPD, etc.) recevant un contenu livr avec une intensit
sonore fixe et qui ne fera lobjet daucun traitement ou ajustement de gain aprs le rcepteur,
devrait rgler la valeur de dialnorm dans son encodeur AC-3 pour quelle correspondre au Niveau
de dialogue spcifi par le crateur dans le rseau. Si un gain ou une perte fixe est appliqu dans
la chane de signaux, la valeur dialnorm de lencodeur AC-3 devrait tre dcale en consquence
par rapport au Niveau de dialogue indiqu par le crateur.
Si un traitement dintensit sonore est appliqu au contenu audio du crateur, la valeur de
lIntensit sonore cible du processeur devrait correspondre la valeur dialnorm de lencodeur
AC-3. Pour un complment dinformation sur le traitement audio, consulter la section 9.3.

Point retenir : Rgler la valeur dialnorm de lencodeur AC-3 sur le Niveau de dialogue
indiqu par le crateur mdia (avec ajustement).

H.10 INSERTION DE CONTENU PAR LA STATION DE TLVISION OU LE MVPD


Dans le cas dinsertion de messages publicitaires ou de segments locaux par la station de
tlvision ou le MVPD, loprateur devrait veiller ce que le Niveau de dialogue de linsertion
locale concide avec le rglage dialnorm du flux audio insr.

Point retenir : Veiller ce que le Niveau de dialogue du contenu insr corresponde


au rglage dialnorm du flux audio insr.

74
ATSC A/85:2011 PR en matire dintensit sonore, annexe H 26 juin 2011

Si le produit du crateur destin au rseau est dcod en bande de base, il faut mesurer
lintensit sonore du flux audio dcod et rgler la valeur dialnorm du r-encodeur AC-3 pour
quelle corresponde lintensit sonore mesure, pour ltape dencodage suivante. Dans ce cas,
soit que loprateur modifie lintensit sonore du contenu du crateur pour quelle corresponde
la valeur cible du systme de loprateur, soit quil utilise la valeur dintensit sonore du contenu
du crateur (mesure) pour rgler la valeur dialnorm de ltape suivante dencodage AC-3. cette
tape de recodage, loprateur doit aussi veiller ce que les autres paramtres de mtadonnes
soient rgls de faon approprie.

Point retenir : Si le produit du crateur destin au rseau est dcod en bande de


base, veiller ce que le Niveau de dialogue mesur du contenu corresponde au
rglage dialnorm de ltape suivante dencodage AC-3.

H.11 CONTRLE DE GAMME DYNAMIQUE (DRC) AC-3


Le systme AC-3 comprend des profils DRC pour le mode ligne et pour le mode RF .
Bien que la slection de ces paramtres puisse tre utile loprateur et au tlspectateur pour
limiter la plage dintensit sonore globale, on ne devrait pas compter sur le DRC pour corriger
les variations dintensit sonore entre les programmes, entre les programmes et les messages
publicitaires ou entre les stations de tlvision ou les chanes cbles ainsi que dans les
changements de chanes. Voir la section 8.3 et lannexe F de la PR.

Point retenir : On ne devrait pas compter sur le contrle de gamme dynamique AC-3
pour attnuer les variations dintensit sonores se produisant entre les programmes et
les messages publicitaires et au passage dune station une autre.

75
ATSC A/85:2011 PR en matire dintensit sonore, annexe I 26 juin 2011

: Annexe I
Aide-mmoire lintention des mixeurs et des
monteurs son qui crent du contenu
(Messages publicitaires, matriel de promotion et
programmation avec gestion de lintensit sonore des
signaux audio)

Laide-mmoire qui suit doit tre propos dans un petit document distinct.

I.1 INTRODUCTION
Note : Le prsent aide-mmoire est fond sur la Pratique recommande par lATSC A/85:
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique, (la
PR) et le texte complet est reproduit dans lannexe I de la PR.
Cet aide-mmoire rsume les recommandations exposes dans la PR et fournit des conseils
aux mixeurs et aux monteurs son qui crent des contenus audio pour la tlvision numrique. Il
vise un objectif de gestion de lintensit sonore des signaux audio cohrente avec le but
artistique. Le terme contenu englobe messages publicitaires, matriels de promotion et
programmation. Le terme contenu interstitiel sapplique aux messages publicitaires et au
matriel de promotion.

I.2 PORTE
Cet aide-mmoire nest pas destin remplacer la PR complte. Sa porte est limite servir de
guide du type comment faire pour lintention des mixeurs et monteurs son participant
la cration de contenu audio pour la tlvision. Le lecteur est encourag lire la PR pour
dcouvrir les dtails et le contexte de ce guide. En cas de contradiction entre laide-mmoire et la
PR, cette dernire a prsance sur le prsent aide-mmoire11.

I.3 DFINITIONS
BS.1770 Officiellement UIT-R BS.1770 [3]. Cette recommandation dfinit un algorithme qui
permet dobtenir une valeur numrique indiquant la sonie du contenu mesur. Les
sonomtres et les outils de mesure dans lesquels est mis en uvre lalgorithme BS.1770
indiquent lintensit sonore en LKFS .
dB TP Dcibel du niveau de crte vrai par rapport au signal numrique maximum
(suivant UIT-R BS.1770, annexe 2 [3])

11
Cet aide-mmoire est fond sur lutilisation dun systme de mtadonnes statiques
(voir la section de la PR). Les mtadonnes dynamiques constituent une solution de
rechange au systme de mtadonnes statiques (fixes). Consulter la section 7.5 pour
obtenir plus de dtails sur lutilisation des mtadonnes dynamiques.

76
ATSC A/85:2011 PR en matire dintensit sonore, annexe I 26 juin 2011

dialnorm Paramtre de mtadonnes AC-3, de valeur numrique gale la valeur absolue du


Niveau de dialogue, transport dans le flux binaire AC-3. Cest un code de 5 bits non sign,
qui indique lcart ngatif du Niveau de dialogue moyen par rapport 0 LKFS. Les valeurs
valides vont de 1 31. La valeur 0 est rserve. Les valeurs 1 31 sont interprtes 1 31.
Le dcodeur applique une valeur de rduction de gain gale la diffrence entre 31 et la
valeur dialnorm.
LKFS Intensit sonore (Loudness) avec pondration K, par rapport au niveau sonore
maximum (Full Scale), mesure au moyen dun appareil qui met en uvre lalgorithme
spcifi par lUIT-R BS.1770 [3]. Une unit LKFS est quivalente un dcibel.
Niveau de dialogue (Dialog Level) Lintensit sonore de llment dancrage, exprime en
LKFS 12.
Intensit sonore cible (Target Loudness) Valeur spcifie pour llment dancrage (c.--d.
Niveau de dialogue), tablie pour faciliter lchange de contenu entre un fournisseur et un
oprateur.

I.4 ENVIRONNEMENT DE CONTRLE


Disposer dun environnement de contrle convenable est crucial pour lobtention de rsultats de
mixage satisfaisants. Pour matriser ce sujet, veuillez lire les renseignements de base dans la
section 10.1 ainsi que la section 10.2.
Il est essentiel dutiliser le niveau de contrle appropri, qui varie suivant le volume de la
pice. Pour un complment dinformation, consulter la section 10.4 de la PR et le tableau 10.2,
ci-dessous :

Tableau 10.2 Niveau de pression acoustique de rfrence


Catgorie Volume du local en pieds cubes Niveau de pression acoustique en dB relatifs 20 N/m2
s
I, II > 20 000 85*
10 000 < 19 999 82
5 000 < 9 999 80
1 500 < 4 999 78
< 1 499 76
Est fonction de lutilisation du local. Pour le montage, peut tre ajust par le monteur selon lutilisation du
III matriel dont il dispose. Pour le mixage final de programme, suivre les recommandations visant les
catgories I et II ci-dessus.
IV < 1 500 76
Utiliser un coupleur 2 cm et rgler le niveau du signal 440 Hz
V
74 dB.
* Conformment SMPTE RP 200 [6]

Consulter lannexe D la synthse de la configuration et de ltalonnage de la salle de


mixage.

12
Le terme Niveau de dialogue est fond sur lutilisation rpandue du dialogue
comme ancrage pour le mixage du contenu; historiquement, on a considr le dialogue
comme llment dancrage de la plupart des programmes.

77
ATSC A/85:2011 PR en matire dintensit sonore, annexe I 26 juin 2011

Point retenir : Le but est de configurer lenvironnement dcoute une fois de manire
approprie, puis de veiller toujours couter au niveau dfini, pour la cration de
contenu. Ceci est vrai mme quand on utilise un casque dcoute pour le contrle.

I.5 CONTRLE DE NIVEAU UIT-R BS.1770


La Recommandation UIT-R BS.1770 fournit une nouvelle technique de mesure pour le contrle
des niveaux sonores. Lutilisation doutils de mesure prenant en charge les mthodes de mesure
BS.1770 par tous les intervenants de la production audio aidera lindustrie grer lintensit
sonore des signaux audio des contenus tout en respectant le but artistique. La PR contient une
discussion dtaille sur la recommandation BS.1770 et sur la faon dont elle fonctionne (voir
lannexe A). Une explication plus brve de la meilleure faon demployer la technique est
fournie dans la section 5.2.

Point retenir : Utiliser des outils de mesure conformes la recommandation


BS.1770!

I.6 INTENSIT SONORE DE CONTENU DURANT LE MIXAGE

Point retenir : Le niveau de contrle tant dment rgl, toujours mixer en se fiant
son oreille. Utiliser un outil de contrle dintensit sonore BS.1770 pour confirmer ce
que lon entend.

I.7 INTENSIT SONORE CIBLE POUR LE CONTENU SANS MTADONNES


Pour la distribution ou lchange de contenu sans mtadonnes 13, la valeur de lIntensit sonore
cible devrait tre 24 LKFS. De lgers carts de mesure par rapport cette valeur, de lordre de
2 dB, sont prvus en raison de lincertitude des mesures, et ils sont acceptables. Le niveau
dintensit sonore cible des contenus ne devrait pas tre fix au-dessus ou au-dessous de cette
plage. Le niveau de crte vrai devrait tre maintenu sous 2 dB TP afin de fournir la marge
ncessaire pour viter lcrtage potentiel la suite dun traitement aval (p. ex. le codage audio
utilis dans la distribution).

Point retenir : Dans la production de contenu, lorsque le niveau sonore de la


distribution du programme est inconnu ou na pas t spcifi, mixer le Niveau de
dialogue 24 LKFS avec crtes vraies sous 2 dB TP.

I.8 EXIGENCE DE LA FCC


Le document ATSC A/53, partie 5:2010 [1] rend obligatoire le transport du paramtre dialnorm et
de valeurs dialnorm rgles de faon approprie.

13
Ou lorsquil nexiste pas daccord pralable entre les parties pour ce qui a trait lintensit sonore.

78
ATSC A/85:2011 PR en matire dintensit sonore, annexe I 26 juin 2011

Point retenir : Le paramtre dialnorm de lencodeur AC-3 de la station sera rgl pour
quil corresponde lintensit sonore du Niveau de dialogue moyen du contenu.

I.9 MESURE DE CONTENU POSTPRODUIT


Voir la section 5.2.1 de la PR.
I.9.1 Contenu longue dure
Une partie reprsentative du contenu domine par le dialogue type (c.--d. non par des cris ou
des chuchotements) devrait tre isole et mesure durant ou aprs le mixage final. En labsence
de dialogue, lintensit sonore de llment du contenu sur lequel se fonderait un tlspectateur
raisonnable pour rgler le volume devrait tre mesure. Si aucune des deux techniques nest
possible ou pratique, lintensit sonore de tout le contenu devrait tre mesure. Si le contenu
contient des priodes importantes de silence, consulter la section 5.2.3 de la PR.

Point retenir : Mesurer lintensit sonore de passages du contenu longue dure o il


y a des dialogues types et enregistrer la valeur comme Niveau de dialogue du contenu.

I.9.2 Contenu courte dure


Voir la section 5.2.4 de la PR.

Point retenir : Mesurer lintensit sonore de tous les canaux audio 14 et de tous les
lments intgrs de la piste sonore, sur toute la dure du contenu de courte dure.

14
Le canal LFE nest pas compris.

79
ATSC A/85:2011 PR en matire dintensit sonore, annexe J 26 juin 2011

: Annexe J
Exigences relatives ltablissement et au maintien
de lintensit sonore des messages publicitaires la
tlvision numrique

J.1 INTRODUCTION ET PORTE


Les recommandations prsentes dans cette annexe sont fondes sur dautres sections de la
Pratique recommande. Cette annexe contient la marche suivre ncessaire pour contrler
efficacement lintensit sonore des messages publicitaires destins la tlvision numrique.

J.2 GESTION DE LINTENSIT SONORE


Le but de loprateur est de prsenter aux tlspectateurs une intensit sonore uniforme entre les
programmes, les messages publicitaires, le matriel de promotion et les messages dintrt
public. Dans la mesure du possible, loprateur devrait offrir aux tlspectateurs le son le plus
prcis, de la plus haute qualit et libre de tout phnomne parasite ne faisant pas partie du produit
original livr par le fournisseur de contenu.

J.3 PARAMTRE dialnorm POUR LES SYSTMES AC-3


Le document ATSC A/53, partie 5:2010 [1] section 5.5 dcrit le transport du paramtre dialnorm et
de valeurs dialnorm rgles de faon approprie15.

J.4 MESURE DE LINTENSIT SONORE DES MESSAGES PUBLICIATAIRES


Lorsque lintensit sonore dun contenu courte dure (p. ex. message publicitaire) est mesure, il
est vital quelle soit mesure en units LKFS et que tous les canaux audio 16 et tous les lments
de la piste sonore soient mesurs sur toute la dure du contenu.

J.5 MESSAGE PUBLICITAIRES AU POINT DINSERTION


Dans le cas de linsertion de contenu courte dure 17 (p. ex. message publicitaire), il est vital que
lintensit sonore du contenu courte dure insr, mesure suivant les indications de la
section J.4, correspondeError: Reference source not found au rglage dialnorm de ce flux
audio AC-3 insr, conformment la section J.3.

15
Voir la section 7.1 du prsent document.
16
Conformment la recommandation BS.1770, le canal LFE nest pas compris.
17
Voir la section 8.4 du prsent document.

80
ATSC A/85:2011 PR en matire dintensit sonore 26 juin 2011

: Annexe K
Exigences relatives ltablissement et au maintien
de lintensit sonore des messages publicitaires la
tlvision numrique quand on utilise des codecs
non-AC-3

K.1. INTRODUCTION ET PORTE


Les recommandations prsentes dans cette annexe sont fondes sur dautres sections de la
Pratique recommande. Cette annexe contient la marche suivre ncessaire pour contrler
efficacement lintensit sonore des messages publicitaires destins la tlvision numrique
quand des codecs audio non-AC-3 sont utiliss.

K.2. GESTION DE LINTENSIT SONORE


Le but de loprateur est de prsenter aux tlspectateurs une intensit sonore uniforme entre les
programmes, les messages publicitaires, le matriel de promotion et les messages dintrt
public.

K.3. INTENSIT SONORE DES CANAUX NON-AC-3


Il est vital que la chane de distribution fonctionne suivant une valeur de intensit sonore cible
slectionne par loprateur (et mesure en units LKFS) pour le contenu prsent sur la chane.

K.4. MESURE DE LINTENSIT SONORE DES MESSAGES PUBLICITAIRES


Lorsque lintensit sonore dun contenu courte dure (p. ex. message publicitaire) est mesure, il
est vital quelle soit mesure en units LKFS et que tous les canaux audio 18 et tous les lments
de la piste sonore soient mesurs sur toute la dure du contenu.

K.5. MESSAGE PUBLICIATAIRE AU POINT DINSERTION


Dans le cas de linsertion de contenu courte dure (p. ex. message publicitaire), il est vital que
lintensit sonore du contenu courte dure insr, mesure suivant les indications de la
section K.4, corresponde la valeur du intensit sonore cible de la chane de distribution 2 dB
prs.

18
Conformment la recommandation BS.1770, le canal LFE nest pas compris.

81
ATSC A/85:2011 PR en matire dintensit sonore 26 juin 2011

Pratique recommande par lATSC :


Techniques dtablissement et de maintien
de lintensit sonore pour la tlvision
numrique

Document A/85:2011, 25 juillett 2011

Advanced Television Systems Committee, Inc.


1776 K Street, N.W., Suite 200
Washington, D.C. 20006

82

You might also like