Professional Documents
Culture Documents
26 juin 2011
3
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
4
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
5
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
6
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
7
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
8
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
9
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
10
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
1.2 Structure
La structure de ce document est la suivante :
Section 1 Dfinition de la porte du document et introduction
gnrale.
Section 2 Liste des rfrences et des documents pertinents.
Section 3 Dfinition des termes, sigles et abrviations utiliss dans
le document.
Section 4 Explication du sommaire technique du systme audio
multicanal AC-3.
Section 5 Explication de la mesure de lintensit sonore fonde sur
les techniques dfinies dans la recommandation UIT-R BS.1770.
Section 6 Recommandations visant lchange de contenu sans
mtadonnes.
Section 7 Lignes directrices visant lutilisation pratique de
mtadonnes dynamiques et statiques dans les environnements de
production, de distribution et de transmission.
Section 8 Description des mthodes de contrle efficaces de
lintensit sonore lors de transitions entre programme et contenu
interstitiel.
Section 9 Examen des principaux problmes lis au contrle de la
gamme dynamique (DRC).
Section 10 Indication de la configuration des systmes audio pour la
tlvision numrique, y compris lalignement des haut-parleurs de
contrle de la rgie un niveau de pression acoustique de rfrence.
Annexe A Intensit sonore des programmes : donnes contextuelles
sur les algorithmes de mesure de lintensit sonore et des niveaux de
crte vrais de la recommandation BS.1770.
Annexe B Acoustique des salles et disposition des haut-parleurs :
explication des principes de base du contrle (monitoring) dans la
rgie.
Annexe C Correction de la salle : examen des problmes lis
linteraction entre le son provenant des haut-parleurs et la salle.
Annexe D Aide-mmoire sur le rglage du niveau acoustique de
rfrence pour les salles de contrle de tlvision.
Annexe E Plages dintensit sonore : examen de la plage dintensit
sonore lintrieur de laquelle un auditeur accepte les variations
11
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
2 RFRENCES
Les ditions indiques ci-dessous sont valides au moment de la publication
du document. Les documents cits en rfrence faisant tous lobjet de
rvisions, les utilisateurs de la prsente pratique recommande sont invits
vrifier sil est possible dappliquer une dition plus rcente du document
cit.
12
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
13
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
[21] AES.: AES17-1998 (r2004), AES standard method for digital audio
engineering - Measurement of digital audio equipment, Audio
Engineering Society, New York, N.Y.
[22] SMPTE. RDD 6-2008, Description and Guide to the Use of the Dolby E
Audio Metadata Serial Bitstream, Society of Motion Picture and
Television Engineers, White Plains, N.Y.
[23] SMPTE. SMPTE 337-2008, Format for Non-PCM Audio and Data in an
AES3 Serial Digital Audio Interface, Society of Motion Picture and
Television Engineers, White Plains, N.Y.
[24] ATSC. A/79, Conversion of ATSC Signals for Distribution to NTSC
Viewers, Advanced Television Systems Committee, Washington, D.C.,
12 dcembre 2008.
[25] CEA. CEA-CEB11-A, NTSC/ATSC Loudness Matching, Consumer
Electronics Association, Arlington, VA, septembre 2009.
[26] ANSI. ANSI C16.5-1942, Standard Volume Indicator, American National
Standards Institute, Washington, D.C.
[27] IEC. Norme IEC 60268-17, quipements pour systmes
lectroacoustiques Partie 17 : Indicateurs de volume normaliss,
Commission lectrotechnique internationale, Genve, 1990.
[28] IEC: Norme IEC 60268-10/Iia, IIb, 1991, quipements pour systmes
lectroacoustiques Partie 10 : Appareils de mesure des crtes de
modulation, Commission lectrotechnique internationale, Genve,
1991.
[29] ANSI. ANSI S1.4-1983 (R 2001) avec modif. S1.4A-1995, Specification
for Sound Level Meters, American National Standards Institute,
Washington, D.C.
[30] Commercial Advertisement Loudness Mitigation (CALM) Act, Pub. L.
111-311, 47 U.S.C. 621 (2011).
14
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
3.4 Termes
Les termes suivants sont employs dans le document.
lment dancrage (Anchor Element) Point ou lment de rfrence de la
sonie (intensit sonore perue) autour duquel les autres lments du
contenu sont quilibrs pour produire le mixage sonore final du contenu
15
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
1
Le terme Niveau de dialogue est fond sur lutilisation rpandue du
dialogue comme ancrage pour le mixage du contenu; historiquement, on
a convenu que le dialogue constituait llment dancrage de la plupart
des programmes.
16
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
17
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
18
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
K Filter Filtre K
Average Power Puissance moyenne
Channel Weighting Pondration de canal
Measured Loudness Intensit sonore
L G
R D
C C
Ls Ambiance gauche
Rs Ambiance droite
2
Le canal d'effets basses frquences (LFE) n'est pas pris en compte
dans lalgorithme de mesure courant de lUIT-R BS.1770. Les utilisateurs
de la prsente PR devraient utiliser la version la plus rcente de la
recommandation UIT-R BS.1770.
19
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
5.2 Mesure
La norme de tlvision numrique ATSC, A/53, exige la prsence dune
valeur dment tablie de dialnorm dans le flux lmentaire AC-3. Pour le
contenu ayant des signaux audio stendant sur une plage de valeurs
dintensit sonore, lobjectif est que la valeur du paramtre dialnorm
corresponde lintensit sonore de llment dancrage prdominant
(gnralement, le dialogue du programme).
Si le dialogue nest pas llment dancrage du contenu (p. ex. un
programme musical), cest lintensit sonore de llment du mixage son sur
lequel se fondera un tlspectateur raisonnable au moment de rgler sa
commande de volume qui devrait tre mesure et indique comme Niveau
de dialogue du contenu.
Dans les cas o il nest pas possible ou pratique de centrer la mesure sur
llment dancrage, une mesure intgre sur une longue dure de
lintensit sonore de tous les lments de la piste sonore devrait tre
excute.
tant donn que la mesure de lintensit sonore conformment la
recommandation BS.1770 est une mesure intgre, les passages silencieux
ont tendance abaisser la valeur mesure. Pour viter cette situation,
lintgration peut tre interrompue durant les segments de faible puissance.
Certains organismes, dont lUIT-R, tudient un procd arrt-pause-reprise
automatique, gnralement appel gating (dclenchement priodique),
que lUIT-R prvoit ajouter ultrieurement la recommandation BS.1770.
Certains appareils peuvent offrir une fonction de dclenchement priodique.
Toutefois, il nexiste pas encore de norme visant la mesure dintensit sonore
avec fonction de dclenchement priodique. Les utilisateurs devraient
employer la version courante de lUIT-R BS.1770 pour les mesures.
5.2.1 Mesure durant la production ou la postproduction
Durant le processus de production ou de postproduction, il est gnralement
possible didentifier llment dancrage (gnralement le dialogue) du
mixage son du programme et den mesurer lintensit sonore avec prcision.
Un chantillon reprsentatif de lancrage devrait tre mesur conformment
la recommandation BS.1770 [3]. Sil est impossible didentifier et de
mesurer seul llment dancrage, on devrait alors mesurer lintensit sonore
de longue dure de tous les lments de la piste sonore, sur toute la dure,
et la signaler comme Niveau de dialogue.
5.2.2 Mesure en temps rel en cours de production (vnement en direct)
Le but des mesures dintensit sonore durant un vnement en direct est de
guider le mixeur de son pour produire un contenu ayant lIntensit sonore
cible ou prtablie. Le principe de la mesure de lintensit sonore de
llment dancrage du contenu sapplique aussi aux productions en direct,
20
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
21
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
22
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
23
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
24
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
25
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
4
Comme il est signal dans la section 3.4, dialnorm est exprim comme un entier
non sign.
26
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
27
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
Source 1 Source 1
Source n Source n
Process, Storage, distribution and Switching Traitement, stockage, distribution et commutation
Embed Incorpore
Metadata Values Valeurs de mtadonnes
De-Embed Extrait
Metadata Mtadonnes
Audio Audio
AC-3 Encoder Encodeur AC-3
ATSC Distribution Distribution ATSC
Consumer AC-3 Decoder Dcodeur AC-3 du consommateur
28
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
5
P. ex. e-squared de Linear Acoustic et Quad Phase Aligned de Tandberg.
29
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
30
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
31
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
changements dintensit sonore indsirables dans les transitions de contenus (passage dun
lment de contenu un autre) si le systme nest pas gr de faon approprie. Cette situation
est une cause de contrarit connue des tlspectateurs, qui les force souvent rgler le volume
de leur appareil durant les transitions pour maintenir lintensit sonore un niveau confortable.
Lapplication dune bonne gestion de lintensit sonore des programmes de TVN permet de
remdier ce problme.
Le systme AC-3 intgre la technologie ncessaire pour attnuer les variations dintensit
sonore se produisant au passage des programmes aux contenus interstitiels. Les techniques
prvues sont dcrites ci-dessous.
32
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
volume pour lcoute du contenu de courte dure. Cette situation sest avre contrariante
pour les tlspectateurs.
33
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
Si le produit du crateur destin au rseau est dcod en bande de base, il faut mesurer
lintensit sonore du flux audio dcod et rgler la valeur dialnorm du r-encodeur AC-3 pour
quelle corresponde lintensit sonore mesure, pour ltape de codage suivante. Dans ce cas,
soit que loprateur modifie lintensit sonore du contenu du crateur pour quelle corresponde
la valeur cible du systme de loprateur, soit quil utilise la valeur dintensit sonore du contenu
du crateur (mesure) pour rgler la valeur dialnorm de ltape suivante dencodage AC-3. cette
tape de recodage, il est crucial que les autres paramtres de mtadonnes soient rgls
uniformment et de faon approprie.
9 GESTION DE LA DYNAMIQUE
Le systme audio de TVN est capable de fournir une gamme dynamique (intervalle entre les sons
les plus faibles et les sons les plus forts) trs large. Les producteurs de contenu se servent
souvent de la gamme dynamique comme une des mthodes de communication de lintention
artistique.
Toutefois, il pourrait y avoir un conflit entre le producteur dsirant distribuer un contenu de
gamme dynamique tendue et le tlspectateur qui ne peut pas, ou ne veut pas profiter de cette
gamme dynamique accrue. Limpossibilit peut provenir de lquipement du tlspectateur qui
nest pas en mesure de reproduire la gamme de sons voulue ou dun environnement dcoute qui
ne permet pas de jouir de la gamme dynamique tendue. Ainsi, lobjectif de conserver la gamme
dynamique originale du contenu et celui de satisfaire les tlspectateurs ne vont souvent pas de
pair.
Un des objectifs du systme AC-3 est de doter les producteurs de contenu de la plus grande
libert et de la plus grande souplesse dans le choix du contrle de la gamme dynamique (DRC)
au moment de crer leur contenu. Le systme AC-3 transmet ces options de DRC au
tlspectateur, dont les choix agiront avec le systme DRC dune faon connue et reproductible.
Il existe plusieurs mthodes de contrle de la gamme dynamique. Certaines sont appliques
avant lencodage du signal audio, dautres, aprs le dcodage et dautres encore, dans les deux
domaines :
1) Une approche est la compression classique et (ou) la limitation, o le rglage du gain est
appliqu aux signaux audio avant lencodage.
2) Une autre approche est lemploi du systme de codage AC-3, qui gnre des mots de contrle
de gain durant lencodage, mais qui napplique le rglage du gain aux signaux audio
quaprs le dcodage, ce qui permet lutilisateur de choisir facultativement ltendue de
la plage dynamique quil souhaite.
La principale diffrence entre les deux approches est que la mthode AC-3 produit un rsultat
rversible et lautre, un rsultat permanent. Une mthode hybride peut aussi tre adopte, qui
combine une partie de traitement permanent et une partie rversible dans une proportion
tablie par le radiodiffuseur.
34
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
35
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
Un deuxime signal de commande DRC, plus nergique, est calcul en mme temps. Il est
conu pour lemploi dans les produits pouvant tre interconnects par un signal analogique
modul RF. La gamme dynamique des signaux moduls RF est gnralement plus troite que
celle des signaux utilisant le processus dinterconnexion au niveau lignes. En mode RF, un gain
de 11 dB est appliqu aux fins dharmonisation de lintensit sonore avec celle des anciens
systmes analogiques. Ce mode est le mode par dfaut des dcodeurs de MVPD ainsi que des
tlviseurs quips de syntoniseurs numriques et de petits haut-parleurs intgrs. Le nom du
paramtre de mtadonnes correspondant est compr. Pour obtenir plus de renseignements propos
des recommandations visant lharmonisation de lintensit sonore pour les produits grand public,
voir le document CEA-CEB11 [25]. Les recommandations du prsent document et du document
CEA-CEB11 ont t coordonnes et sont complmentaires.
9.1.2 Contrle
Lemploi dun systme dans lequel les mots de gain (voir annexe F) de DRC sont calculs
dans lencodeur et appliqus dans le dcodeur prsente des avantages. Un des avantages de ce
type de conception systme est quil permet de visualiser, ou dmuler, les fonctions de
compresseur/limiteur en cours de production, bien avant que le contenu soit cod. Les
producteurs peuvent vrifier le contenu au fur et mesure quil est produit pour en entendre le
rsultat selon des modes de dynamique prtablis.
Les effets de ce systme DRC seront audibles aux mixeurs travaillant dans un environnement
de contrle professionnel, mais le processus devrait tre considr dans le contexte du
consommateur type, dans un environnement domestique type, o la rduction et laugmentation
de gain dont il est question passent gnralement inaperues. Dans la plupart des situations, les
effets du DRC en mode ligne amliorent le rendu gnral du contenu en adaptant mieux les
signaux audio aux capacits de reproduction de lquipement et de lespace dcoute du
tlspectateur.
9.1.3 Relations avec dialnorm
Tous les calculs de DRC sont fonds sur lintensit sonore indique du contenu et relatifs cette
intensit, reprsente par le paramtre de mtadonnes dialnorm. En dautres mots, lencodeur doit
connatre le niveau sonore prvu du contenu pour dterminer quand le contenu est trop fort
ou trop faible . Le paramtre dialnorm dfinit efficacement ce niveau cible. En consquence, il
est trs important que dialnorm indique avec prcision lintensit sonore du contenu.
Le paramtre dialnorm est aussi utilis pour tablir le seuil dun processus de protection contre
les surcharges quelque peu dissimul et invitable, conu pour empcher les signaux audio
rduits par mixage de surcharger le matriel du consommateur. La protection contre la surcharge
utilise une balistique approprie pour liminer les risques de surcharge, mais elle est beaucoup
moins quidale pour la qualit sonore. Il convient dviter la protection contre les surcharges. Il
est possible de le faire en veillant ce que le paramtre dialnorm reprsente avec prcision
lintensit sonore relle du contenu audio.
9.1.4 Codage professionnel
Dans les encodeurs AC-3, les caractristiques de rduction et daugmentation de gain des modes
DRC RF et de ligne sont dtermines par un groupe de profils DRC. Ces profils dcrivent de
nombreux paramtres, y compris la plage de rduction de gain, la plage daugmentation de gain
ainsi que les temps dattaque et de relchement. Entre ces plages se trouve une plage linaire
(dite zone sans correction ) o aucune rduction ou augmentation de gain na lieu. Il est prvu
que la majorit des contenus mixs de manire professionnelle se trouvera dans la plage sans
36
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
correction , o le contenu sera distribu exactement tel quil est produit, sans modification
supplmentaire (ou continue). Les excursions au-del de cette zone sans correction peuvent
servir communiquer une intention artistique particulire. Il est noter que le paramtre dialnorm
dtermine la position de la zone sans correction, ce qui indique, une fois de plus, quil est
essentiel que le paramtre dialnorm reprsente avec prcision lintensit sonore du contenu.
Cinq profils sont dfinis dans lencodeur AC-3, qui sont les suivants :
Music Light (Musique lger)
Music Standard (Musique standard)
Film Light (Film lger)
Film standard
Speech (Parole).
La diffrence entre les options de DRC musique et film peut tre subtile pour un auditeur
type, mais lun ou lautre peut convenir davantage certains types de contenu. La meilleure
faon de le dterminer est de contrler au moyen dun mulateur appropri. Les versions
lgres des profils ont une zone sans correction beaucoup plus large. Ainsi, la rduction ou
laugmentation de gain commence plus loin du niveau audio moyen du programme, ce qui rduit
la rduction ou laugmentation de gain par rapport la version standard du profil.
Comme son nom lindique, le profil parole est prvu pour les programmes ne contenant que
de la parole (un format de station radio interactive , par exemple). Ce profil peut introduire un
phnomne parasite de DRC perceptible dans les programmes ayant de la musique et des effets
sonores. Pour obtenir plus de renseignements sur les profils DRC, veuillez consulter lAnnexe F.
9.1.5 DRC AC-3 : slection de None
Il y a aussi un choix appel None (aucun), qui a pour effet de ne slectionner aucun des
profils DRC nomms. La slection de loption None (par loprateur) empche la cration
des mots de commande DRC.
Loption None est un choix acceptable dans la mesure o lon comprend bien les
implications de ne pas choisir de profil DRC :
La caractristique de rversibilit du systme DRC ne sera pas offerte au consommateur.
La slection de None empche le tlspectateur de choisir une option DRC ou
dactiver des fonctions comme Late Night (fin de soire) ou Midnight (nuit) dans
certains appareils qui utilisent le mode DRC RF.
La gamme dynamique devrait tre contrle dune autre faon par loprateur ou par le
crateur du programme.
Dans certains rcepteurs de TVN ayant une capacit de volume limite, il est possible que
la limite de reproduction soit dpasse.
Les mots de commande DRC du mode RF sont aussi utiliss pour tablir des limites de
protection. Un limiteur de protection empche lcrtage dans les dcodeurs des
consommateurs, qui pourrait tre entran par un rglage dialnorm erron conjugu avec
une programmation trs dynamique. La slection de loption None nempche pas la
cration de mots de commande DRC de limite de protection, qui sont trs nergiques et
peu artistiques. Le processus de limitation de protection a un temps dattaque trs court et
un temps de relchement trs long, ce qui peut produire des phnomnes parasites
audibles dsagrables.
37
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
Les systmes qui utilisent les signaux ATSC comme source de distribution DS (p. ex.
cblodistribution analogique DS) ne seront pas en mesure demployer le DRC en mode
RF pour tablir un signal analogique DS de gamme dynamique rduite. Pour plus de
conseils, voir la pratique recommande ATSC A/79 [24].
Pour que le systme de contrle de gamme dynamique AC-3 soit fonctionnel, les oprateurs
devraient choisir un autre profil que None lorsquappropri.
38
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
dcrites plus haut, les modifications de gain sont appliques immdiatement au signal dentre,
avant la transmission aux consommateurs, et les rsultats sont donc jugs irrversibles.
Les premiers systmes de CAG taient des systmes large bande comportant un seul
dtecteur de niveau et un seul lment de gain pour contrler toute la largeur de bande audio.
Dans les dbuts de la radiodiffusion, cette pratique pouvant tre acceptable, parce que la largeur
de bande audio tait limite et que des oprateurs comptents ralisaient des programmes audio
plus uniformes. Toutefois, en raison de laugmentation de la largeur de bande audio et de la
diminution de lintervention des oprateurs, il fallait dvelopper dautres techniques pour
maintenir le contrle et rduire au minimum les effets secondaires audibles du processus de
CAG.
Un phnomne parasite potentiel de la CAG large bande est la possibilit que le niveau dune
partie du spectre audio soit modifi cause dune autre partie du spectre audio sans rapport avec
la premire, qui a plus de puissance. Pour reprsenter ce phnomne, on peut imaginer un signal
audio contenant les sons dune grosse caisse basse frquence et dune flte de frquence plus
leve. En rponse lnergie leve de la grosse caisse, le systme de CAG large bande simple
ferait varier le signal de commande, et donc le niveau, de toutes les frquences. Cette
modification de niveau pourrait tre approprie pour la grosse caisse, mais entranerait une
fluctuation inapproprie dans le niveau du signal de la flte, un effet communment appel
pompage . Le dveloppement de systmes de traitement multibandes a remdi largement ce
problme, car le signal dentre est divis en deux bandes de frquences ou plus et une CAG est
applique chacune des bandes. Les systmes multibandes permettent un plus grand contrle
accompagn de moins dinteraction entre les diffrentes parties du spectre audio, mais peuvent
aussi modifier lquilibre spectral du signal appliqu.
Dautres techniques ont volu pour rduire au minimum les effets secondaires comme le
pompage , la surcharge entrane par la praccentuation et laugmentation du bruit de fond. Il
sagit notamment du traitement en srie, du traitement en prlecture, de lcrtage et du fentrage
antiparasites. Le traitement en srie consiste mettre en srie deux sections de CAG ou plus, de
vitesse diffrente, pour contrler sparment les crtes et les signaux de niveau moyen. Le
traitement en prlecture prvoit un dlai entre les parties dtection et rglage de la CAG de
manire ce que les modifications de gain soient appliques au moment prcis o il le faut.
Lcrtage est un processus au cours duquel les crtes des signaux sont tronques; il peut
entraner une distorsion audible. Les fentres antiparasites empchent les signaux de trs faible
niveau et le bruit dtre inutilement amplifis par la CAG et peuvent tre utilises avec des seuils
dautres phases pour crer une zone sans traitement. Ensemble, toutes ces techniques dpassent
considrablement les objectifs initiaux de protection simple contre la sous-modulation ou la
surmodulation et dans de nombreux cas, elles ont t utilises pour produire un son trs diffrent
de loriginal.
Le but des systmes modernes de contrle de gamme dynamique en tlvision numrique est
diffrent de celui de leurs prdcesseurs analogiques. Llimination de la ncessit de
praccentuation rduit normment la quantit de traitement ncessaire. Les appareils rcents
peuvent aussi faire appel des modles de dtection complexes, fonds sur la recommandation
UIT-R BS.1770 [3] ou compatibles avec elle. Si lobjectif est simplement de grer lintensit
sonore en produisant une incidence minimale sur le contenu des programmes, lexprience a
dmontr quun processus plusieurs phases de traitement subtil peut tre trs efficace tout en
permettant de conserver dans une large mesure lintgrit des programmes. En outre, il est
possible de rgler les problmes survenant aux extrmits des programmes et du matriel
39
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
interstitiel au moyen dun traitement de gamme dynamique irrversible, qui ne fait pas partie du
systme AC-36.
6
Pour obtenir plus de renseignements, consulter les fabricants dappareils conus
cette fin.
40
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
10.1 Contexte
Comme nous lavons signal dans la section 1.1, les consommateurs ne sattendent pas
percevoir de grandes variations dintensit sonore au passage dun programme un contenu
interstitiel et quand ils changent de chane. Deux fonctions lies au niveau sonore sont intgres
au systme AC-3 spcifi dans la norme ATSC : la normalisation du dialogue et le contrle de la
gamme dynamique. Si ces fonctions sont bien rgles et bien utilises, elles permettent
datteindre dans une large mesure les objectifs de maintien de lintgrit artistique des mixages,
tout en livrant une gamme dynamique convenant aux conditions dcoute du consommateur.
Lutilisation dune disposition de haut-parleurs de contrle normalise, de niveaux de rfrence
lectriques et acoustiques standard et dune rponse spectrale de rfrence par tous les
fournisseurs de programmes et de contenu interstitiel produit une base commune pour le
contrle. Outre les fonctions intgres au systme AC-3, ladoption pratique des
recommandations de cette section de la PR devrait contribuer satisfaire aux besoins rciproques
des producteurs et des consommateurs.
Lobservation universelle est quun niveau de pression acoustique donn est peru comme
tant plus fort dans de petits locaux, comme une rgie, que dans de grandes salles comme les
cinmas. Linterchangeabilit du niveau de pression acoustique de rfrence utilis dans ce
document avec le niveau SMPTE RP 200 [6] employ dans les grands espaces a t teste.
Il a t dmontr que lutilisation de conditions de contrle de rfrence amliore
linterchangeabilit des programmes, des messages commerciaux et dautres mixages interstitiels
et quelle est donc souhaitable.
41
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
Camions et cabines de mixage de programmes. Ces espaces exigent des mesures particulires en
IV raison de leur petit volume, du niveau lev de bruit de fond, dun niveau lev de premires rflexions
et des besoins de communication dans un environnement de production.
Recommandations visant les systmes de contrle casque dcoute. Utiliss dans les stations
V dingestion , dans des environnements encombrs, pour le contrle de qualit dans les salles de
machinerie et dans les endroits semblables.
10.3 Installation
Les systmes audio des espaces de catgories I, II et IV devraient tre installs, pour autant que
ce soit ralisable, suivant les pratiques recommandes dans les documents de rfrence (voir
rfrences [12], [14], [16] et [17]). Les espaces de catgorie III devraient aussi remplir les
exigences des pratiques recommandes sils sont utiliss pour le mixage final.
Il convient de souligner limportance de placer les haut-parleurs gale distance de
lemplacement de contrle de mixage principal ou, si ce nest pas possible, dutiliser une
temporisation de faon ce que le temps darrive lemplacement de mixage soit constant pour
tous les canaux de haut-parleur. Cette mesure est ncessaire en raison de la trs grande prcision
de loue humaine dans la localisation dimages fantmes apparaissant entre les paires adjacentes
de haut-parleurs. Cette exigence est particulirement importante pour les canaux avant et, si les
haut-parleurs dambiance sont plus prs de lemplacement dcoute que les haut-parleurs avant,
il convient dy appliquer une temporisation.
Les documents de rfrence prsentent la rponse en frquence anchoque prvue des haut-
parleurs et des systmes de contrle. Des mesures des haut-parleurs sur place, dans les rgies,
indiquent toutefois de forts carts dans la rponse anchoque des haut-parleurs, particulirement
en raison des conditions de charge aux zones limites des salles trs basse frquence,
accompagns deffets modaux donde stationnaire, gnralement dans la gamme de frquences
allant de 80 Hz 500 Hz. Cest pourquoi lgalisation de la salle est hautement souhaitable et
mme ncessaire pour les espaces de qualit suprieure. Les problmes lis lgalisation des
salles sont dcrits lannexe C.
Il a t observ que les plus grands carts en balance octave octave des mixages diffuss se
situent dans les frquences des extrmits, sous 100 Hz et au-dessus de 8 kHz. Ce phnomne est
probablement imputable aux rponses variables des systmes de contrle dans ces gammes de
frquences. Cest pourquoi la courbe de rponse dans une salle fonctionnelle prsente la
figure 10.1 sapplique aux espaces de contrle de la catgorie I. La gamme basses frquences et
la marge de scurit des espaces de catgories II et IV peuvent tre rduites par rapport celles
des espaces de catgorie I.
42
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
La figure 10.1 est lindication dune mesure dtat quasi statique excuter au moyen dun
ou de plusieurs microphones faible diffraction placs tour tour la position dcoute
principale et proximit, pour chaque canal principal (gauche, droite, centre, ambiance gauche et
ambiance droite). Le lecteur trouvera de plus amples renseignements lannexe C.
Il faut aussi porter attention lalignement des niveaux des effets basses frquences ou du
canal 0,1. Il existe une certaine confusion en raison du besoin de prvoir 10 dB de gain
intrabande par rapport aux canaux principaux. Cela ne signifie toutefois pas que lindication de
pression acoustique doit dpasser de 10 dB celle des canaux principaux au moment de
ltalonnage. tant donn que la largeur de bande LFE est plus troite que celle des canaux
principaux, le niveau mesur durant la lecture dune source de bruit rose des bons niveaux
spectral et lectrique sera suprieur denviron 4 dB celui des canaux principaux.
43
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
44
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
tape 3. Repiquer le fichier de parole original tlcharg (voir ci-dessous), en gain unitaire, dans
le canal du centre ou mono de lappareil de lecture utilis. Dans le cas o lon ne peut
excuter que le contrle stro sur deux canaux, reproduire le fichier de parole original dans
les canaux gauche et droit avec attnuation de 3 dB dans chaque canal et confirmer quils
sont synchroniss dans lchantillon. Veiller ce que le trajet du signal soit le mme qu
ltape 1 ci-dessus, de manire ce que cette lecture se fasse dans les mmes conditions de
gain que ltape 1 et de bruit que ltape 2. Faire jouer lenregistrement de parole, dont
lintensit sonore mesure est de 24 LKFS et observer si le niveau est normal. Si on ne
dispose pas de sonomtre et que lon a pass ltape 2, sassurer davoir excut ltape 1 si
lon dispose de lquipement indiqu et ajuster cette piste pour obtenir le niveau dcoute le
plus confortable possible.
Le niveau sonore de cet enregistrement de parole a t rgl 24 LKFS, conformment
la norme BS.1770 [3].
http://www.atsc.org/refs/a85/Speech_sample.wav
tape 4. Sil y a un caisson dextrmes graves, alimenter le canal deffets basses frquences
lectriquement au moyen du signal ci-dessous et rgler le niveau du caisson pour +4 dB par
rapport aux canaux principaux, quand on excute la mesure au moyen dun sonomtre
lecture lente et pondration C.
http://www.atsc.org/refs/a85/LFPinkNoise_-20dB.wav.
45
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique
12 dcembre 2011
est indique dans le document AES17-1998 (R2004) [21], o une onde sinusodale pleine chelle
est dfinie 0 dB FS; cette dfinition sapplique dans le prsent document. Toutefois, de
nombreux logiciels indiquent le niveau sur des appareils virtuels en se fondant sur des calculs de
valeurs efficaces classiques, donnant une indication donde sinusodale pleine chelle de
3,01 dB FS, ce qui est erron dans le contexte du prsent document.
10.5.2 Tonalit sinusodale 440 Hz
http://www.atsc.org/refs/a85/440Hz_left_Ch-20dB.wav
La tonalit sinusodale est le signal dessai audio le plus simple et le plus largement employ.
Les utilisations types comprennent le contrle du cheminement des signaux et le rglage du
niveau. Une onde sinusodale prsente deux caractristiques utiles pour les essais :
premirement, elle est de niveau constant, ce qui permet de la mesurer avec une plus grande
prcision et deuximement, une tonalit sinusodale de frquence moyenne nimpose aucune
contrainte aux limites des systmes et les traverse sans subir de traitement.
Le niveau est de 20 dB par rapport au maximum (dB FS).
La frquence de 440 Hz a t choisie pour trois raisons : elle se situe dans la portion la plus
plate de la courbe de rponse en frquences dgalisation de la norme BS.1770 [3], elle est
musicalement pertinente comme rfrence A sur lchelle musicale et elle nest pas
harmoniquement lie aux diverses frquences dchantillonnage utilises, ce qui permet
lexploitation de toutes les valeurs de code de sa porte. Utiliser une tonalit une frquence de
syntonie prcise facilite les essais en permettant didentifier de faon audible les erreurs pouvant
exister dans la frquence dchantillonnage de lecture par rapport la frquence
dchantillonnage enregistre.
Durant le dveloppement de ce signal dessai, on a dcouvert que la production dune onde
sinusodale dessai prcisment 20 dB FS, suivie de lajout dun bruit blanc vibratoire de
fonction de densit de probabilit triangulaire de 1 LSB, comme il est ncessaire pour obtenir
un signal dessai sans distorsion, dclenchait dans certains appareils de mesure une indication
dune graduation au-dessus de 20 dB FS, pouvant produire une erreur atteignant 2 dB dans ces
appareils. Le niveau a donc t rduit dun bit en amplitude, puis la vibration ajoute, de sorte
que le niveau de crte du signal est prcisment 20 dB FS, bruit inclus.
10.5.3 Bruit rose limit la bande
http://www.atsc.org/refs/a85/MidRngPinkNoise_-20dB.wav
Un bruit rose bande limite est prfr un bruit bande intgrale pour plusieurs raisons.
basse frquence, sous la frquence de Schroeder 7 dans les salles, les ondes stationnaires ont une
forte influence sur le niveau et linclusion de telles frquences dans la bande de mesure ajoute
une incertitude. De plus, le contenu nergtique des basses frquences dans un signal
stochastique entrane de plus grandes variations de niveau en fonction du temps. plus haute
frquence, lincertitude inhrente la rponse du microphone en fonction de langle, de la courbe
de rponse de la salle et de labsorption de la salle contribue rduire la prcision. Dautre part,
les bruits ou tonalits bande troite subissent une trop grande influence de la rponse des haut-
parleurs et de lacoustique de la salle. Il a donc t tabli quune bande de deux octaves centre
sur la frquence de 1 kHz serait le plus utile pour les canaux principaux et quune bande centre
sur 40 Hz serait le plus utile pour le canal deffets basses frquences.
7
Schroeder, Manfred: The Schroeder Frequency Revisited, JASA, vol. 99, no 5, p. 3240-3241.
46
Annexe A :
Intensit sonore de programme
1. INTRODUCTION
La prsente annexe expose le contexte des algorithmes de mesure de lintensit sonore et de la
crte vraie dfinis dans la pratique recommande BS.1770. Le lecteur trouvera la description
dtaille de ces algorithmes dans le document de rfrence [3].
du document de rfrence [9], o lauditeur est en mesure de comparer divers lments de test
entre eux durant un essai. Chacune des squences dessai a t rpte deux niveaux
damplitude, crant ainsi au total de 96 squences audio monophoniques que les auditeurs
devaient apparier. Un total de 97 auditeurs ont particip lessai, cinq emplacements diffrents.
Les rsultats des essais subjectifs [10] ont constitu la base pour lvaluation du rendement de
divers algorithmes ou appareils de mesure de lintensit sonore.
Sept entits ont prsent dix appareils/algorithmes de mesure de lintensit sonore
monophonique pour valuation. En plus des sonomtres, deux algorithmes de mesure dintensit
sonore ont t soumis par le laboratoire dvaluation pour servir de point de rfrence de
rendement. Ces deux algorithmes sont de simples calculs de valeur quadratique moyenne : le
premier a recours un filtre pondration en frquence simple et le deuxime est sans
pondration. Le filtre pondration simple utilise une courbe de pondration B basse frquence
rvise (RLB). La comparaison des sonomtres/algorithmes de mesure de sonie soumis avec la
base de donnes subjectives a rvl que lalgorithme valeur quadratique moyenne pondr en
frquence simple a prsent le meilleur rendement [11].
Pour vrifier les performances de cet algorithme, une deuxime base de donnes subjectives
a t cre partir dessais subjectifs formels conduits dans lun des emplacements dessai. Pour
cet essai, 20 auditeurs ont valu la sonie des 96 squences audio monophoniques suivant la
mme mthode subjective que la premire ronde dessais. Lanalyse des rsultats enregistrs
dans cette deuxime base de donnes subjectives a confirm les performances de lalgorithme
des valeurs moyennes pondres en frquence.
Dans le but dtendre lapplication de lalgorithme aux signaux audio multicanaux, une
troisime srie dessais a t mene, portant sur 144 squences audio (48 squences
monophoniques, 48 stro et 48 multicanaux) prsentes 20 auditeurs. La mme mthode
subjective a t employe que dans les deux premiers essais. La squence de rfrence tait une
voix fminine anglaise accompagne dune ambiance stro sur fond musical de faible niveau
sonore. Les haut-parleurs taient disposs suivant la configuration dcrite dans la
Recommandation UIT-R BS.775 [12]. Les rsultats de ce troisime essai subjectif [13] ont
abouti la conception de lalgorithme de mesure de lintensit sonore multicanal reprsent la
figure A.1.
48
ATSC A/85:2011 PR en matire dintensit sonore, annexe B 26 juin 2011
L'intensit sonore de chaque canal est mesure de manire indpendante et les valeurs sont
additionnes pour donner lintensit sonore rsultante. Outre la courbe de pondration RLB,
reprsente la figure A.2, un prfiltre est ajout pour tenir compte des effets de la tte humaine.
La rponse en frquence de ce prfiltre est reprsente la figure A.3.
-5
Relative Level, dB
-10
-15
-20
-25
-30 1 2 3 4
10 10 10 10
Frequency, Hz
49
ATSC A/85:2011 PR en matire dintensit sonore, annexe B 26 juin 2011
Figure A.3 Rponse du prfiltre utilis pour tenir compte des effets
acoustiques de la tte
50
ATSC A/85:2011 PR en matire dintensit sonore, annexe B 26 juin 2011
2D Graph 1
20
1st dataset
15 2nd dataset
3rd dataset
Objective Loudness, dB
10
-5
-10
-15
-15 -10 -5 0 5 10 15 20
Subjective Loudness, dB
3. CRTE VRAIE
Les systmes audio numriques ont considrablement simplifi la manipulation et la distribution
des signaux audio. La mesure de la crte de ces signaux prend gnralement la forme dune
reprsentation de la valeur absolue maximale dun chantillon sur une priode de mesure donne.
Cet accent mis sur les valeurs dchantillons de crte a favoris labsence dintrt pour la forme
donde continue sous-jacente. Cette omission peut conduire des surcharges audio
imprvues, des indications de crte contradictoires et dautres problmes dissimuls. Les
mesures de niveau de crte vrai donnent une description plus prcise du signal audio, qui peut
tre utile pour prvenir ces problmes.
La figure A.5 reprsente la possibilit dindications imprcises quand on utilise des crtes-
mtres dchantillons types. Dans ce diagramme, le niveau maximum de la forme donde
continue dpasse la valeur dchantillon maximale. Cette sous-indication du niveau audio est
faible en basses frquences, mais peut tre importante dans les frquences plus hautes ou pour les
signaux contenant des transitoires abrupts. Des incohrences dans les indications de crte
dchantillons peuvent se produire lorsque les chantillons ne tombent pas aux mmes endroits
dans le signal audio. Dans le diagramme, un lger dcalage de phase dans le signal audio peut
produire des indications de crte dchantillon diffrentes.
51
ATSC A/85:2011 PR en matire dintensit sonore, annexe B 26 juin 2011
Temps
Facultatif
- ou -
Facultatif
Les signaux entrants sont surchantillonns 192 kHz pour obtenir une reprsentation plus
prcise du signal audio. Cela signifie un quadruple surchantillonnage pour les signaux
chantillonns 48 kHz. tant donn que la possibilit dune sous-lecture des niveaux de crte
dchantillon est plus leve dans les hautes frquences, un filtre de praccentuation facultatif
peut tre ajout pour tenir compte de leffet que produisent sur les hautes frquences du signal
audio les filtres de protection contre le repliement de spectre que lon retrouve frquemment dans
lquipement, dans toute la chane de radiodiffusion.
Les signaux audio comportant une composante DC peuvent avoir une incidence sur les
niveaux de crte, les levant ou les abaissant suivant la nature du signal. Un deuxime lment
facultatif de lalgorithme de mesure de crte vraie supprime la composante DC, permettant
loprateur dvaluer les niveaux tels qu'ils seraient dans un dispositif qui bloque la composante
DC.
52
ATSC A/85:2011 PR en matire dintensit sonore, annexe B 26 juin 2011
Annexe B :
Acoustique de salle et disposition des haut-parleurs
Contrler les modes propres en basse frquence des salles en utilisant des dimensions
irrgulires et des matriaux dabsorption de basse frquence efficaces
Chaque salle a son mode propre de rsonance , dtermin par la gomtrie, qui entrane la
rsonance du son certaines frquences. liminer le paralllisme des murs nlimine pas ce
phnomne. Dans les petites pices utilises pour le contrle, la frquence de rsonnance la plus
basse se situe dans la gamme audible et les crtes de rsonance sont trs cartes. Si le
phnomne nest pas contrl, il produit des anomalies importantes dans la rponse en
frquence, qui varie de canal en canal, quelle que soit la qualit des haut-parleurs. Lgalisation
seule nest pas trs utile pour rsoudre ce problme, car les crtes de rsonance sont trs troites.
Dans ces conditions, le mixage est difficile, chaque note dun mlange musical pouvant ressortir
et tre beaucoup trop forte, alors que les notes adjacentes ne le sont pas.
Dans les salles contenant peu de gros objets, choisir les trois dimensions ingales en vitant
les rapports simples entre les dimensions dau moins 5 pour cent. Toujours prvoir labsorption
des basses frquences pour amortir la rponse de la salle dans les frquences de rsonance. Les
basses frquences ne peuvent tre absorbes que par des matriaux de qualit suprieure dau
moins 2 po dpaisseur ou par un revtement de 2 po couvrant un creux dair plus profond. La
pose de tapis sur les murs ou les planchers ne donne pratiquement rien. Les plafonds suspendus
raliss au moyen de carreau absorbant haute performance revtement intrieur de matriau
absorbant de 4 po dpaisseur peuvent absorber efficacement les basses frquences pour amortir
le mode propre de rsonnance de la salle dans un plan. Labsorption de coins profonds, soit
langle mur-mur ou mur-plafond, peut aussi tre efficace.
Dans une salle o la rverbration est excessive, il est difficile dentendre le dtail dun mixage.
De plus, leffet doscillations parasites, o une srie de frquences moyennes hautes rsonnent,
se produit si deux surfaces dures sont parallles, particulirement si les autres surfaces de la salle
sont absorbantes.
Pour rduire les deux effets, rpartir alatoirement sur les murs et les plafonds des matriaux
dabsorption de qualit suprieure de 2 po dpaisseur, de manire liminer les surfaces
parallles o deux zones opposes sont rflchissantes. Rduire au minimum lutilisation de tapis
muraux et dautres matriaux absorbants minces, qui ne sont utiles qu trs haute frquence. Sil
est impossible de rendre les surfaces absorbantes, dans le cas des fentres, par exemple,
53
ATSC A/85:2011 PR en matire dintensit sonore, annexe B 26 juin 2011
linclinaison de la vitre intrieure peut liminer le paralllisme des surfaces. Les lments
diffusifs sont aussi utiles pour produire un espace ayant une rverbration raisonnable, mais
contrle.
Une surface dure plane situe derrire la position de mixage cre un effet de filtre-peigne
provenant des haut-parleurs de contrle principaux. La nature du filtre-peigne change en
frquence avec le dplacement du technicien de mixage vers lavant ou larrire de la salle. Un
effet analogue, frquences plus hautes, se produit lorsque le son direct du haut-parleur est
rflchi sur une grande face de pupitre. Leffet sur le technicien de mixage peut dissimuler les
problmes rels de filtre-peigne dans le mixage.
Les rflexions discrtes sur le mur arrire devraient tre limines par la pose dune
combinaison de matriau dabsorption et de diffusion sur cette surface. Songer placer les haut-
parleurs de manire empcher les rflexions contre la face du pupitre datteindre les oreilles du
technicien de mixage.
Un haut-parleur rponse parfaitement uniforme soumis une mesure anchoque peut avoir un
son trs diffrent dans la gamme basse-mdiane dans des installations, suivant sa position dans la
salle, en raison du renforcement et de la suppression entrans par les rflexions provenant de
surfaces rflchissantes adjacentes proximit du haut-parleur.
On peut attnuer cet effet en vitant de placer les haut-parleurs gale distance de deux
murs, en loignant les haut-parleurs des surfaces rflchissantes ou en posant un matriau
absorbant les frquences moyennes sur les murs adjacents. tant donn que les effets sont plutt
larges, lgalisation peut tre trs utile pour uniformiser la rponse.
Choisir des haut-parleurs ayant une rponse uniforme et une large dispersion acoustique
La mesure ci-dessus ne peut corriger la situation lorsque les haut-parleurs ont une rponse en
frquence irrgulire ou si la rponse varie normment suivant langle dcoute. On ne peut
compter sur de tels haut-parleurs pour reprsenter la balance des frquences du mixage final.
Choisir des haut-parleurs qui ont un son uniforme quand on se dplace de la position centrale
dcoute dans laxe du haut-parleur jusquau bord de la zone dcoute. Rechercher la preuve que
la rponse en frquence des haut-parleurs est uniforme sur toute la gamme audio. Songer
utiliser un caisson dextrmes graves pour tendre la rponse en basse frquence.
Pour obtenir de plus amples renseignements, consulter les documents de rfrence Audio
Monitoring in Contemporary Post-Production Environments [16] et Surround Sound: Up and
Running [17].
54
:Annexe C
Correction acoustique
La correction acoustique des salles est ncessaire dans les environnements de contrle pour
sattaquer de nombreux problmes survenant en raison de linteraction du son produit par les
haut-parleurs et de la salle. Les effets ngatifs de lacoustique dune petite salle produisent
plusieurs phnomnes secondaires audibles, dont la distorsion dimagerie due aux rflexions non
voulues et aux anomalies de rponse en frquence, qui sont particulirement graves dans les
basses frquences.
Traditionnellement, lgalisation des salles tait excute au moyen de systmes analyseurs/
galiseurs ayant recours la mesure dun bruit rose au moyen dun microphone et dgaliseurs
paramtriques ou graphiques. Ces systmes prsentent de srieuses limites, pour les raisons
suivantes :
1) Une seule mesure dans une salle ne peut fournir suffisamment de renseignements sur les
performances basse frquence dans la zone dcoute.
2) Le bruit rose ne peut servir mesurer que la rponse en amplitude et ne fournit aucune
information sur la rponse dans le temps.
3) Les galiseurs paramtriques ou graphiques nont pas assez de rsolution, mme avec
30 bandes de frquences.
4) Les filtres IIR utiliss dans ces galiseurs peuvent souffrir danomalies de phases,
particulirement lorsquils deviennent plus troits.
Pour tre efficace, la correction acoustique des salles doit :
Saisir des donnes du domaine temporel pour pouvoir bien prendre en compte les effets
de la rflexion.
Saisir des donnes du domaine frquentiel avec une rsolution suffisamment leve dans
les basses frquences pour sattaquer aux problmes types des petits locaux.
Combiner plusieurs mesures prises dans la zone dcoute pour tenir compte des variations
de basse frquence entranes par les ondes stationnaires.
Rduire la rverbration dans les basses frquences (modal ringing).
Les exigences relatives la correction acoustique efficace des salles peuvent tre remplies
par lutilisation de filtres FIR dans la solution dgalisation. Toutefois, les approches FIR
classiques standard ne suffisent pas. Des mthodes comprenant la pondration frquentielle sont
typiquement employes dans la conception des filtres FIR pour distribuer la puissance des filtres
de faon non linaire avec les frquences, permettant dobtenir davantage de puissance de
correction aux basses frquences. De plus, la moyenne spatiale de plusieurs mesures ne suffit pas
non plus. La distribution des problmes acoustiques dans lespace nest pas uniforme et certains
lieux prsentent des problmes plus graves que dautres. Il faut donc aussi employer une
mthode de pondration spatiale non-linaire quand on combine les mesures.
ATSC A/85:2011 PR en matire dintensit sonore, annexe D 26 juin 2011
56
: Annexe E
Plage dintensit sonore
La zone de confort est la plage dintensit sonore dans laquelle un auditeur accepte les
changements de sonie lintrieur dlments de contenu et entre des lments. Une exprience
subjective a t conduite pour tablir cette plage ainsi que les autres points de tolrance la
sonie . Les rsultats de lexprience sont indiqus dans la figure E1.
Lexprience reproduisait les passages entre les contenus de longue dure et de courte dure
dune mme chane et dune chane une autre. Les auditeurs taient placs dans une situation
dcoute ou de visionnement type et ils taient invits passer dun chantillon de contenu un
autre, de longue et de courte dure. On leur avait prsent cinq paires dlments monophoniques
ATSC A/85:2011 PR en matire dintensit sonore, annexe E 26 juin 2011
composes dun lment de rfrence et dun lment dessai reproduits par un seul haut-parleur
situ devant eux.
Les auditeurs devaient rgler le niveau de lecture gnral jusqu ce que llment de
rfrence soit reproduit au niveau sonore quils considrent comme un volume confortable , le
point zro sur le schma. Lexprimentateur leur aura demand ensuite de rgler la commande de
volume dessai (le terme volume est plus familier quintensit sonore pour la plupart des
auditeurs) sur lun des six niveaux reprsents sur le schma. Les auditeurs pouvaient couter les
lments dessai et de rfrence tour de rle volont. Une fois quils avaient dcid du niveau
o se trouvait la diffrence dintensit sonore demande, le dcalage tait enregistr. Les
questions taient poses de faon alatoire et lordre de prsentation des paires dlments de
rfrence et dessai tait aussi alatoire dun auditeur lautre. Les lments de rfrence et
dessai provenaient dune autre exprience qui fournissait une sonothque de contenus de sonie
constante.
tant donn que les lments de rfrence et de test taient rputs dgale intensit sonore,
le dcalage de gain que les auditeurs ont appliqu llment de test en rponse aux questions de
lexprimentateur constitue une mesure directe de la zone de confort des auditeurs et des autres
seuils dintensit sonore critiques tudis.
Il est intressant de noter quune augmentation de gain de deux ou trois dB dans le niveau
sonore suffit faire passer la sonie dun programme type de la zone de confort de lauditeur vers
le point o il aimerait baisser le volume. Il y a plus dcart du ct bas du point de volume
confortable (reprsent par 0 ici).
Le niveau de bruit ambiant dans la salle dcoute o ont eu lieu les essais tait assez faible;
analogue celui du salon dune maison situe en campagne, par une soire tranquille. tant
donn que lon peut raisonnablement croire que le point trop faible, contrariant se situe
quelque part au-dessus du niveau de bruit ambiant de lenvironnement dcoute, le chiffre de
19,1 dB est probablement troitement fonction du niveau du bruit ambiant. Les autres points sont
suffisamment carts du niveau ambiant pour que leur rpartition relative ne soit pas touche.
58
ATSC A/85:2011 PR en matire dintensit sonore, annexe F 26 juin 2011
Annexe F
Dtails sur le contrle de gamme dynamique AC-3
59
ATSC A/85:2011 PR en matire dintensit sonore, annexe F 26 juin 2011
Quand des dcodeurs sont utiliss, deux modes principaux sont ncessaires. Le premier,
reprsent la figure F2, constitue une source de signaux de niveau ligne servant fournir les
signaux audio destins aux cinmas-maison et autres applications haute fidlit. Dans ce cas,
seule une lgre compression est ncessaire, voire aucune.
Le deuxime mode (figure F.3) est utilis pour alimenter un modulateur RF. Dans ce cas, le
programme doit subir une rduction par mixage et lintensit sonore doit tre accentue pour
assurer une correspondance raisonnable avec les autres signaux analogiques hertziens utiliss par
le tlviseur. Le systme doit aussi rduire davantage la gamme dynamique que dans le cas
prcdent, en raison du niveau de signal programme amplifi, pour la faire correspondre la
gamme dynamique rduite des missions de tlvision existantes typiques, et possiblement en
raison des conditions dcoute.
60
ATSC A/85:2011 PR en matire dintensit sonore, annexe F 26 juin 2011
F.2 PLACEMENT DES MTADONNES DANS LES FLUX BINAIRES DRC AC-3
Le systme AC-3 fournit des instructions de gain pour les deux types de rduction de dynamique
ainsi quune fonction de limitation au cas o laugmentation de niveau inhrente au mixage
rducteur serait suffisante pour produire lcrtage.
Les mots de gain du mode dit de ligne reprsent la figure F.2 sont appels mots dynrng .
Ceux qui sont destins au mode dit RF reprsent la figure F.3 sont appels mots compr .
Le flux binaire AC-3 transporte les deux types de mots de gain, dynrng et compr (comme
lindique la figure F.4) ainsi que les mots de gain de limitation, au besoin. Les dcodeurs AC-3
peuvent appliquer le contrle de dynamique RF ou de ligne, suivant la prfrence de lauditeur
(bien que certains fabricants dquipement grand public limitent les options dans certains
appareils).
Figure F.4 Placement des mtadonnes de DRC AC-3 dans le flux binaire
SI SI
BSI BSI
dialnorm dialnorm
compr compr
Aux Aux.
CRC CRC
Sync Frame (32 ms) Synchro trame (32 ms)
dynrng values carried in each of the 6 Audio Blocks Valeurs dynrng transportes dans chacun des 6 blocs
audio (AB)
Tous les mots de contrle de gamme dynamique, y compris les instructions de limite de gain,
sont gnrs dans lencodeur AC-3, envoys au dcodeur AC-3 et appliqus dans le dcodeur
AC-3. Les donnes transmises comprennent les donnes dialnorm, qui sont utilises pour
61
ATSC A/85:2011 PR en matire dintensit sonore, annexe F 26 juin 2011
normaliser lintensit sonore du dialogue ou point dancrage de chaque programme dans son
ensemble.
Les mots de gain dialnorm et compr sont envoys au dcodeur intervalles de 32 ms, tandis que
les mots de gain dynrng sont transports six fois ce rythme, c.--d. environ toutes les 5,3 ms.
Figure F.5 Calculs de mots de gain AC-3 par lencodeur (partie 1).
62
ATSC A/85:2011 PR en matire dintensit sonore, annexe F 26 juin 2011
63
ATSC A/85:2011 PR en matire dintensit sonore, annexe F 26 juin 2011
Pour les mots de gain dynrng, lintensit sonore est calcule pour chaque sous-ensemble de
256 chantillons (les blocs audio reprsentent 512 chantillons 5,3 ms daudio, mais en
raison de la structure de blocs de chevauchement-addition , lintensit sonore de chaque bloc
est reprsente par la moyenne de deux mesures de 256 chantillons). Les valeurs dintensit
sonore sont donc produites intervalles de ~5,3 ms.
Lintensit sonore de chaque canal est calcule individuellement, puis les rsultats sont
additionns pour obtenir lintensit sonore globale du programme. La courbe de pondration de
lintensit sonore est reprsente la figure F.8.
Le calcul du niveau de crte doit tenir compte des coefficients de rduction par mixage du
canal du centre et des canaux dambiance (cmixlev et surmixlev) slectionns (idalement) durant le
processus de production. La sortie du calcul est le niveau de crte maximum du pire cas de
rduction par mixage.
Les valeurs dintensit sonore et de crte sont normalises au moyen de la valeur dialnorm de
programme avant dtre passes aux tages de calcul suivants.
Les donnes dintensit sonore et de niveau de crte utilises pour les calculs de mots de gain
compr reprsentent ces valeurs sur toute ltendu dune synchro trame AC-3 (32 ms).
Le dcodeur audio comprend une fonction de chevauchement-addition, ce qui permet
dappliquer les mots de gain compr en douceur mme lorsquils sont synchroniss abruptement.
La partie DRC du systme AC-3 doit traiter des contenus de programme de tous genres, cest
pourquoi elle comprend une mthode dajustement des constantes de temps dattaque et de chute
dtermines automatiquement suivant le contenu du programme.
Les donnes audio aprs normalisation de lintensit sonore sont mises en correspondance
dans le profil DRC slectionn pour gnrer une valeur de gain statique. Elles sont aussi utilises
pour slectionner lune des quatre constantes de temps, selon que lintensit sonore dentre est
plus leve (attaque) ou plus basse (chute) que lintensit sonore ajuste, et de combien.
Si lintensit sonore dentre est plus leve que lintensit sonore ajuste et que la diffrence
est plus grande que le seuil dattaque, alors la constante de temps choisie est lattaque rapide
(fast attack). Il sagit gnralement dune constante de temps trs rapide, conu pour assurer la
convergence rapide du compresseur pour les vnements trs forts.
Si lintensit sonore dentre est plus leve que lintensit sonore ajuste, mais dune valeur
ne dpassant pas le seuil dattaque, alors la constante de temps choisie est lattaque lente (slow
attack). Il sagit gnralement dune constante de temps modrment rapide, conue pour fournir
une convergence assez rapide du contrleur de dynamique pour les vnements modrment
forts.
Si lintensit sonore dentre est plus basse que lintensit sonore ajuste, mais dune valeur
ne dpassant pas le seuil de chute, alors la constante de temps choisie est la chute lente (slow
decay). Il sagit gnralement dune constante de temps trs lente, conue pour fournir un
relchement lent et donc inaudible du compresseur durant les passages calmes.
Si lintensit sonore dentre est plus basse que lintensit sonore ajuste et que la diffrence
est plus grande que le seuil de chute, alors la constante de temps choisie est la chute rapide (fast
decay). Il sagit gnralement dune constante de temps modre, conue pour fournir un
relchement rapide la fin dvnements trs forts.
Lautre principale partie du processus de gnration des donnes DRC est la fonction de
limitation de crte. Le niveau de saturation est connu (0 dB FS), ainsi la diffrence entre ce
niveau et le niveau de crte normalis du programme est le gain maximum admissible avant
64
ATSC A/85:2011 PR en matire dintensit sonore, annexe F 26 juin 2011
lcrtage. Si les mots de gain statique appellent davantage de gain, le bloc dadoucissement et
de limite restreint les mots de gain statique au gain maximum admissible. La constante de temps
qui vient dtre calcule fait en sorte que les changements de gain ne seront pas suffisamment
abrupts pour produire des phnomnes parasites dsagrables et quils sont appropris pour le
contenu du programme.
Il est noter que deux processus sexcutent en parallle : lun au dbit des blocs audio
(~5,3 ms) et gnrant les mots de gain dynrng et lautre au dbit de la synchro trame (32 ms),
gnrant les mots de gain compr.
Gain smoothing by the overlap & add process Adoucissement du gain par processus de
chevauchement-addition
Cross fades between audio blocks Enchans entre les blocs audio
Il sagit dune trs simple reprsentation de la faon dont les transitions de chevauchement-
addition entre les blocs audio se produisent et de leffet quelles ont sur les pas de gain
(quantifi en pas de 0,2 dB pour dynrng et en pas de 0,4 dB pour compr) appliqus par le systme de
contrle de gamme dynamique.
La forme triangulaire prsente la figure F.7 est une approximation (pour faciliter le dessin)
de la fonction de fentrage relle applique aux donnes.
Les mots dynrng sappliquent un groupe entier de 512 chantillons, mais chacun de ses
groupes chevauche de moiti le groupe adjacent, de sorte que leffet produit lorsque les valeurs
des chantillons sont additionnes est un enchan entre les groupes, qui adoucit les pas de gain
qui les sparent.
Les mots compr sappliquent une trame de synchronisation entire, mais les trames de
synchronisation sont aussi soumises au processus de chevauchement-addition, ce qui a pour effet
dadoucir aussi les pas de gain compr.
65
ATSC A/85:2011 PR en matire dintensit sonore, annexe F 26 juin 2011
Lintensit sonore totale dune source multicanal est calcule comme la somme des niveaux
de puissance des valeurs quadratiques moyennes pondres de chaque canal. La pondration et
laddition des valeurs dintensit sonore sont des calculs antrieurs aux mesures dintensit
sonore de lUIT, qui peuvent tre considres comme un perfectionnement de cette mthode.
66
ATSC A/85:2011 PR en matire dintensit sonore, annexe F 26 juin 2011
Les zones linaires (sans correction) des profils Film standard et Speech ne sont pas
symtriques autour de la valeur dialnorm, parce que dans les contenus de programmes types et
avec le degr de rduction de gamme dynamique voulu, lattaque de zone damplification
relativement rapide conjugue avec un temps de chute plus lent a tendance laisser le
programme dans la zone linaire asymtrique (voir figure F.9).
67
ATSC A/85:2011 PR en matire dintensit sonore, annexe F 26 juin 2011
Menu principal Setup -> Audio Service -> Channel Mode -> Choisir une des options 1/0, 2/0,
3/2, etc.
Menu principal Setup -> Audio Service -> Dialog Level -> Rgler sur -1 dB to -31 dB.
Menu principal Setup -> BSI Parameters -> Center Downmix level -> Choisir une des
options -3.0 dB, -4.5 dB, -6.0 dB.
Menu principal Setup -> BSI Parameters -> Surround Downmix level -> Choisir une des
options -3.0 dB, -4.5 dB, -6.0 dB.
Menu principal Setup -> Dynamic Range -> Line Mode -> Choisir une des options :
Speech, Music Light, Music Standard, Film Light, Film Standard, Disabled.
Menu principal Setup -> Dynamic Range -> RF Mode -> Choisir une des options :
Speech, Music Light, Music Standard, Film Light, Film Standard, Disabled.
68
ATSC A/85:2011 PR en matire dintensit sonore, annexe G 26 juin 2011
Description
LFE Channel (Canal LFE) Indique si le canal LFE est prsent. Disponible seulement dans les modes
de canaux 3/2, 3/1, 3/0, 2/2 et 2/1.
(Profil DRC de mode ligne) Indique la configuration de compression de DRC prdfinie
pour le dcodage du mode ligne.
DRC RF Mode Profile (Profil DRC de mode RF) Indique la configuration de compression de DRC prdfinie
pour le dcodage du mode RF.
Dolby Surround Mode (Mode Dolby Surround) Indique si le flux binaire cod deux canaux contient un
programme Dolby Surround (Lt/Rt) et doit tre dcod en Dolby Pro Logic.
(Mode Dolby Surround EX) Indique si laudio est encod en tant que flux Dolby
Surround EX et ncessite le dcodage Surround EX.
Preferred Stereo (Rduction stro prfre) Indique la rduction par mixage prfre : Lt/Rt (cod Pro
Downmix* Logic) ou Lo/Ro (stro seulement).
Center Downmix Level (Niveau de rduction centre) Indique le niveau de rduction visant le canal C lorsque
lutilisateur final na pas de haut-parleur central.
Lt/Rt C Downmix Level* (Niveau de rduction C Lt/Rt) Lorsque la rduction stro est Lt/Rt, indique le niveau de
rduction visant le canal C lorsque lutilisateur final na pas de haut-parleur central.
Lo/Ro C Downmix Level* (Niveau de rduction C Lo/Ro) Lorsque la rduction stro est Lo/Ro, indique le niveau
de rduction visant le canal C lorsque lutilisateur final na pas de haut-parleur central
Surround Downmix Level (Niveau de rduction ambiance) Indique le niveau de rduction visant les canaux
dambiance lorsque lutilisateur final na pas de haut-parleurs dambiance. Il est noter
que le rglage 0 (-999 dB) limine les canaux dambiance.
Lt/Rt S Downmix Level* (Niveau de rduction ambiance Lt/Rt) Lorsque la rduction stro est Lt/Rt, indique le
niveau de rduction visant les canaux dambiance lorsque lutilisateur final na pas de
haut-parleurs dambiance.
Lo/Ro S Downmix Level* (Niveau de rduction ambiance Lo/Ro) Lorsque la rduction stro est Lo/Ro, indique le
niveau de rduction visant les canaux dambiance lorsque lutilisateur final na pas de
haut-parleurs dambiance.
69
ATSC A/85:2011 PR en matire dintensit sonore, annexe G 26 juin 2011
70
ATSC A/85:2011 PR en matire dintensit sonore, annexe G 26 juin 2011
71
ATSC A/85:2011 PR en matire dintensit sonore, annexe H 26 juin 2011
Cet aide-mmoire est fond sur lutilisation dun systme de mtadonnes statiques 8 (voir la
section Error: Reference source not found de la PR).
Point retenir : Rgler le paramtre dialnorm de lencodeur AC-3 de la station pour quil
corresponde lintensit sonore du niveau de dialogue moyen du contenu.
Point retenir : Mesurer lintensit sonore du contenu longue dure dans les passages
o il y a des dialogues. Il sagit de la valeur du Niveau de dialogue du contenu. Le
Niveau de dialogue (en units LKFS) devrait correspondre la valeur dialnorm de
lencodeur AC-3.
Point retenir : Mesurer lintensit sonore de tous les canaux audio 10 et de tous les
lments intgrs de la piste sonore, sur toute la dure du contenu de courte dure. La
8
Les mtadonnes dynamiques constituent une solution de rechange au
systme de mtadonnes statiques (fixes). Consulter la section 7.5 pour
obtenir plus de dtails sur lutilisation des mtadonnes dynamiques.
10
Le LFE nest pas compris.
72
ATSC A/85:2011 PR en matire dintensit sonore, annexe H 26 juin 2011
73
ATSC A/85:2011 PR en matire dintensit sonore, annexe H 26 juin 2011
Point retenir : Rgler la valeur dialnorm de lencodeur AC-3 sur le Niveau de dialogue
indiqu par le crateur mdia (avec ajustement).
74
ATSC A/85:2011 PR en matire dintensit sonore, annexe H 26 juin 2011
Si le produit du crateur destin au rseau est dcod en bande de base, il faut mesurer
lintensit sonore du flux audio dcod et rgler la valeur dialnorm du r-encodeur AC-3 pour
quelle corresponde lintensit sonore mesure, pour ltape dencodage suivante. Dans ce cas,
soit que loprateur modifie lintensit sonore du contenu du crateur pour quelle corresponde
la valeur cible du systme de loprateur, soit quil utilise la valeur dintensit sonore du contenu
du crateur (mesure) pour rgler la valeur dialnorm de ltape suivante dencodage AC-3. cette
tape de recodage, loprateur doit aussi veiller ce que les autres paramtres de mtadonnes
soient rgls de faon approprie.
Point retenir : On ne devrait pas compter sur le contrle de gamme dynamique AC-3
pour attnuer les variations dintensit sonores se produisant entre les programmes et
les messages publicitaires et au passage dune station une autre.
75
ATSC A/85:2011 PR en matire dintensit sonore, annexe I 26 juin 2011
: Annexe I
Aide-mmoire lintention des mixeurs et des
monteurs son qui crent du contenu
(Messages publicitaires, matriel de promotion et
programmation avec gestion de lintensit sonore des
signaux audio)
Laide-mmoire qui suit doit tre propos dans un petit document distinct.
I.1 INTRODUCTION
Note : Le prsent aide-mmoire est fond sur la Pratique recommande par lATSC A/85:
Techniques dtablissement et de maintien de lintensit sonore pour la tlvision numrique, (la
PR) et le texte complet est reproduit dans lannexe I de la PR.
Cet aide-mmoire rsume les recommandations exposes dans la PR et fournit des conseils
aux mixeurs et aux monteurs son qui crent des contenus audio pour la tlvision numrique. Il
vise un objectif de gestion de lintensit sonore des signaux audio cohrente avec le but
artistique. Le terme contenu englobe messages publicitaires, matriels de promotion et
programmation. Le terme contenu interstitiel sapplique aux messages publicitaires et au
matriel de promotion.
I.2 PORTE
Cet aide-mmoire nest pas destin remplacer la PR complte. Sa porte est limite servir de
guide du type comment faire pour lintention des mixeurs et monteurs son participant
la cration de contenu audio pour la tlvision. Le lecteur est encourag lire la PR pour
dcouvrir les dtails et le contexte de ce guide. En cas de contradiction entre laide-mmoire et la
PR, cette dernire a prsance sur le prsent aide-mmoire11.
I.3 DFINITIONS
BS.1770 Officiellement UIT-R BS.1770 [3]. Cette recommandation dfinit un algorithme qui
permet dobtenir une valeur numrique indiquant la sonie du contenu mesur. Les
sonomtres et les outils de mesure dans lesquels est mis en uvre lalgorithme BS.1770
indiquent lintensit sonore en LKFS .
dB TP Dcibel du niveau de crte vrai par rapport au signal numrique maximum
(suivant UIT-R BS.1770, annexe 2 [3])
11
Cet aide-mmoire est fond sur lutilisation dun systme de mtadonnes statiques
(voir la section de la PR). Les mtadonnes dynamiques constituent une solution de
rechange au systme de mtadonnes statiques (fixes). Consulter la section 7.5 pour
obtenir plus de dtails sur lutilisation des mtadonnes dynamiques.
76
ATSC A/85:2011 PR en matire dintensit sonore, annexe I 26 juin 2011
12
Le terme Niveau de dialogue est fond sur lutilisation rpandue du dialogue
comme ancrage pour le mixage du contenu; historiquement, on a considr le dialogue
comme llment dancrage de la plupart des programmes.
77
ATSC A/85:2011 PR en matire dintensit sonore, annexe I 26 juin 2011
Point retenir : Le but est de configurer lenvironnement dcoute une fois de manire
approprie, puis de veiller toujours couter au niveau dfini, pour la cration de
contenu. Ceci est vrai mme quand on utilise un casque dcoute pour le contrle.
Point retenir : Le niveau de contrle tant dment rgl, toujours mixer en se fiant
son oreille. Utiliser un outil de contrle dintensit sonore BS.1770 pour confirmer ce
que lon entend.
13
Ou lorsquil nexiste pas daccord pralable entre les parties pour ce qui a trait lintensit sonore.
78
ATSC A/85:2011 PR en matire dintensit sonore, annexe I 26 juin 2011
Point retenir : Le paramtre dialnorm de lencodeur AC-3 de la station sera rgl pour
quil corresponde lintensit sonore du Niveau de dialogue moyen du contenu.
Point retenir : Mesurer lintensit sonore de tous les canaux audio 14 et de tous les
lments intgrs de la piste sonore, sur toute la dure du contenu de courte dure.
14
Le canal LFE nest pas compris.
79
ATSC A/85:2011 PR en matire dintensit sonore, annexe J 26 juin 2011
: Annexe J
Exigences relatives ltablissement et au maintien
de lintensit sonore des messages publicitaires la
tlvision numrique
15
Voir la section 7.1 du prsent document.
16
Conformment la recommandation BS.1770, le canal LFE nest pas compris.
17
Voir la section 8.4 du prsent document.
80
ATSC A/85:2011 PR en matire dintensit sonore 26 juin 2011
: Annexe K
Exigences relatives ltablissement et au maintien
de lintensit sonore des messages publicitaires la
tlvision numrique quand on utilise des codecs
non-AC-3
18
Conformment la recommandation BS.1770, le canal LFE nest pas compris.
81
ATSC A/85:2011 PR en matire dintensit sonore 26 juin 2011
82