De stembanden
Spraak is opgebouwd uit klanken die ontstaan ter plaatse van de stembanden (de bron) wanneer lucht ontsnapt. Spraak is opgebouwd uit lage, midden en hoge tonen. Waarbij de belangrijkste frekwenties tussen 500- 3000 Hz zijn gelegen.
Figuur 1: De stembanden
Er zijn stemloze en stemhebbende spraakklanken. Bij stemloze klanken worden bijvoorbeeld plofgeluiden gemaakt door de lippen (bijvoorbeeld een p), ruis tussen tong en verhemelte (een s) of ruis in de keelholte (een h). Klanken zijn stemhebbend wanneer de stembanden in trilling worden gebracht. De stembanden lopen van binnen-voorkant van een kraakbeenring boven aan de luchtpijp naar twee kleine stukjes kraakbeen. Deze beentjes kunnen door verschillende spieren van elkaar af of naar elkaar toe worden bewogen. Door de stembanden dicht bij elkaar te brengen en hier lucht langs te persen vanuit de longen ontstaat een trillend geluid dat als basis dient voor stemhebbende klanken.
De lengte en de weefselmassa van de stembanden en de grootte van de luchtdruk achter de stembanden bepalen met welk tempo de trillingen (stemfrekwentie) elkaar opvolgen. Bij mannen is dit 75-150 per seconde en bij vrouwen tweemaal zoveel (150-250). Het geluid dat het gevolg is, is dus een periodiek signaal met een grondfrekwentie en een serie harmonischen. De toonhoogte-sensatie van dit complexe geluid is gebaseerd op de grondtoon van 100 a 200 Hz; De harmonischen hebben steeds frekwenties die een veelvoud zijn van de grondfrekwentie. Per oktaaf (frekwentieverdubbeling) is er een afname in sterkte van ongeveer 12 dB. Figuur 2 geeft een voorbeeld van de sterkte van de grondtoon en de boventonen.
Figuur 2: Formantenopbouw binnen een mannen- en vrouwenstem.
De articulatoren
Het geheel van sinusvormige luchtdrukvariaties moet het spraakkanaal passeren. Het spraakkanaal is in essentie de keel- en mondholte. De stand van het strottenhoofd, de huig, het verhemelte, de tong, de wangen en de lippen bepalen de vorm van het spraakkanaal.
Elk van de holtes heeft een zekere luchtinhoud en bij een bepaalde frekwentie geraakt de lucht in een heftige trilling, de resonantiefrekwentie. Denk daarbij aan het badkamereffect. Wanneer u zingt of fluit in de buurt van de resonantiefrekwentie zal de lucht in de badkamer mee gaan trillen en u bij uw lied ondersteunen. De badkamer is bereid te helpen zolang u doet wat zij wil. Door de grootte en de vorm van de keel/mond holte te wijzigen kan men de resonantiefrekwenties veranderen en de sterkte van de frekwentiecomponenten aanpassen.
Klinkers
De stembanden zijn bij de totstandkoming van de klinkers de enige geluidsbron; klinkers zijn dus altijd stemhebbend. Echter, de grondtoon van de stembanden speelt nauwelijks een rol. Via resonanties van de keel/mondholte en vooral de stand van de tong worden juist de boventonen sterk benadrukt. Die componenten heten formanten. Het zijn deze formanten die de klinkers coderen. Om goed te kunnen verstaan en klinkers onderling te kunnen onderscheiden moeten bij het horen de eerste twee duidelijk overkomen. De eerste formant ligt altijd onder de 1 kHz en de tweede formant onder de 2 kHz. De stand van de tong bepaalt de ligging van deze formanten.
Qua uitspraak is er geen onderscheid te maken tussen de mannen- en vrouwenstem, een A blijft immers een A. Er is echter wel een verschil aan te geven:
Binnen de mannenstem zijn de formanten beter gedefinieerd (duidelijker aanwezig) omdat er meer frekwentiecomponenten aanwezig zijn. De kwaliteit is daardoor voor de spraakverstaanbaarheid van klinkers beter.
De vrouwenstem heeft als voordeel dat ze grotendeels de hoorbare (voor spraak zo belangrijke) frekwentiegebieden beslaat.
Medeklinkers
De medeklinkers kunnen zowel stemhebbend als stemloos zijn. Door werveling in het spraakkanaal ontstaat ruis. Wanneer een werveling wordt aangebracht binnen een signaal zonder stemgeluid, verkrijgt men een fricatief zoals de f of s. Door hieraan stemgeluid toe te voegen (stemhebbend te maken) ontstaat de v of de z. Het aanbrengen van een belemmering in het spraakkanaal en deze plotseling weer wegnemen geeft een plosief zoals de p of t. Echter door deze weer stemhebbend te maken krijg je een d of b. Duidelijk zal zijn dat er op deze manier geen mooie periodieke signalen ontstaan. De frekwenties van de bouwstenen hebben niet zo'n fraaie relatie met elkaar als bij de klinkers. Wel zijn ze gelijkmatig over het hele hoorbare frekwentiebereik verdeeld.
Een belangrijk verschil ten opzichte van klinkers is dat er meer frekwentoecomkponenten boven 1000 Hz voorkomen. Die componenten bevatten echter minder energie en dus bevat de medeklinkerinformatie minder energie. Helaas echter wordt in ons taalgebruik de meeste informatie door medeklinkers overgebracht. Het missen van klinkers zou minder problemen voor het spraakverstaan opleveren.
Kortom
W zdn wt mtn wnnn mr cht nbgrplk wrdt ht nt
We zouden wat moeten wennen maar echt onbegrijpelijk wordt het niet.
I aa-e-ee-e o-e ie e o-e
Is daarentegen volstrekt niet te volgen.
Klinkers hebben een hoger geluidniveau in dB en hun informatie ligt grotendeels in de lage frekwenties. Medeklinkers hebben een minder hoog geluidniveau en de klanken die informatie doorgeven zijn meer in het hoge frekwentiegebied gelegen.
De verschillen in toonhoogte en intensiteit zijn heel subtiel. Deze verschillen worden door beschadiging in het gehoororgaan minder opgemerkt, klanken gaan meer op elkaar lijken en worden makkelijker verwisseld. Het is echter te eenvoudig de oorzaak van een slechte spraakverstaanbaarheid terug te brengen tot een slecht verstaan van de medeklinkers alleen. Ook andere factoren zoals taalgevoeligheid en snelheid van deductie spelen een rol bij het verstaan van spraak.
Geproduceerd vermogen
Het stemorgaan is klein en levert daarom niet veel geluidvermogen. Bij nadere beschouwing blijkt het weel héél erg weinig te zijn. Een spreker op conversatieniveau levert gemiddeld in de orde van 3 µW [[1]]. Luid schreeuwen levert ongeveer duizend maal zoveel vermogen, maar ook dan "spreken" we nog maar met een paar milliwatt. Het leeuwendeel van dit vermogen wordt geleverd door de longen.
De onderlinge verschillen tussen sprekers zijn enorm. Bij eigen metingen aan 16 proefpersonen is een verschil gemeten van 12 dB tussen de zachtste en de luidste spreker. In akoestisch vermogen is dat dus een factor 16.
Uiteraard zijn alle spieren van het stemapparaat te trainen; zangers, acteurs e.d. doen dat ook. Aan de stembanden zelf is echter weinig te doen. Aangezien de omzetting van het vermogen door de longen naar het akoestisch vermogen een laag rendement heeft, worden acteurs er op getraind om juist dat rendement op te voeren. Verder leert een acteur uiteraard om te articuleren, hetgeen vooral betekent dat alle klinkers en medeklinkers duidelijk te onderscheiden moeten zijn. Dat is bij gewone sprekers lang niet altijd het geval.
[1] Dus 3 microwatt oftewel 3×10-6 watt.
Kopers van geluidversterkers zullen gewend zijn aan vermogens in de orde van 10, 20 of 100 W. Een luidspreker op spraakniveau levert echter precies dezelfde 3 µW. Dat komt in de eerste plaats doordat de volumeknop van de versterker bij spraak niet zo ver wordt open geschroefd. Ten tweede zijn de rendementen van elektrisch versterkervermogen naar een luidspreker meestal maar een paar procent en ten derde zijn die hoge versterkervermogens vooral nodig voor de lage frekwenties die in spraak niet voorkomen. Veel hoge-tonenluidsprekers overlijden als er bij 2000 Hz meer dan 1 W elektrisch vermogen aan wordt toegevoerd.