1. Het frekwentiespectrum, van tijddomein naar frekwentiedomein
Als we in een ruimte in onze handen klappen horen we de nagalm van de ruimte, soms zijn ook (flutter)echo’s hoorbaar. Maar onze oren zijn geen geweldig goede meetinstrumenten zodat de klap-in-de-handen vaak wordt vervangen door een echte meetpuls die zichtbaar wordt gemaakt op papier of op het computerscherm; de combinatie van oren en ogen geeft veel meer informatie. Deze "pulsresponsie" is in de voorgaande webpagina uitgebreid aan de orde geweest.
In muziek komen pulsvormige geluiden zelden voor. Zelfs trommels zijn erop gemaakt om na de eerste tik een uitstervend geluid te laten horen, al benadert een "rimshot" (o.a. op de rand van de trommel) een puls. De nagalm die de zaal produceert is daarom alleen goed te horen in pauzes of na het slotakkoord. Tijdens lopende muziek volgen de tonen elkaar op en horen we telkens slechts het eerste deel van de nagalm, gekarakteriseerd door de early decay time (EDT).
Als in een ruimte continue tonen ten gehore worden gebracht is nagalm helemaal niet hoorbaar. We horen echter wel de "klank" van de ruimte die wordt toegevoegd aan de eigen klank van een muziekinstrument of een zangstem. Het eigenlijke geluid van een muziekinstrument kan het beste worden beluisterd in een dode kamer waar dus alle geluidreflecties van de wanden zijn uitgebannen. De muziekzaal voegt daar reflecties aan toe en vrijwel altijd wordt dat gecombineerde geluid hoger gewaardeerd dan het geluid uit de dode kamer.
Nagalm is een verschijnsel in de tijd, maar bij een continue toon verdwijnt dus de tijdinformatie. Het is dan in de akoestiek gebruikelijk om het signaal weer te geven als functie van de frekwentie. Zo’n grafiek heet een "frekwentiespectrum" of kortweg "spectrum". Interessant is nu dat het spectrum van een zaal is af te leiden uit de pulsresponsie. In jargon heet dat: conversie van het tijddomein (de puls) naar het frekwentiedomein (het spectrum). Dit proces is de kern van deze webpagina B.1.4. Zoals steeds in deze site gaat het dan om de akoestiek van de ruimte. Echter, pas In hoofdstuk 4 van de huidige webpagina wordt daar op ingegaan, want om het proces inzichtelijk te maken wordt in hoofdstuk 3 eerst een kleine verhandeling gegeven met een voorbeeld van twee muziekinstrumenten. De behandeling blijft summier, want aan muziekinstrumenten zou een aparte website kunnen worden gewijd.
2 De geschiedenis van het spectrum
2.1 Het analoge tijdperk
De oude Grieken bestudeerden al de toon van muziekinstrumenten. Vooral aan een enkele snaar is goed te horen wat er met de toon gebeurt als een losklinkende snaar halverwege wordt ingedrukt en nogmaals aangeslagen: de toon gaat een oktaaf omhoog. Pythagoras (rond 500 vóór Christus, inderdaad die van de gelijknamige stelling) ontwikkelde als eerste (?) een systeem van een grondtoon met boventonen ("harmonischen") waarbij de boventonen een veelvoud van de grondtoon zijn. Het leidde tot de Pythagoreïsche stemming van muziekinstrumenten. Maar boventonen zijn ook hoorbaar bij één los trillende snaar. Er ontstaat een spectrum van de grondtoon plus de boventonen. De harmonischen hebben een verschillende sterkte en het is deze verhouding van sterkten die de "klank" van de snaar bepalen. De boventonen zijn, vergeleken met de grondtoon, het minst hoorbaar als de snaar precies in het midden wordt aangeslagen.
Heel veel muziekinstrumenten kunnen dezelfde grondtoon produceren. Zowel op een trompet als op een klarinet kan men een 'A’ van 440 Hz spelen; het zijn de boventonen die ervoor zorgen dat de instrumenten te onderscheiden zijn. Maar er zijn ook instrumenten die geen tonaal karakter hebben, zoals bijvoorbeeld bekkens, die een ruisachtig signaal afgeven waarin geen grond- en boventonen te onderscheiden zijn in klank. Verder hebben veel instrumenten een inklinkverschijnsel. De hamertjes van de piano zorgen voor een niet-tonaal startsignaal, gevolgd door een uitklinkende grondtoon met boventonen.
De wetenschappelijke akoestiek zoals wij die kennen begint in de negentiende eeuw; vanaf die tijd wordt de fysica van de hoorbare klank begrepen. Het duurt echter nog tot de veertiger jaren van de twintigste eeuw voordat spectra handig kunnen worden gemeten. Daartoe worden spectrale filters ontwikkeld, die met behulp van weerstanden, spoelen en condensatoren slechts een deel van alle frekwenties doorlaten. In een "spectrum analyzer" worden die filters gecombineerd om het gehele hoorbare gebied van 20 tot 20 000 Hz te bestrijken. In bijzondere gevallen worden ook frekwenties buiten dit gebied gebruikt.
Het meest gebruikt zijn oktaaffilters of filters die het oktaaf nog eens in drieën delen (tertsfilters in het Nederlands, 1/3rd-octave bands in het Engels), maar eigenlijk zijn die nog te grofmazig om grond- en boventonen van een muziekinstrument in beeld te brengen. Daarom worden filters gemaakt met een steeds smaller frekwentiegebied, maar dat betekent ook dat het aantal filters moet toenemen om het gehele hoorbare spectrum van 20 Hz tot 20 kHz te bestrijken.
De eerste spectrum-analyzers waren voorzien van een draaischakelaar waarmee het desbetreffende frekwentiegebied kon worden gekozen. Door een meter af te lezen en het resultaat op een papiertje te noteren kon op grafiekpapier een spectrum worden getekend. Later werd het stapsgewijze proces geautomatiseerd met een motortje, gekoppeld aan een schrijver. Maar het proces kost altijd enige tijd en het kon dus alleen worden toegepast op een continu signaal. Een bandlus, waarbij het geluidsignaal eerst was opgenomen en telkens opnieuw werd afgespeeld, maakte een overgang van een discontinu naar een continu signaal mogelijk.
In de zestiger jaren van de twintigste eeuw worden elektronisch schakelingen snel kleiner door het gebruik van transistors, waardoor tientallen filters in één apparaat kunnen worden gebouwd. De analoge "real time analyzer" (RTA) doet zijn intrede. Het grote voordeel zit hem vooral in het begrip "real time". Er hoeft niet meer te worden geschakeld tussen de frekwenties; alle frekwenties worden tegelijk verwerkt, zodat ook (niet te snel) variërende signalen in beeld kunnen worden gebracht. Tegenwoordig zijn bij iedere geluidopname de beelden van RTA’s te zien, al gaat het tegenwoordig vrijwel altijd digitaal op het computerscherm.
Getoond wordt een screenshot van één van de voorkeursschermen van de Windows Media Player. Het is een simpel voorbeeld van een Real Time Analyzer. Het zou een handig hulpmiddel kunnen zijn voor simpele akoestische metingen, maar het is in de huidige vorm onbruikbaar. Zowel langs de horizontale als de verticale as ontbreekt nl. een schaalaanduiding. Vergelijking met echte programma’s leert dat het horizontaal waarschijnlijk om een verdeling in tertsen gaat. Maar dat zegt nog weinig als de absolute schaal ontbreekt. Het is ook mogelijk om dit soort beelden, met schalen, op het scherm van een mobiele telefoon zichtbaar te maken. Voor weinig geld zijn apps te koop [[1]]. |
2.2 Digitale signalen
Voordat we ingaan op de ontstaansgeschiedenis van digitale signalen moeten enkele woorden worden gewijd aan het begrip "sample". Het woord komt uit de handel en de statistiek en kan eigenlijk overal voor staan. Het Nederlandse woord voor sample is "monster". Een monster bruine bonen is niets anders dan een handjevol bruine bonen uit een zak van 50 kg. In de hedendaagse muziek wordt met een sample meestal een stukje muziek bedoeld dat uit een langer muziekstuk is geplukt. Maar zo’n muziek-sample bevat altijd een tijdcomponent omdat het een bepaalde tijdduur heeft, bijvoorbeeld van een halve tot een paar seconde. En dat willen we hier nu juist níet, want bij de conversie van een analoog akoestisch tijdsignaal naar "digitale samples" gaat het juist om het verwijderen van de tijdinformatie uit iedere sample. Zo is film (uit de late negentiende eeuw) een voorbeeld waarvan het beeld is opgebouwd uit "samples" in de vorm van losse foto’s. De tijdinformatie in film bestaat dus uit de volgorde van de tijdloze foto’s plus de frekwentie waarmee ze zijn opgenomen. De "bemonsterfrekwentie" van moderne film is 24 Hz, dus 24 beelden per seconde [[2]] [[3]].
De conversie van analoog naar digitaal en andersom is vervolgens ontwikkeld in de telecommunicatie. De Nyquist-frekwentie is bijvoorbeeld genoemd naar Harry Nyquist die zijn theorema vastlegde in 1924. Hij stelde dat de bemonsterfrekwentie minimaal het dubbele moet zijn van de hoogste frekwentie in het signaal. Indien aan die voorwaarde niet wordt voldaan ontstaat "aliasing", waarbij foute frekwenties worden geïntroduceerd. Bij film mag de maximale frekwentie in de scene dus 12 Hz zijn. Daaraan wordt meestal wel voldaan, maar niet altijd: autowielen draaien vaak de verkeerde kant op [[4]].
Essentieel in de akoestiek is dat een akoestisch sample (in tegenstelling tot een muziek-sample) geen tijdinformatie bevat. Het is weinig anders dan één waarde van de geluiddruk op één bepaald moment. Het totale signaal bestaat uit een serie van samples, die in de akoestiek met hoge snelheid achter elkaar worden gezet. Om aan de voorwaarde van Nyquist te voldoen moet de samplefrekwentie minimaal het dubbele zijn van 20 kHz. Bij de introductie van de CD is 44.1 kHz gekozen, tegenwoordig worden bij geluidopnamen meestal frekwenties van 48, 96 of 192 kHz gebruikt. Het gaat in de akoestiek dus om grote informatiestromen bij "ADC" en "DAC" (analoog-digitaal-conversie en andersom), waardoor sampling in de akoestiek veel later in zwang kwam dan in de telecommunicatie. Maar zoals vermeld in "the Data Conversion Handbook" [[5]:
By the end of the 1960s, the key architectures and building blocks were available to allow for modular and ultimately hybrid converters, and significant work was already underway to produce the first monolithic converters which were to appear in the early 1970s.
Toepassing van AD-conversie bij geluidopnamen voor grammofoonplaten vindt men vanaf ca. 1975. De CD is van 1982 en ook grammofoonplaten hebben dus al lang een digitale component. In de begintijd van het digitale tijdperk geschiedde de opslag van de digitale data nog op bandrecorders (de DAT-recorder bijvoorbeeld), maar door de geweldig snelle ontwikkeling van grote en goedkope vaste geheugens gaat die opslag sinds ongeveer 2000 direct naar de computer of op een geheugenkaartje in een draagbaar opnameapparaat.
2.3 Fourieranalyse
De digitale opslag van geluid representeert een signaal in het tijddomein. Om een frekwentiespectrum te laten zien, zoals op een real time analyzer, is een conversiestap nodig. Daartoe wordt gebruik gemaakt van het theorema van Baron Fourier (1768-1830) die stelde dat ieder tijdsignaal kan worden gerepresenteerd via de som van een (groot) aantal sinussen en cosinussen met oplopende frekwentie. Iedere sinus/cosinus heeft een bepaalde sterkte (amplitude) en het is mogelijk om die amplitudes in een grafiek weer te geven als functie van de frekwentie: een typisch voorbeeld dus van een spectrum [[6]]. De techniek werd door Fourier ontwikkeld om warmte-problemen te beschrijven; in die wereld kent men nog steeds de differentiaalvergelijking van Fourier.
Maar de techniek is ook geknipt voor de akoestiek, al is het gebruik weer van veel later datum en ook alweer vanwege de geweldige hoeveelheid rekenwerk die bij akoestische signalen moet worden verzet. Het becijferen van de amplitude vereiste de berekening van een (numerieke) integraal voor iedere frekwentie. Een doorbraak werd bereikt door de "uitvinding" van de "FFT" (fast fourier transform) in 1965. Dat was een manier om met de data in het tijddomein te schuiven naar het frekwentiespectrum via een rekenschema. Maar om er goed mee te kunnen werken waren nog steeds snelle computers en grote geheugens nodig en die ontbraken nog in 1965.
Pas vanaf ca. 1970 komen de eerste digitale RTA’s op de markt, tegenwoordig kan men ze downloaden als app op een mobiele telefoon. De techniek behoort tot één van de belangrijkste standaardtechnieken van de akoestiek. Aan de hand van het voorbeeld uit figuur 1 worden enkele verschijnselen duidelijk gemaakt, maar de techniek zelf komt in deze site niet aan de orde. Daartoe wordt verwezen naar de talloze handboeken.
3. Een voorbeeld: het fourierspectrum van een muziekinstrument
3.1 Continu signaal
De techniek gaat hopelijk wat meer leven als een voorbeeld wordt behandeld. Daartoe worden twee muzieksignalen gegeven van een min of meer continu signaal van een kornet en een cello. Het voorbeeld staat uitgewerkt in figuur 1.
KORNET
|
CELLO
|
In de geluiddodekamer is ca. 30 s muziek opgenomen. Daaruit is (ruim) 1 s geknipt die min of meer constant is. De opnamen komen van de CD "Music for Archimedes" van B&O voor Catt-Acoustic Auralization, 1992. De tekeningen komen uit openclipart.org.
| |
Droge Kornettoon
|
Droge Cellotoon
|
Figuur 1: De verwerking van het tijdsignaal (rijen 1 en 2) tot een frekwentiespectrum (rijen 3 en 4).
Zie tekst voor uitleg.
Op de bovenste rij van figuur 1 zien we een toon geproduceerd door een kornet (links) en een cello (rechts). De toon duurt links 1 .0 s en rechts 1.5 s. De eigenlijke toon (de fijnstructuur) is niet te zien, daarvoor is het beeld te grof. We zien slechts de omhullende van het signaal die de sterkte representeert. De toon van de kornet varieert heel licht in sterkte, bij de cello is de sterktevariatie wat groter. Dat laatste is bewust; veel strijkers gebruiken "vibrato", een bibberende linkerhand om de toon in sterkte en frekwentie te variëren.
In de tweede rij staat een ingezoomd stukje van hetzelfde tijdsignaal waarin de fijnstructuur wel zichtbaar wordt. In het signaal zien we een periodiek verschijnsel: de grondtoon. Bij de kornet komt ongeveer hetzelfde signaal terug na 0.0024 s, de kornettist(e) speelt kennelijk een 'as’ met een officiële frekwentie van 415 Hz. Bij de cellist is het interval tussen twee herhalingen wat groter: 0.0038 s. De cellist(e) speelt een 'C’ (bijna een oktaaf lager dan de kornet) met een frekwentie van 262 Hz.
In de fijnstructuur zijn ook allerlei kleinere rimpels zichtbaar met een hogere frekwentie. Dit zijn de boventonen. Een fouriertransformatie biedt de mogelijkheid om die tonen beter zichtbaar te maken. Dat staat in de derde rij van figuur 1. De grondtonen van 415 Hz (links) en 262 Hz (rechts) zijn zichtbaar en op alle veelvouden van die frekwentie zijn boventonen zichtbaar. Ze hebben een sterkteverhouding die gegeven wordt door de amplitude. De kornet heeft een eerste, tweede en derde boventoon die vrijwel net zo sterk zijn als de grondtoon. Dat instrument klinkt daardoor wat "scherper" dan de cello, waar de grondtoon duidelijk sterker is dan de boventonen en waarvan vooral de eerste boventoon wat zwakker is. Juist deze sterkteverhouding bepaalt de "klank" van het instrument.
Bij een fourieranalyse wordt vrijwel altijd alleen de amplitude van het signaal gegeven zoals op de derde rij. Maar dat is maar een deel van het verhaal, want eigenlijk moet ook de fase van de boventonen worden beschouwd, die is uitgezet op de vierde rij. De fase geeft een tijdvertraging van een boventoon t.o.v. de grondtoon en als die boventoon een fractie eerder of later bij de luisteraar binnen komt verandert de klank.
Het oor is niet erg gevoelig voor faseverschillen. Er zijn wel onderzoeken geweest die de fasehoorbaarheid in continue signalen helemaal ontkenden, maar dat is volgens de huidige opvattingen niet houdbaar. Daar komt bij dat met name de beginfase van een toon (bijvoorbeeld bij een piano) allerminst continu is en faseverschillen spelen hier een zeer hoorbare rol [[7]]. Anderzijds laat men in de praktijk de fase maar al te graag weg. Het is al moeilijk genoeg om de amplitude te interpreteren en extra informatie schept alleen maar extra chaos.
Beide signalen uit figuur 1 hebben een tonaal karakter. Dat hoeft niet. Er zijn in de praktijk continue signalen met een ruisachtig karakter, bijvoorbeeld machinegeluiden. De typische grond- en boventonen ontbreken dan, maar zo’n spectrum kan wel degelijk informatie verschaffen, met name ook als er een mengvorm van ruis en toon voorkomt. Dat gebeurt bijvoorbeeld bij de analyse van een piepende machine.
Bij muziekinstrumenten komen ook ruisachtige signalen voor (bekkens bijvoorbeeld), maar die zijn eigenlijk nooit continu omdat ze uitsterven na aanstoting. Dergelijke discontinue signalen komen in de volgende paragraaf aan de orde.
3.2 De interpretatie van een niet-continu signaal
In de voorgaande paragraaf werden (bijna) continue signalen behandeld. Maar heel veel muziekinstrumenten brengen discontinue geluiden voort. In figuur 2 staat een voorbeeld van een aangeslagen gitaarsnaar. Linksboven is te zien dat de gitaar langzaam uitdooft in de tijd. In de twee andere tijdplaatjes (linker kolom) wordt ingezoomd, eerst op het tonale middendeel tussen 0.18 en 0.21 s, vervolgens op de aanslag. Rechts staan de spectra. Het middendeel toont weer een tonaal karakter met een grondtoon van bijna 800 Hz en de boventonen op 1600 en 2400 Hz, dus op veelvouden van 800 Hz.
De aanslag toont een rommeliger beeld, zowel in de tijd als in het spectrum, maar misschien zijn er gitaarbouwers die er wijs uit kunnen worden. Lastiger is dat het spectrum verandert als een korter/langer tijddeel wordt ingelezen. In het middendeel blijft het tonale deel ongeveer gelijk en dus ook het spectrum, maar in de aanslag is het spectrum afhankelijk van het gekozen tijdvenster; de grondtoon plus de boventonen zijn in het spectrum te zien, maar komen zichtbaar uit het tijddeel tussen 0.0 en 0.08 s [[8]].
| |
Figuur 2: Het geluidbeeld (0.3 s) van een aangeslagen gitaarsnaar (linksboven). De rimpel tussen 0 en 0.05 s is een overblijfsel van een voorafgaande toon. In de figuren links-midden en links-onder is ingezoomd op een deel van de tijdas. Links-midden staat een tonaal middendeel; links-onder het aanslagdeel waarmee het gitaargeluid begint. In de rechter kolom staan de bijbehorende frekwentiespectra.
4. De klank van een (muziek)zaal
4.1 Van pulsresponsie naar spectrum
In de voorgaande webpagina is de responsie behandeld van een zaal voor muziek of spraak op een puls. Het is de ideale manier om de nagalm van een zaal te meten of te berekenen via een computerprogramma. Maar zoals gezegd: bij continue (muziek)signalen hoort men slechts "klank", net zoals bij een muziekinstrument dat een continue toon voortbrengt. Het interessante is nu dat uit een pulsresponsie (een tijdsignaal) een spectrum (als functie van de frekwentie) kan worden berekend met behulp van de eerder genoemde fouriertransformatie. In figuur 3 wordt een voorbeeld gegeven.
Figuur 3: De pulsresponsie van een zaal (links) en het spectrum (rechts) na de overgang van het tijddomein naar het frekwentiedomein met behulp van een fouriertransformatie.
In de linker figuur staat op tijdstip 0, in blauw, een ideale puls. In rood staat de responsie van een zaal op die ideale puls, in dit geval berekend met een computerprogramma. Via een fouriertransformatie zijn de rechter amplitudespectra berekend (de fase is weggelaten). In blauw staat het spectrum van een ideale puls. Die ligt precies op 0 dB voor alle frekwenties [[9]]. In rood staat het spectrum van het rode tijdsignaal uit de linker figuur, zodat hier dus de bijdrage van de zaal aan de klank staat. Bij de gebruikte rekenprogramma’s is er overigens een complicatie: het signaal moet worden beluisterd met een hoofdtelefoon die een eigen spectrum heeft. Het rode signaal (links en rechts) geeft de versterking van de zaal plus hoofdtelefoon. Dat verklaart (mede) de dip bij 1600 Hz en het afvallen van het geluid boven 6 kHz.
4.2 Is de klank van een zaal hoorbaar?
Volgens de wetten van de fourieranalyse is de klank in de zaal gelijk aan de som van de klank van het instrument plus de klank van de zaal. Een spectrum van een droog muzieksignaal, zoals in figuur 1-derde/vierde-rij mag worden opgeteld bij een signaal volgens figuur 3-rechts, onder voorwaarde dat zowel amplitude als fase worden meegerekend. Maar wat horen we daar eigenlijk van?
Droge sinus, blauwe curven
|
Sinus in een zaal rode curven
|
Figuur 4: Een continue toon van 1000 Hz (in blauw) wordt door een zaal gestuurd. De respons van de zaal is in rood getekend. De fijnstructuur van de 1000 Hz toon is weer niet te zien.
Voor figuur 4 is een zuivere sinus van 1000 Hz gebruikt voor de zaal uit figuur 3. De lengte van het signaal is ongeveer 5 s en aan het begin en eind van het signaal wordt een "fade-in" en "fade-uit" toegepast. Het is te zien als het blauwe signaal in de linker figuur. Een zuivere sinus vertoont slechts één lijn in het spectrum op 1 kHz (rechts), maar er vindt altijd wat verbreding plaats, door de eindigheid van het tijdsignaal en de vorm van begin en eind. Het signaal dat door de zaal wordt weergegeven is links en rechts getekend in rood. Aan het begin slingert het signaal een beetje en aan het eind zien we het uitstervend signaal dat als nagalm waarneembaar is. In het gebied tussen 1 en 5 s zien we slechts één effect: het rode signaal is luider. Dat zien we (met wat moeite) ook in het spectrum. Echter, klankverschillen door de zaal zijn niet waarneembaar bij beluistering.
Het klankeffect wordt wel duidelijk in de figuren 5 en 6 waarbij respectievelijk roze ruis en de kornettoon uit figuur 1-links worden gegeven. Er is een zichtbaar en hoorbaar verschil tussen de droge signalen (in blauw) en de rode signalen waar de zaal klank toevoegt aan het signaal.
Droge roze ruis blauwe curven
|
Roze ruis in een zaal rode curven
|
Figuur 5: Herhaling van figuur 4 maar nu met "roze ruis".
Droge kornettoon, blauwe curven
|
Kornettoon in een zaal rode curven
|
Figuur 6: herhaling van figuur 4 maar nu met een min of meer continue toon van de kornet uit figuur 1.
Uit beluistering van de signalen kan worden afgeleid dat de klank van een zaal soms waarneembaar is maar soms ook niet. De puls van figuur 3 is domweg te kort om klank te laten horen maar de galm is wel te horen, de sinus van figuur 4 heeft juist weer een spectrum dat te simpel is. Maar bij de continue muziektonen uit de figuren 5 en 6 komt de klank van de zaal duidelijk naar voren.
4.3 Mono, stereo en nog meer richtingen
Om de klank van een zaal te demonstreren zijn in de voorgaande geluidfragmenten dezelfde signalen toegevoerd aan het linker en rechter oor: een monofonisch signaal dus. De beleving van de zaal neemt toe als we een stereofonisch signaal aanbieden, dus verschillend voor beide oren. Nu wordt niet zozeer de klank beïnvloed als wel de "ruimtelijkheid". De fragmenten laten dat horen.
Roze ruis in zaal MONO
|
Roze ruis in zaal STEREO
|
Kornettoon in zaal MONO
|
Kornettoon in een zaal STEREO
|
Stereo wordt meestal gebruikt als een verfraaiing van de klank van de zaal tijdens een muziekopname. Bij spraak wordt het simpeler om een bron te lokaliseren in een lawaaiige omgeving. Maar het geeft nog geen idee van voor- en achterzijde in een ruimte en dat is bij muziek wel degelijk van belang. Soms worden bij weergave daarom ook dat soort signalen toegevoegd. Het meest bekende systeem is "Dolby 5.1", maar ook dat is een systeem in het platte vlak. Verticale verschillen worden vrijwel altijd verwaarloosd.
Er gaat, kortom, niets boven de richtingsverschillen die een toehoorder hoort in de zaal. Modellen met geluidstralen in de computer kunnen de richting van de stralen vrij simpel bijhouden en als resultaat tekenen op het scherm. Een zwakke plek blijft dat het geluid moet worden beluisterd met een hoofdtelefoon. Om die reden is er research gaande om het eigenlijke beluisteren te verbeteren, vaak aangeduid met "virtuele akoestiek" via series rondom geplaatste luidsprekers. Het onderwerp blijft hier onbehandeld.
4.4 Spectra in frekwentiebanden
De gemiddelde akoesticus kan niet zoveel met de wat rommelige beelden zoals we die zien in figuur 3-rechts. Het is daarom gebruikelijk om de resultaten weer te geven in vaste frekwentiebanden. Daarbij komen allereerst "oktaven" en "tertsen" in aanmerking, maar smallere banden kan ook. Een voorbeeld staat in figuur 7.
Figuur 7: Het spectrum van figuur 3-rechts weergegeven als rode lijnen die telkens een gemiddelde geven over een deel van het spectrum, hier in tertsen. Links is de horizontale as lineair gekozenlangs een lineaire as, dus zoals in figuur 3-rechts. In de rechter figuur is de frekwentie-as logaritmisch gekozen. Het oktaafinterval is meestal de grofste manier van weergeven. Tertsen delen het oktaaf in drieën, maar het oktaaf wordt ook wel in tien of twaalf delen opgeknipt. Het gaat er maar om hoeveel detail men wil zien en kan "lezen".
De FFT, zoals boven uiteengezet, leidt per definitie tot een lineaire frekwentieschaal. Dat is heel handig om de harmonischen te zien in figuur 6-rechts, maar in grote delen van de akoestiek is het gebruikelijker om een logaritmische as te gebruiken (omdat het oor logaritmisch werkt). Ook de toetsen op een piano vormen een logaritmische reeks waarbij ieder oktaaf een verdubbeling geeft van de frekwentie. In figuur 7-links staat de lineaire as, rechts staat de logaritmische as die dus veel duidelijker maakt wat er onder 200 Hz gebeurt. Nadeel is wel dat het aantal fourierlijnen in de lage frekwenties steeds lager wordt, waardoor de nauwkeurigheid afneemt.
5. Het ontwerp van een muziekzaal
5.1 Zijn galm en klank manipuleerbaar?
Deze site richt zich op architecten of, in dit deel, op diegenen die bij het ontwerp van een (muziek)zaal zijn betrokken. Er komen dan een paar vragen naar voren:
1. Kunnen we de nagalm en de klank van een zaal voorspellen en nameten?
2. Zoja, kunnen we de reken- en meetresultaten interpreteren en kunnen we een doel stellen?
3. En zoja, kunnen we de muziekzaal zodanig ontwerpen dat het gewenste doel bereikt wordt.
Antwoord op vraag 1:
Een pulsresponsie als in figuur is gemeten met één mikrofoon en geeft dus een mono-beeld. Het meetsignaal kan worden verfijnd door met twee mikrofoons of met een "kunsthoofd" recht te doen aan onze twee oren. Een kunsthoofd-opname is prachtig om te horen maar faalt in het onderscheid tussen geluid dat van voren of juist van achteren onze oren bereikt [[10]]. Daartoe zijn computermodellen juist weer heel goed in staat.
Via fouriertechnieken is het mogelijk om de galm (als tijdverschijnsel) om te zetten in het spectrum als functie van de frekwentie.
Het antwoord op de vraag is dus "ja, we kunnen de eigenschappen goed in beeld brengen".
Antwoord op vraag 2:
In het spraakgebruik wordt nogal eens gezegd: "de zaal klinkt mooi/helder/scherp/....". In webpagina D.70A worden een stel van dat soort begrippen behandeld, maar het valt op dat nagalmcurven wél vaak worden getoond (zie de voorgaande webpagina), maar dat men zelden of nooit spectra tegenkomt. Ze zijn waarschijnlijk simpelweg te moeilijk om te interpreteren. De auteur van de huidige webpagina is in ieder geval niet in staat om een spectrum als in figuur 3-rechts te "lezen". Dat zegt uiteraard niets, want hij kan bijvoorbeeld ook geen röntgenfoto’s interpreteren. Maar te vrezen valt dat ook andere akoestici er niets mee kunnen, temeer daar eigenlijk amplitude en fase tegelijk moeten worden beoordeeld.
Antwoord op vraag 3:
Het vak is te leren, maar het is onmogelijk om alle details uit figuur 3 op hun plaats te zetten. We komen dus niet veel verder dan het streven naar "mooie" curven, zowel voor de nagalmcurve als het spectrum. Uit de galmcurve kan een nagalmtijd worden afgeleid die kan worden vergeleken met een ideale nagalmtijd voor de zaal die moet worden ontworpen. In het vervolg van de site wordt daarop teruggekomen. Verder kunnen duidelijke defecten in de galmcurve leiden tot de opsporing van echo’s. Evenzo kunnen pieken in het spectrum duiden op "kleuring" omdat een maximum of minimum ontstaat rond een bepaalde frekwentie. Maar daar blijft het dan ook bij.
5.2 Een tussenvorm: de nagalm per frekwentieband
Eigenlijk is een akoesticus steeds op zoek naar de optimale presentatie van reken- en meetuitkomsten. Bij teveel detail ligt verdrinking op de loer, bij te weinig detail zou men akoestische defecten kunnen missen. Een veel gebruikte tussenvorm is om de nagalmcurven vanuit de pulsresponsie op te knippen in aparte frekwentiebanden. In de figuren 8 en 9 wordt een voorbeeld gegeven.
Figuur 8: Een opname in een kerk met een volume van 20 000 m3. Dat is dus een andere ruimte dan de ruimte uit de figuren 3 t/m 7. Links staat de pulsresponsie, rechts het daaruit afgeleide echogram en de schroedercurve. Alle signalen zijn ongefilterd ("breedband").
In figuur 8 wordt een signaal ingelezen. Links staat de pulsresponsie voor een grote ruimte, een kerk met een volume van 20 000 m3, dus ongeveer net zo groot als het Concertgebouw in Amsterdam. Rechts staat de verwerking tot een galmsignaal, in blauw de samengeveegde pulsen (met een RC-tijd van 5 ms) en in rood de eigenlijke nagalmcurve. Voor de leesbaarheid is de verticale as nu in dB’s.
De signalen in figuur 8 zijn ongefilterd. Het biedt extra informatie door ze op te splitsen in oktaafbanden. Dat is in figuur 9 gedaan, eerst voor de schroedercurve, dan voor het echogram.
Uiteraard kan in het echte meetprogramma worden ingezoomd om meer details te zien.
|
De rode curve uit figuur 8-rechts is opgedeeld in oktaven en het is nu mogelijk om de nagalmtijd per oktaaf te berekenen. Die blijkt ca. 7 s voor alle oktaven behalve voor 4 kHz, daar is de nagalm korter doordat de vochtabsorptie een rol speelt bij hoge frekwenties [[11]]. In de figuur staat ook enige informatie over het frekwentiespectrum bij continue signalen. Dat leest men af aan de beginwaarden van de curven. Dan blijkt de onderste groene curve (voor 250 Hz) opvallend veel zwakker dan de andere curven. Ook 500 Hz lijdt er enigszins onder. Een verklaring van dit effect is niet bekend, zodat in de praktijk aanvullend onderzoek voor de hand ligt om de oorzaak van dit defect van de zaal op te sporen.
|
In figuur 8 links zien we een knalharde echo rond 0.2 s. Helaas is die in de schroedercurve zoek geraakt. Het echogram (of histogram, er circuleren verschillende namen) maakt de echo wel zichtbaar en is dus beter bruikbaar voor "echo-hunting".
De rode curve (voor 125 Hz) hobbelt wat meer dan de andere krommen, maar dat is altijd en onvermijdelijk. |
Figuur 9: Het signaal van figuur 8 wordt opgedeeld in oktaafbanden, boven voor de schroedercurve (rode lijn in figuur 8-rechts), onder voor de echogrammen (blauwe lijn in figuur 8-rechts)
Het doel van de metingen in de kerk uit figuur 8 en 9 was om er een multifunctionele zaal van te maken. Kan dat?
De zaal is net zo groot als het Concertgebouw in Amsterdam. Daar is de nagalmtijd 2 s. Dat wordt daar bereikt met veel absorberend publiek (2000 toehoorders) of absorberende stoelen als het publiek niet op komt dagen. Er is dus een groot probleem als er in de kerk met verplaatsbare houten of plastic stoelen zou worden gewerkt vanwege het multifunctionele karakter.
De echo na 0.2 s kan worden teruggerekend naar een sterk reflecterende achterwand. Die zal moeten worden behandeld met absorberende en/of verstrooiende materialen. Maar er zit ook een orgel tegen die wand zodat een oplossing moet worden gezocht.
En waar komt die zwakte bij 250 Hz en (een beetje ) bij 500 Hz vandaan? Is dat alleen op deze mikrofoonpositie? Zoniet, dan heeft de klank in de kerk waarschijnlijk te weinig "warmte". En moeten dan wellicht de stucwanden worden gesloopt omdat die te veel absorberen? Daar zit ook niemand op te wachten.
De figuren geven informatie op één mikrofoonplaats; uiteraard is er een hele serie metingen gedaan op verschillende posities.
Het beeld is gemaakt met een rondom-strooiende luidspreker en rondom-gevoelige mikrofoons. Voor aanvullende kennis kunnen gerichte exemplaren worden gebruikt, maar dan neemt ook de hoeveelheid data verder toe.
Kortom: Er is veel mogelijk voor de hedendaagse architect/akoesticus, maar er zijn nog steeds witte plekken op de kenniskaart en enig geluk bij het ontwerp is welkom. Daarom ook is "fine-tuning" gebruikelijk: er worden proefconcerten gehouden waarna eventuele fouten wellicht nog kunnen worden aangepakt.
[1] Maar een kleine waarschuwing is op zijn plaats. De ingebouwde mikrofoon van een mobieltje is meestal te slecht om het spectrum goed weer te geven. Verder moet de mikrofoon wel degelijk worden geijkt met een echte geluidmeter om de verticale schaal te kunnen vertrouwen.
[2] Het Nederlandse woord "monster" in plaats van het Engelse "sample" is nooit ingeburgerd geraakt. Dat is vreemd, want we spreken in het Nederlands wel van "bemonsteren" en "bemonsterfrekwentie" als de Engelsen spreken over "sampling" en "sampling frequency".
[3] Overigens zien we steeds meer alternatieven ontstaan. Dat komt allereerst door de televisie; die zendt uit op 25 Hz. Speelfims op TV duren ook altijd 4% kortere dan in de bioscoop.
[4] Voor een diepgaande behandeling van aliasing wordt naar de handboeken verwezen.
[5] Walt Kester (ed.), "The Data Conversion Handbook", Newnes, 2005.
Op het net is het eerste hoofdstuk over de geschiedenis te vinden via:
http://www.analog.com/library/analogdialogue/archives/39-06/chapter%201%20data%20converter%20history%20f.pdf
Het boek geeft ook een overzicht van de voorgangers.
[6] Men spreekt wel over een "fourierreeks" indien wordt gerekend met een soort grondfrekwentie plus harmonische boventonen. De "fourierintegraal" rekent maar bij één frekwentie, zodat de frekwenties vrij te kiezen zijn. De integraal kan in sommige speciale gevallen worden opgelost; zie bijvoorbeeld in de webpagina "STI voor gevorderden" in deze website.
Bij gebruik van numerieke technieken wordt een integraal eigenlijk weer een reeks. De "FFT" levert een lineaire reeks frekwenties op, bijvoorbeeld: 0, 5, 10, 15, 20, ..... 10230, 10235 Hz. De spatiëring van de frekwenties wordt bepaald door de lengte van het tijdsignaal. Een stap van 5 Hz komt overeen met 0.2 s tijdsignaal. Een grotere nauwkeurigheid vraagt een langer tijdsignaal, bijvoorbeeld 1 s inlezen voor een stap van 1 Hz. Maar binnen 1 s kunnen sommige signalen te veel variëren, waardoor de nauwkeurigheid juist weer achteruit gaat.
[7] Dat maakt het ook zo vreselijk moeilijk om tonen van een muziekinstrument na te maken. Met behulp van elektronica is met plaatjes van het amplitudespectrum (zoals op de derde rij figuur 1) nog wel een instelling van de grondtoon met harmonischen in te stellen, maar een juiste instelling van de fase is welhaast ondoenlijk. Een elektrische piano kan het continue deel van de toon goed weergeven, maar aan de aanslag onderscheidt men een elektrische piano van een echte. De komst van muziek-samples, waarbij stukjes opgenomen geluid van echte muziekinstrumenten klaar worden gezet in het geheugen heeft overigens de pogingen tot kunstmatig geluid overbodig gemaakt.
[8] De beginner in het vak verwacht wellicht dat men steeds meer in kan zoomen om de aanslag meer in detail te bestuderen. Dat kan maar het gaat ten koste van de nauwkeurigheid. Bij een korter tijdvenster neemt de spatiëring van de frekwenties toe en de nauwkeurigheid in het spectrum neemt daardoor af.
[9] Dit is een veel gebruikte conventie die overigens strijdig is met de formule van Parseval waarbij de energie in het tijddomein gelijk moet zijn aan die in het frekwentiedomein. Maar het gaat hier steeds om vergelijkingen (blauwe lijn versus rode) en dan gaat het goed.
[10] Onze oorschelpen helpen ons daarbij. Het is wonderbaarlijk hoe allerlei kleine looptijdverschillen daarbij een rol spelen en het vereist daarom een langdurig leerproces. Kinderen onder twee jaar kunnen nog geen verschil tussen voor en achter horen. De individuele verschillen tussen oorschelpen zijn zo groot dat ze in een kunsthoofd niet na te bouwen zijn voor een modale luisteraar.
[11] Er wordt een aparte webpagina gewijd aan luchtabsorptie.