Lock, Gerhard (2020): Salienz, Narrativität und die Rolle musikalischer Parameter bei der Analyse musikalischer Spannung von post-tonaler Orchestermusik [Salience, Narrativity and the Role of Musical Parameters in the Analysis of Musical Tension in Post-Tonal Orchestral Music]. ZGMTH 17/2. https://doi.org/10.31751/1074
eingereicht / submitted: 10/08/2020
angenommen / accepted: 11/08/2020
veröffentlicht / first published: 23/12/2020
zuletzt geändert / last updated: 17/01/2021

Salienz, Narrativität und die Rolle musikalischer Parameter bei der Analyse musikalischer Spannung von post-tonaler Orchestermusik

Gerhard Lock

Dieser Artikel diskutiert Ergebnisse einer Studie zu kognitiven Hörstrategien von post-tonaler Orchestermusik (Erkki-Sven Tüür). Im ersten Teil werden musikalische Spannung und temporale Musikanalyse, musikalisches Ereignis und Salienz sowie kognitive Narratologie und narrative Musikanalyse thematisiert. Im zweiten Teil werden das empirische Experiment-Design (Sample N=26) für das vom Autor entwickelte neue kognitive Scheibenmodell COSM (Cognitive Octagonal Slice Model), die Visualisierung und Analyse der COSM-Daten (Data Mining) sowie einige Analyse-Ergebnisse bezüglich eines möglichen Zusammenhangs zwischen Tendenzen musikalischer Parameter und musikalischer Spannung diskutiert. Bezüglich der Rolle primärer und sekundärer Parameter für die Wahrnehmung der musikalischen Spannung ergaben sich bis auf ein paar interessante Ausnahmen in der Mitte des untersuchten Werkes keine klaren Muster. Es konnte auch nicht die vermutete Dominanz sekundärer über primäre Parameter festgestellt werden.

This article introduces results of a study about cognitive listening strategies for post-tonal orchestral music (Erkki-Sven Tüür). The first part deals with musical tension and temporal music analysis, musical event and saliency as well as cognitive narratology and narrative music analysis. The second part discusses the empirical Experiment-Design (Sample N=26) of the author's developed new cognitive model COSM (Cognitive Octagonal Slice Model), the visualisation and analysis of the COSM data (data mining) as well as some analytical results concerning a possible relation between tendencies of musical parameters and musical tension. The role of primary and secondary parameters for the perception of musical tension did not show clear patterns, though some exceptions in the middle of the work still appeared valid. Also, the prognosed dominance of secondary parameters over primary parameters could not be detected.

Schlagworte/Keywords: audiovisual perception; audiovisuelle Wahrnehmung; Cognitive music analysis; Kognitive Musikanalyse; modeling; Modellierung; musical parameters; musical tension; musikalische Parameter; musikalische Spannung; saliency; Salienz

»Ein einzelnes musikalisches Ereignis kann zum Schlachtfeld für konkurrierende Weltsichten, Methodologien und soziale Einstellungen werden.«[1]

Einführung

Dieser Artikel[2] diskutiert Ergebnisse einer Studie zu kognitiven Hörstrategien von post-tonaler Orchestermusik. Durch slider controller (›kontinuierliche‹ Echtzeit-Daten) wird die ›wahrgenommene‹ strukturelle musikalische Spannung empirisch erfasst. COSM ist das Kopfwort des neuen kognitiv-empirischen Modells des Autors[3] und bedeutet ›Kognitives achteckiges Scheibenmodell‹ (Cognitive Octagonal Slice Model). Es stellt Möglichkeiten bereit, Hörstrategien auf Basis der audiovisuellen Salienz[4] von Impulsen und musikalischen Parametern empirisch zu untersuchen. COSM kann in den Bereich der temporalen Musikanalyse[5] eingeordnet werden. Im Zuge der Entwicklung von COSM hat der Autor die theoretische Grundlage sowie zwölf strategische Schritte (in acht Phasen/Stadien) zur Entwicklung einer wissenschaftlichen Modellierung formuliert.[6]

Das Gebiet der Musiktheorie wird in diesem Artikel durch die Analyse der musikalischen Spannung sowie primärer und sekundärer musikalischer Parameter berührt.[7] In der kognitiven Musikanalyse wird überwiegend mit Tonaufnahmen gearbeitet, wobei Untersuchungsgegenstand die kognitiven Reaktionen sind, die durch den Hörprozess in Echtzeit hervorgerufen werden. Die kognitive Musikanalyse kann sozusagen als Ausarbeitung (›Strukturierungsprozess‹) von ›relevanten Kategorien‹ angesehen werden.[8] Hierbei kann man das musikalische Ereignis auch als Stimulus, Signal oder Impuls betrachten. Impulse sind ‒ wie auch der Terminus ›Ereignis‹ (event) ‒ ebenfalls in der Neurophysiologie verwendete Konzepte zum Verständnis des Wahrnehmungsprozesses.[9]

Musiktheorie und Musikpsychologie verbindende interdisziplinäre Perspektiven zeigen auch Adam Ockelfords »zygonische Theorie«[10] sowie Martin Rohrmeier,[11] Letzterer mit seinem als Brückenschlag zwischen musiktheoretischen, kognitiven und computationalen Ansätzen konzipierten Diskussionsansatz.

Ein Beitrag eines internationalen Kongressberichts aus dem Jahr 2016 bestätigt, dass die Forschung weiterhin interessiert daran ist, computergestützte Strukturanalyse anzuwenden, bei welcher man »Musik segmentiert oder zerlegt (dekomponiert) in Muster oder Einheiten, die einige semantische Relevanz besitzen, und des Weiteren diese Einheiten in musikalisch sinnhafte Kategorien gruppiert.«[12]

Als Daten-Analyse wird im weitesten Sinne Data Mining[13] verwendet, welches durch Modellentwicklungen, Gruppierungen und Clusteranalyse interessante Muster und Relationen in großen Datensammlungen entdeckt, unter anderem auch bei Zeitskalen-Daten.[14] Auch bei der Musikanalyse entdeckt man Strukturen und deren Relationen zueinander und untersucht, wie diese sich verändern.[15] Bei beiden stehen Prinzipien der Ähnlichkeit und der Segmentation (u. a. Konturanalysemethoden)[16] im Vordergrund, wobei Segmentation sowohl bei der Daten-Erfassung für musikalische Spannung in zeitgenössischer Musik[17] als auch bei der strukturellen Analyse zur Anwendung kommt (computergestützte Methoden).[18]

Im Folgenden werden einige methodologische Aspekte der Analyse post-tonaler Musik[19] am Beispiel von Orchestermusik des estnischen Komponisten Erkki-Sven Tüür (geb. 1959) erörtert, von dem sich sagen lässt, dass er in Rang und Bedeutung gleich auf den weltbekannten estnischen Komponisten Arvo Pärt (geb. 1935) folgt. Tüürs Musik verbindet avantgardistische Kompositionstechniken (u. a. Dodekaphonie, Atonalität, Oktatonik sowie die von ihm seit 2002/03 entwickelte Intervallvektor-Technik) mit traditionellem Denken (symphonische Form und »Kulminationsdramaturgie«).[20] Da hierbei traditionelle Analysemethoden nicht mehr gänzlich greifen, die Musik jedoch durch universelle Merkmale wie Wellenförmigkeit, Zielgerichtetheit, Kontraste sowie das Verdichten und Auflockern ihrer Struktur bzw. ihres Klangs für eine breitere Hörerschaft intuitiv verständlich ist, ist sie meiner Ansicht nach als Forschungsfeld für die Entwicklung einer neuen kognitiven Methode geradezu prädestiniert.

Methodologisch liegt der Fokus auf kognitiven Hörstrategien, die die Hörenden zumeist intuitiv anwenden. Musikalische Spannung und die Salienz von Impulsen sind hierbei Gesamtphänome, welche holistische Informationsverarbeitung erfordern und Stimuli »als integrales Ganzes« (»Gruppierung auf Grund von globalen Ähnlichkeiten«) betrachten.[21] Die Salienz von musikalischen Parametern erfordert analytische Informationsverarbeitung, Stimuli werden bezüglich ihrer übereinstimmenden Eigenschaften (Bestandteile) verarbeitet.[22] Dies findet im Verlauf des ›aufmerksamen‹ Hörprozesses[23] statt, der als Narrativ interpretiert bzw. mit einer Erzählung verbunden werden kann. Dies wirft die Frage nach der Rolle bzw. dem gegenseitigen Verhältnis von ›Sender‹ (Musik) und ›Empfänger‹ (Hörer) auf – ob Narrative primär durch den Stimulus gegeben oder aber vom Rezipienten konstruiert werden. Die kognitive Musikanalyse befasst sich mit der letzteren Auffassung,[24] und der in diesem Artikel vertretene Forschungsansatz stützt sich auf Daniel Rothbart (2004), demzufolge Narrative wie Modelle »konzeptionelle Konstruktionen sind, die unter der Kontrolle eines Geschichtenerzählers stehen.«[25] Elisa Johanna Känd hat Narrativität in Musikvideos mit Hilfe der musikalischen Spannung (slider controller-Experiment) analysiert.[26]

Mit COSM wurde vom Autor dieses Artikels ein kognitives und seit 2017 empirisch anwendbares Modell entwickelt, bei dem die Teilnehmenden des Experiments nicht nur behavioristische Subjekte, sondern Ko-Analysten und »Geschichtenerzähler« sind,[27] die ihre narrativen Strategien somit nonverbal (nicht in linguistischen Satzstrukturen) und zeitlich unmittelbar wiedergeben können. Dem Autor ist keine mit COSM vergleichbare Analysemethode bekannt, allerdings könnte man diese als eine Art Realisierung der Vorschläge von Wilfried Gruhn zur narrativen Musikanalyse betrachten.[28]

Die Daten dieses Experiments sind sowohl qualitativ (individuell) als auch quantitativ (mathematisch-statistisch) analysierbar. Allerdings sind mathematisch-statistische Korrelationen (hier zwischen den Daten von COSM und der musikalischen Spannung) nicht automatisch Nachweise eines direkt begründbaren Zusammenhangs, da bei realer Musik als Stimulus die musikalischen Parameter miteinander verwoben sind, so dass sich nicht eindeutig feststellen lässt, welche Parameter einander gegenseitig bedingen und welche schließlich auf die musikalische Spannungswahrnehmung einwirken. Darüber hinaus sind die psychophysischen Skalen der Datenerfassung und -analyse arbiträr.[29]

Das Problem, dem sich diese Studie widmet, besteht darin, dass die musikalische Spannung als komplexes Phänomen weder absolut noch direkt gemessen oder analysiert werden kann:

i) Automatische Intensitäts-Analysen von Tonaufnahmen sind an die jeweilige Interpretation[30] sowie an Aufnahme- bzw. Mastering-Techniken gebunden.

ii) Aus der Partitur bzw. aus MIDI-Daten kann nur eine begrenzte Zahl von Parametern herausgelesen werden (sofern diese vorher entsprechend programmiert wurden).

iii) Die Parameter sollten nicht ohne Grund linear kumulativ summiert werden.

Dies hat zur Entwicklung von COSM als audiovisuellem Salienz-Modell geführt.[31] Als Grundlage der Analyse von empirischen Daten wurde der DBSCAN-Algorithmus verwendet (Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise),[32] mit dem sich mit der Cluster-Bildung der größtmögliche Zusammenfall der Reaktionen der Teilnehmenden in einem definierten Zeitfenster (Radius um jeden Impuls 2 Sekunden, mindestens 10 Reaktionspunkte; zur Visualisierung des Prinzips siehe Abbildung 4) ermitteln lässt und somit eine statistische Grundlage für den Vergleich der Teilnehmenden-Daten gegeben ist.

Das Ziel dieser Studie ist, die wahrgenommene strukturelle musikalische Spannung in zeitgenössischer post-tonaler Orchestermusik (auf globaler Ebene, auch als Form, holistisch) zu verstehen mit Hilfe der auditiven Salienz musikalischer Ereignisse bzw. Impulse (auf lokaler Ebene) sowie der audiovisuellen Salienz musikalisch primärer und sekundärer Parameter von zuvor durch die Teilnehmenden bestimmten musikalischen Impulsen (ebenfalls auf lokaler Ebene). Hierbei werden Prinzipien der Kognitionsforschung (kognitive Analyse, Salienz, Spannung) mit musiktheoretischen Konzepten und Termini (musikalische Parameter) über das Phänomen des ›musikalischen Impulses‹ miteinander verbunden.

Die Kernfrage dieses Artikels ist, welche musikalischen Parameter mit welchen Tendenzen der strukturellen Spannungsentwicklung (steigend, unveränderlich, fallend) in der post-tonalen Musik von Tüür statistisch und narrativ in Verbindung gebracht werden können.

Folgende Fragen und Hypothesen werden aufgeworfen:

(1) Sind bei post-tonaler Musik die sekundären Parameter salienter als die primären?[33]

Hypothese 1: Die Veränderung der musikalischen Spannung zeigt zugleich eine Veränderung bei sekundären Parametern und umgekehrt.

(2) Wie lässt sich die Bedeutung der musikalischen Parameter für das Entstehen von struktureller Spannung in post-tonaler Musik narrativ interpretieren?

Hypothese 2: Saliente Veränderungen im Fluss der Musik (musikalische Spannung), die durch slider controller global und lokal sowie mit COSM salienten musikalischen Parametern lokal angezeigt werden, weisen deutliche Regelmäßigkeiten auf.

Hierbei wird der Grad der Regelmäßigkeit als Funktion von Narrativität verstanden: größere Regelmäßigkeit verweist auf klarere Verständlichkeit, somit deutlichere Narrativität. Bei der Datenanalyse (Data Mining) erregen gerade solche Regelmäßigkeiten die Aufmerksamkeit der Analysierenden.

In der Musik selbst ist das Hauptkriterium für Regelmäßigkeit die Wiederholung von musikalischen Elementen (Parametern, Motiven, Formabschnitten) in identischer oder variierter Weise (siehe Prinzipien der paradigmatischen Analyse,[34] der »zygonischen Theorie« Ockelfords[35] oder der Ähnlichkeits-Analysen bei Data Mining), wobei der Grad der Variation zu einem wahrnehmungspsychologischen Spannungsanstieg oder -abfall führen kann. Bei identischer Wiederholung im Bereich primärer Parameter sowie gleichbleibender sekundärer Parameter (z. B. Dynamik und Tempo) wird generell von einem Spannungsabfall ausgegangen, da nichts Neues hinzukommt, das für die Hörenden salient, somit spannungsmäßig attraktiv wäre. Der steigende Grad der Variativität kann zu einem Spannungsanstieg führen beim Hervortreten des Neuen (salient, attraktiv) im Vergleich mit dem unmittelbar zuvor erklungenen Bezugselement. Vermutlich spielt die individuelle Hörstrategie bei der Entscheidung darüber, was als salient gelten soll, eine entscheidende Rolle.

Theoretische Grundlagen des COSM-Modells

Musikalische Ereignisse, Salienz und Impuls

Ein ›musikalisches Ereignis‹ kann definiert werden als ein strukturelles. Es wird somit im Kontext anderer musikalischer Ereignisse zu einem hervorragenden und auffälligen bzw. salienten Ereignis, wenn es sich (aufgrund der unterschiedlichen Werte verschiedener musikalischer Parameter) im Fluss (flux, flow) anderer musikalischer Ereignisse von seiner unmittelbaren Umgebung[36] unterscheidet bzw. abhebt.

Salienz als Grad der Unterscheidung derjenigen musikalischer Ereignisse von einem Hintergrund, die eine Veränderung im Fluss der Musik indizieren, ist ein bisher selten systematisch untersuchter Aspekt sowohl in der Musikanalyse[37] als auch bei sonstigen Zeitskalenanalysen.[38] Beide Analyseformen beinhalten Segmentations- und Reduktionsprozesse (ähnlich wie bei der Schenker-Analyse), bei denen saliente, sogenannte »wichtige perzeptuelle Punkte«[39] über verschiedene Ebenen hinweg erhalten bleiben.

Als ›salientes musikalisches Ereignis‹ bezeichnet der Autor dieses Artikels den sogenannten »Impuls«[40] in der Definition als »Moment« oder »Ereignis der Veränderung«, das perzeptiv und kognitiv indizierbar ist ‒ unabhängig von seinem Anfang oder Ende. Dieser Impulsbegriff unterscheidet sich von dem der Neurologie und Hirnforschung dadurch, dass es hier zu einer »frühen« Verarbeitung von musikalischen Parametern wie Frequenz (Tonhöhe) und Lautheit (Dynamik) kommt. Der analysierte Impuls als elektrisches Signal im Bereich von Millisekunden bewegt sich also auf einer völlig abweichenden Zeitskala.[41] Saliente musikalische Impulse sind deutlich langsamer. Ein solcher Impuls regt als Stimulus die Aufmerksamkeit der Hörerenden an,[42] leitet ein »mentales Hindeuten« oder den »Akt der fokalen Aufmerksamkeit« ein.[43]

›Salient‹ (hervorragend, bedeutsam, auffällig) können in Musik bestimmte Merkmale sein, darunter primäre (PP) und sekundäre Parameter (SP).[44] Zu den PP zählen Tonhöhen-, Rhythmus- und Harmoniestrukturen, die im Detail eher von erfahrenen Musiker*innen (Expert*innen)[45] analytisch unterschieden werden können. Zu den SP zählen nach Zohar Eitan und Roni Y. Granot[46] die sogenannten extra-musikalischen (›natürlichen‹) auditiven perzeptiven Aspekte wie Lautheit (oder Dynamik), Tonhöhen-Register und Klangfarben, welche für weniger trainierte oder Nicht-Musiker*innen (sogenannte naive Hörer*innen)[47] besser wahrnehmbar, attraktiver sind. Auch Irène Deliège, Marc Mélen, Diana Stammers und Ian Cross[48] unterscheiden zwischen Musiker*innen, deren kognitive Repräsentationen zugänglicher und detaillierter sind als die von Nicht-Musiker*innen.

Musikalische Spannung und temporale Musikanalyse

Wie die Höhepunkt-Analysen von Kofi Agawu für tonale Musik[49] und Martin Kirschbaum für post-tonale Musik[50] gezeigt haben, ist musikalische Spannung ein komplexes Phänomen. Es wird auch als kognitives Gegensatzpaar ›Spannung/Entspannung‹ begriffen, wie dies in Fred Lerdahls und Ray Jackendoffs ›Generativer Theorie der Tonalen Musik‹ (GTTM)[51] mit Bezug auf Salienz auch für atonale Musik unternommen wurde.[52] Ein weiterer verwandter Begriff ist der der »temporalen dynamischen Form«.[53] Auch der Expektanz-Aspekt[54] beinhaltet die musikalische Spannung, u. a. in der ITPRA-Theorie (Imaginative, Tension, event onset, Prediction, Reactive, Appraisal) von David Huron.[55]

Die strukturelle musikalische Spannung (definierbar durch das Zusammenwirken strukturbildender musikalischer Parameter) ist bisher hauptsächlich für tonale Musik und deren primäre Parameter, weniger für post-tonale Musik mit deren primären sowie sekundären Parametern untersucht worden. Studien zur musikalischen Spannung in post-tonaler Musik veröffentlichten Anna Rita Addessi und Roberto Caterina (2000, zur musikalischen Form und Segmentation), Lerdahl (2001, zur atonalen Musik und kognitiven Salienz), Kirschbaum (2001, zur Höhepunktbildung und Dramaturgie), Addessi (2010, zur »Makroform« sowohl empirisch als auch Expert*innen-Analyse sowie zur Wahrnehmung von Spannung und Entspannung), Lock (2010a und b, zur Form des ›Impuls‹ genannten musikalischen Ereignisses als salientem Merkmal), Granot und Eitan (2011, zur Interaktion von dynamischen Hörparametern), Lock und Kotta (2012, zu Form, Impuls und musikalischer ›Energie‹) sowie Yvonne Teo (2020, zur harmonischen Spannung in neoklassischer Musik und zum Verhältnis zwischen theoretischer und wahrgenommener Spannung).[56]

Morwaread M. Farbood,[57] David Pressnitzer, Stephen McAdams, Suzann Winsberg, Joshua Fineberg,[58] Fred Lerdahl und Carol Krumhansl[59] sowie Yvonne Teo[60] haben prognostizierende Modelle entwickelt, die sie mit empirischen Daten vergleichen. Unter den empirischen Studien befinden sich solche, die entweder komplette Werke oder nur Ausschnitte, aber auch speziell komponierte Stimuli verwenden; die Mehrzahl der empirischen Studien arbeitet mit ›kontinuierlichen‹ Selbst-Report-Technologien, u. a. durch slider controller.[61]

Musikalische Spannung als Gegenstand empirisch-psychologischer Untersuchung ist auch Teil der Emotionsforschung.[62] Dieser Bereich wird im vorliegenden Artikel jedoch ausgeklammert, da das Hauptaugenmerk des COSM-Modells auf der Analyse von Musik und nicht etwa auf der Analyse des durch sie hervorgebrachten emotionalen Zustands der Gespanntheit bei den Teilnehmenden liegt. Allerdings wird hier auch von der Unterscheidung zwischen ›gefühlter‹ (felt) und ›wahrgenommener‹ Spannung (perceived tension) ausgegangen, die Moritz Lehne und Stefan Koelsch[63] bei ihrem generalisierten Modell von psychologischer Spannung und Erwartungsungewissheit (im Kontext der Analyse von Musik, Film, Literatur und alltäglichen Lebenstätigkeiten) voraussetzen. Eine analoge Unterscheidung, wie sie zunächst Alf Gabrielson (2002) für gefühlte (›subjektive‹) und wahrgenommene (›objektive‹) Emotion vorschlug, wurde von Kari Kallinen (2006) sowie Kallinen und Niklas Ravaja (2006) experimentell untersucht.

In musiktheoretischen Kontexten werden die Hörenden oftmals als erfahrene und kompetente »ideale Hörer« aufgefasst. Bezüglich des »erstmaligen Hörens«, wie es bei traditionellen Musikanalysen vorausgesetzt und in der klassischen empirischen Forschung gefordert wird, formuliert Markus Neuwirth die Auffassung, ein idealer Hörer sei »eine logische Unmöglichkeit«: »Bestimmte Aspekte der Musik, die die Analyse unterstellt, kann ein Hörer prinzipiell nicht nachvollziehen, ohne einen atemporalen, quasi-architektonischen Standpunkt einzunehmen«[64] (ähnlich wie Carl Dahlhaus’ Auffassung von »Wagners dramatisch-musikalischem Formbegriff«[65] oder die retrospektive Betrachtung musikalischer Form als Abstraktion von Musik im Sinne räumlicher Analogie bei Ligeti).[66]

Daraus folgend, wird in dieser Studie anstelle des nach Neuwirth[67] sozusagen ›logisch unmöglichen idealen Hörers‹, welcher zugleich eine atemporale Position einnehmen müsste, ein sogenannter kontextspezifischer, im ständig sich verändernden Jetzt-Moment der »psychologischen Gegenwart«[68] sich bewegender sozusagen ›realistischer Hörer‹ angenommen, welcher im Hörprozess das Gehörte und zu Hörende (ähnlich wie auch sich in der Umwelt befindliche auditive Eindrücke) entweder stetig neu bewertet (oberflächlich, resourcenaufwendig) oder eine kognitive Strategie entwickelt, nach der einige Parameter im Verlauf des Hörens als salienter betrachtet, andere dagegen ausgeblendet werden, was schließlich zur Ausbildung eines Narrativs führt.

Kognitive Narratologie und narrative Musikanalyse

Nach Achim Saupe und Felix Wiedemann[69] ist der narrative Konstruktivismus (ein »Zusammensetzen der Geschehnisse«) nicht unumstritten, gleichwohl lässt sich das Wesen einer Geschichte »in der narrativen Strukturierung und Artikulation« erkennen.[70] Die kognitive Narratologie[71] ist ein Untergebiet der narrativen Analyse der Literaturwissenschaft. Hierbei wurden u. a. empirische Studien zur Untersuchung von Korrelationen zwischen Merkmalen in Texten und prozessualen Strategien, die diese auslösen, durchgeführt.[72] Ähnlich funktioniert auch COSM (siehe dessen audiovisuelle Prinzipien sowie die Visualisierung und Analyse der Daten).

Narrative Methoden hält Gruhn für vielversprechend, zugleich sieht er die Notwendigkeit der Systematisierung und Verfeinerung der Methodologie.[73] Sein Analyseverfahren sieht vor, assoziative Verbindungen zwischen den »reflektierenden Hörgeschichten« statistisch zu erfassen, zu quantifizieren und in Netzstrukturen abzubilden.[74] Mit COSM ist die Möglichkeit gegeben, Hörstrategien als Narrative nonverbal zu erfassen und statistisch quantifiziert darzustellen.

Byron Alméns fünf Punkte des musikalischen Narrativs[75] treffen auch auf Prinzipien des Kognitiven Achteckigen Scheibenmodells COSM zu und werden im folgenden Abschnitt in Bezug auf das Modell sowie auf die Musik Erkki-Sven Tüürs erläutert:

(1) Interaktion von musikalischen Elementen.

(2) Begrenzte Zahl von narrativen Archetypen.

(3) Muster-Organisation durch Konflikt zwischen zwei oder mehr hierarchisch auf einander bezogenen Elementen innerhalb eines Systems mit Hilfe der Neubewertung konstituierender Elemente.

(4) Die Muster weisen dem Medium entsprechende einzigartige Oberflächen-Merkmale auf, so auch in der Musik.

(5) Die Muster müssen psychologisch bedeutsam sein; ihr häufiges Erscheinen als prägendes Prinzip in den Künsten basiert nicht auf logischer Notwendigkeit oder Zufall, sondern auf der Signifikanz dieser Muster für die Wahrnehmenden auf verschiedenen Ebenen.

Die interagierenden musikalischen Elemente (1) sind bei COSM 8 musikalische Parameter und Kontrast. Narrative Archetypen (2) finden sich auf der syntaktischen Ebene: Sonatenform, Sonaten-Zyklus, Anfang-Mitte-Ende, Kulminationsdramaturgie mit Hauptkulmination, und speziell für Tüürs Musik auf parametrischer Ebene: »schnelle«, »langsame«, »kontinuierliche« Zustände der Zeit,[76] die durch die entsprechende Behandlung der Parameter Tonhöhenbewegung, Rhythmus, Tempo erreicht wird. Der Grundkonflikt bei der Muster-Organisation (3) in Tüürs Musik besteht in Kontrasten innerhalb des musikalischen Materials und zwischen unterschiedlichen Kompositionstechniken; in seinen nach 2002 entstandenen Werken nehmen Übergänge zwischen diesen Kontrasten ‒ speziell zwischen den drei temporalen Zuständen der Musik ‒ immer mehr Raum ein. Bezüglich einzelner Parameter erscheinen in diesen Werken die Kontraste für die Hörenden individuell, konstituierende Parameter werden zu Beginn durch die Hörenden festgelegt, und zwar diejenigen mit dem höchsten Salienz-Grad. Die einzigartigen Oberflächen-Merkmale der Muster (4) sind in Tüürs Musik die im vorigen Punkt genannten Kontraste sowie nach 2002 die ebenfalls bereits erwähnten Übergänge zwischen den drei temporalen Zuständen der Musik. Die psychologische Bedeutsamkeit dieser Muster (5) wird in COSM durch das Konzept der audiovisuellen Salienz erfasst.

Zur empirischen Methodik dieser Studie

Analyse-Gegenstand, Teilnehmer und Prozedur

Gegenstand der Studie ist eine Einspielung der 4. Sinfonie bzw. des Schlagzeugkonzerts Magma von Erkki-Sven Tüür (2002, Aufführungsdauer 30:58 Min.,[77] Estnisches Nationalorchester ERSO, Dirigent: Paavo Järvi). Seine Musik erscheint fließend ohne klare Grenzen, wellenförmig, sich ständig verändernd, zugleich kontrastiv und kulminationsdramaturgisch ausgerichtet. Nach Kerri Kotta[78] kann sie mit Hilfe der Prinzipien der »schnellen« (aktiver Rhythmus), »langsamen« (klare Linear- und Harmoniestruktur) und »kontinuierlichen« (andauernde Klang-Faktur) Zustände der musikalischen Zeit analysiert werden. Bis 2002 überwiegen bei Tüür Kontraste innerhalb des musikalischen Materials und zwischen unterschiedlichen Kompositionstechniken (u. a. tonal versus frei-atonal versus dodekaphon), nach 2002 nehmen Übergänge zwischen diesen Kontrasten, speziell zwischen den drei temporalen Zuständen der Musik immer mehr Raum ein. Dies führt u. a. dazu, dass Formgrenzen hauptsächlich bei kulminativen Höhe- und Tiefpunkten anzusiedeln sind, da es keine klassisch klaren Abschnitte mehr gibt.[79]

Die empirischen Experimente fanden im Herbst/Winter 2017 an der Tallinner Universität statt; mit zwei von insgesamt vier Expertinnen und Experten fanden die Experimente außerhalb Tallinns statt. Die Teilnehmenden des ersten Experiments (N=26) waren Bachelor-Studierende zum einen des Studiengangs »Integrative Kunst, Musik und Multimedia« aus drei Jahrgängen, zum anderen des auslaufenden Musikstudiengangs sowie eine Gymnasiastin mit musikalischer Ausbildung (n=22; Altersdurchschnitt: 24,3 Jahre, Altersspanne: 17–37 Jahre). Unter den Expert*innen (n=4; professionelle Komponist*innen, Dirigent*innen und Musiker*innen) befand sich ein Magisterstudent mit Bachelor-Abschluss, drei Personen mit (teils mehreren) Master-Abschlüssen, darunter zwei Doktorand*innen (Altersdurchschnitt: 38,8 Jahre, Altersspanne: 31–50 Jahre).

Während des ersten Experiments zeigten die Teilnehmenden durch slider controller die ›wahrgenommene‹ strukturelle musikalische Spannung an. Sie wurden darum gebeten, sich beim Hören auf die Analyse der Musik zu konzentrieren, nicht auf den sich dadurch eventuell einstellenden eigenen emotionalen Spannungszustand. Diese Vorgabe stützt sich auf Lehne und Koelsch[80] und beruht auf der Unterscheidung zwischen ›wahrgenommener‹ (›objektiver‹) und ›gefühlter‹ (›subjektiver‹) Emotion.

Im zweiten Experiment analysierten Teilnehmende aus demselben Feld (N=14, darunter Bachelor-Musikstudierende n=10; Altersdurchschnitt: 23,3 Jahre, Altersspanne: 19–37 Jahre; ferner dieselben Experten n=4) mit Hilfe von COSM zunächst die Salienz von Impulsen (Momenten der Veränderung). Anschließend fixierten sie quantitativ die Salienz von acht vorgegebenen musikalischen Parametern[81] zum Zeitpunkt der zuvor individuell angezeigten Impulse.

Empirisches Experiment-Design

Das erste Experiment dieser Studie durch slider controller[82] ergibt ebenso wie bei Farbood (2006, 2012) kontinuierliche Echtzeit-Daten. Das zweite Experiment (COSM) ergibt in der ersten Phase (i) diskrete Echtzeit-Daten, in der zweiten Phase (ii) diskrete retrospektive Bewertungen.

(1) ›Holistisches‹[83] und ›aufmerksames‹ Hör-Experiment: ›kontinuierliche‹[84] Erfassung von Veränderungen in der Musik als Ausdruck der ›wahrgenommenen‹ musikalischen Spannung durch slider controller über das ganze Werk hinweg (ohne Unterbrechung).

(2) ›Holistisches‹ Hörexperiment: diskrete Erfassung von Veränderungen in der Musik:

(i) ›aufmerksames Hören‹ (attentive listening):[85] Anzeigen von holistischen musikalischen Ereignissen (Impulsen) als Indikatoren für musikalische Spannung über das ganze Werk hinweg (ohne Unterbrechung).

(ii) ›aufmerksames Hören‹ (attentive listening) und ›analytisches Hören‹:[86] die individuellen Impulse (mit ihrer Umgebung -/+7 Sekunden), die beim ›holistischen‹ Experiment angezeigt wurden, werden als Fragmente (chunks) (Gesamtdauer 14 Sekunden, siehe Abbildung 1) für wiederholtes Hören durch jeden Teilnehmenden separat benutzt, um die Salienz der gegebenen musikalischen Parameter zu bestimmen, die durch die COSM-Scheibe die Analogie der Salienz sowohl im visuellen als auch im auditiven Bereich hinzufügen.

Abbildung

Abbildung 1: Gedächtnis-Aspekte bei der Wahrnehmung von a) Ereignissen und primären musikalischen Parametern, b) der temporalen Dimension, Gedächtnis-Mittelwerte (nach Snyder 2000) zur Begründung des -/+7=14 Sekunden COSM-Impuls-Zeitfensters.

Zwei Phasen von COSM

In der ersten Phase von COSM werden musikalische Ereignisse analysiert, die wahrnehmbar sind, indem sich im als Impuls bezeichneten Moment für die Hörenden etwas ändert in der Musik. Was genau diese Änderung hervorgerufen hat, bleibt in der ersten Phase des Experiments noch verborgen. Die Impulse werden von den Teilnehmenden des Experiments im Audioverarbeitungsprogramm Reaper mit der M-Taste in Echtzeit während des ununterbrochenen Musik-Hörens ausgewählt und gespeichert. Hierbei sehen die Teilnehmenden im leeren Track (der Aufnahme) weder den Maus-Cursor noch die Wellenform mit laufender Zeitmarkierungs-Positionsline, um nicht von dieser visuellen Information beeinflusst zu werden. Die Impulse werden anschließend als Zeitcodes aus Reaper exportiert und in der zweiten Phase in das Programm Max/MSP importiert, mit der die COSM-Software von Hans-Gunter Lock geschrieben wurde.

In der zweiten Phase ist es das Ziel der Modellierung, den ›Inhalt‹ dieser Impulse greifbar zu machen, d. h. zu ermitteln, welche Merkmale/Eigenschaften (features, properties) im Fluss der Musik auftauchen (emergent) und sich als auffällig salient erweisen. Hierbei ist es das Ziel, jene musikalischen Parameter, die die in der ersten Phase im Impuls-Moment wahrgenommene Änderung hervorgerufen haben, in genau diesem Moment zu bestimmen und zu quantifizieren. Dabei wird einkalkuliert, dass speziell in komplexer Orchestermusik alle wesentlichen Parameter[87] miteinander verwoben sind und ineinanderwirken – auch dann, wenn sie (aus welchen Gründen auch immer) nicht einzeln wahrgenommen werden (können).

Audiovisuelle Prinzipien von COSM

Für die Modellierung wurde der Umriss eines Achtecks (Oktogon) als geometrische Figur gewählt (siehe Abbildungen 2 und 3), dessen Ecken durch die quasi 3D-Darstellung leicht seitlich von vorn sowie ungefähr im 45-Grad-Winkel von oben unterschiedlich hervortretend (salient) sind. In Analogie zu dieser visuellen Salienz sind in jedem vom jeweiligen Experiment-Teilnehmer zuvor ausgewählten Impuls alle acht Parameter immer vorhanden, aber sie sind für verschiedene Hörer unterschiedlich salient, mehr oder weniger auditiv hervortretend. Ihre Salienz hängt davon ab, welche Parameter für welche Hörenden in welchem Umfang und in welcher Kombination perzeptiv überwiegen bzw. attraktiv sind. Die Hörenden entwickeln dabei im Laufe des Experiments in Abhängigkeit von der Musik und ihren eigenen Vorlieben, aber auch von ihren jeweiligen perzeptiven und kognitiven Fähigkeiten und Erfahrungen eine eigene Strategie, die qualitativ sowohl über die Musik als auch über die Hörenden etwas aussagt. Daraus lässt sich wiederum ein analytischer Ansatz entwickeln, da für die zweite Phase sämtliche Impulse innerhalb eines -/+ 7 Sekunden dauernden Fragments, eines sogenannten chunks mit der Gesamtdauer von 14 Sekunden, so oft wie nötig angehört und im Detail analysiert werden können. Ähnlich geht auch die Progressive Exposure Method (PEM) von Joshua D. Albrecht vor, bei der die Musik in einzelnen Fragmenten (chunks) mehrfach angehört werden darf.[88] Allerdings wählen die Teilnehmenden die Fragmente bei COSM in der ersten Phase des Experiments durch Impuls-Erfassung selbst (mit statischer Dauer der oben genannten 14 Sekunden) und analysieren diese chronologisch in der Originalreihenfolge.

Abbildung

Abbildung 2: Die zentrale geometrische Figur eines Achtecks (Oktogon) für die COSM-Scheibe. Die Ecken des Oktogons befinden sich in mit den römischen Ziffern I–III bezeichneten visuellen Regionen, wobei sie in den Regionen I und II unter dem Gesichtspunkt der visuellen Salienz betrachtet werden. Die Region III funktioniert nach den Gestaltgesetzen, da diese Punkte perspektivisch näher beieinander liegen. Die arabischen Ziffern 8–1 in absteigender Reihenfolge und somit abnehmender Salienz an den Ecken des Oktogons sind die zugeteilten Werte, mit deren Hilfe die jeweiligen Ecken quantifiziert werden können.

Abbildung

Abbildung 3: COSM-Scheibe (Oktogon) und musikalische Parameter als Fenster für Teilnehmende der zweiten Phase des Experiments mit dem Ziel, die Salienz der Parameter für den jeweiligen Impuls zu erfassen

Abbildung 3 zeigt die COSM-Scheibe (Oktogon) und die musikalischen Parameter zusammen mit dem Extra-Parameter Kontrast als Experiment-Oberfläche in demjenigen Fenster, das für die Teilnehmenden des Experiments am Bildschirm sichtbar ist, sowie die Zusatzfunktionen, die nur von Personen eingesehen werden können, die das Experiment wissenschaftlich betreuen. Der Richtungspfeil Click & click-drop zeigt, dass der Parameter Dynamik mit zwei Mausklicks der gewählten Oktogon-Ecke zugeordnet wird. Der Hintergrund der Dynamik-Schaltfläche (hellblau) verschwindet dann beim Menü und erscheint als Hintergrund der Schaltfläche der jeweiligen Ecke. Das Fenster zeigt alle Funktionen, die die Teilnehmenden während des Experiments wählen können und müssen, um fortfahren zu können: Play startet das Fragment, Volume ermöglicht eine Justierung der Lautstärke des Fragments, Correct erlaubt den Teilnehmenden, ihre vorherige Auswahl neu zu treffen (der Vorgang für den jeweiligen Impuls beginnt von vorn), Ready wird gewählt, wenn die Teilnehmenden mit ihrer Auswahl zufrieden sind und den nächsten Impuls analysieren möchten. ›Im#‹ zeigt die Nummer des jeweils zu analysierenden Impulses und ändert sich automatisch, wenn die Teilnehmenden mit der Erarbeitung eines Impulses fertig geworden sind. Die Ziffern an den Ecken des Oktogons sind die zugeteilten Werte, mit deren Hilfe die jeweiligen Ecken quantifiziert werden können.

Funktionsprinzip und Visualisierung des DBSCAN-Algorithmus

Durch den DBSCAN-Algorithmus werden die Impulse der am Experiment Teilnehmenden (Expertinnen und Experten n=4, Musikstudierende n=10, zusammen N=14) in 48 Cluster nach folgenden Kriterien aufgeteilt: 10 und mehr Reaktionspunkte (Impulse) mit einem Radius (Epsilon) von 2 Sekunden (bezogen auf die jeweiligen Punkte) sind Zentralpunkte (core points); liegen weniger als 10 Reaktionspunkte (Impulse) innerhalb dieses Radius (Epsilon), so werden sie als Grenzpunkte (border points) bezeichnet. Die gewählte Mindestanzahl von 10 Punkten bezieht sich auf die Teilnehmenden-Anzahl N=14, weniger als 10 Punkte sind nicht hinreichend signifikant. Das Generierungsprinzip der DBSCAN-Cluster-Punkte ist in Abbildung 4 am Beispiel des Clusters 21 mit Kreisen visualisiert. Die Daten werden am Beispiel der Cluster 21–23 im Tonbearbeitungsprogramm Audacity zur Wellenform der Tonaufnahme ins Verhältnis gesetzt (Abbildung 4). Neben den Zeitangaben zu den Impulsen bzw. Reaktionspunkten zeigt das Bildschirmfoto auch die Dauer der dichtesten Kumulation von Impulsen innerhalb eines Clusters, die Dauer innerhalb von Cluster-Paaren sowie die Dauer zwischen einzelnen Clustern/Cluster-Paaren.

Abbildung

Abbildung 4: Cluster 21 und Cluster-Paar 22–23: Darstellung und Analyse mit Zeitangaben der Impulse (Teilnehmer N=14), sowie bei C21 der Visualisierung des Prinzips des DBSCAN-Algorithmus

Abbildung 4 zeigt, dass die Reaktionen der am Experiment Teilnehmenden relativ genau mit den musikalischen Ereignissen übereinstimmen. Verzögerungen liegen zwischen 100–500 ms, welches die Reaktionszeit-Verspätung von 200–300 ms[89] sowie die sensorische Schwelle des möglichen physiologischen Zeitverzugs[90] (ca. 500 ms) einschließt. Für die Zeit, in der eine Bedeutung im Gehirn sozusagen ›auftaucht‹, geben Stefan Koelsch und Walter A. Siebel 250–550 ms an;[91] für das auditiv-sensorische Gedächtnis zeigen sie 100–200 ms, für die Strukturbildung 180–400 ms; die Reanalyse und Revision finden wesentlich später erst bei 600–900 ms statt.

Ergebnisse und Analyse

Lokal-Analyse der Cluster 19/21–23/26

Die Auswahl der zu analysierenden Cluster 19–26 erfolgt auf Grundlage der summierten Tendenz der COSM primären (PP) und sekundären Parameter (SP) sowie der Mittelwerte der slider controller-Ergebnisse per COSM-Cluster, Cluster-Paare und zu korrelierender Cluster-Paar-Abschnitte (CAC = Cluster Areas Correlated). Bis auf die Übergangscluster 17 und 18 umfassen C19–26 im Prinzip den scherzoartigen B-Teil des Werkes (zur Formanalyse siehe Abbildung 10a–f).

Ausgehend von den in der Matrix in Abbildung 9 dargestellten Ergebnissen, die die COSM-Parameter sowie die slider controller-Tendenzen für jeden einzelnen Cluster bezüglich des Ausgangs- und Endpunkt-Niveaus auf der Basis der jeweiligen arbiträren psychophysischen Salienzskala vergleichen, ergibt sich, dass insbesondere der einzelne C21 sowie das Cluster-Paar C22–23 die regelmäßigsten Datenmuster für die Parameter zeigen.

An den Clustern 21–23 lässt sich beispielhaft zeigen, wie Parameter aus der Partitur formalisiert werden können (Tabelle 1). Die vereinfachte Partitur (Notation des Autors, Abbildung 5) zeigt die Cluster(-Paare) 21 und 22–23. C21: S. 51–52, Takt 225–226, Zeitdauer 11:49.390–11:53.440 (00:04.051); C22–23: S. 55–56, Takt 238–239 und 240–241, Zeitdauern (C22:) 12:23.528–12:28.968 (00:05.441), (zwischen C22 und 23:) 00:01.683, (C23:) 12:30.651–12:34.330 (00:03.679), (C22–23:) 12:23.528–12:34.330 (00:10.807).

Abbildung

Tabelle 1: Cluster 21–23, Partitur-Parameter-Analyse (Start → Ende per Cluster)

Abbildung

Abbildung 5: Cluster(-Paare) 21 und 22–23 (Reduktion der Partitur)

Wie die Abbildungen 10c und d zeigen, geht die musikalisch zu erwartende Spannungsentwicklung des B-Teils für musiktheoretisch geschulte Hörende in Richtung der Kadenz (Cluster 27). Es wäre also ein musikalischer Spannungshöhepunkt für C26 oder C27 zu erwarten. Interessanterweise zeigt jedoch schon C21 den höchsten musikalischen Spannungswert bei den Expert*innen (zwischen 70 und 80 Punkten auf der arbiträren psychophysischen Skala [bei absolutem Maximum 100], in der Tendenz fallend) für die erste Hälfte (bis zur Kadenz) sowie den dritthöchsten für das gesamte Werk. Der Spannungswert bei den Musik- und Kunststudierenden (ca. 60) ist hingegen in C21 niedriger als im Cluster-Paar 17–18 (60–70), er zeigt steigende Tendenz und einen (in der Tendenz fallenden) Maximalwert erst im folgenden C22 (60–70). C23 zeigt die hohe gehaltene Spannung der Expert*innen (70), die Studierenden fallen hier aber deutlich ab (40–60). Mit den Clustern 24–26 ergibt sich der zu erwartende erneute Spannungsanstieg von niedrigerem Niveau aus (40–60), wobei die Musikstudierenden in C25 eine fallende Tendenz annehmen, während die anderen Teilnehmergruppen in der Tendenz unverändert bleiben. Bei allen drei Gruppen zeigt sich ein deutlicher Spannungsanstieg in C26 (50–60). Die Kadenz in C27 erregt nur bei den Expert*innen das zu erwartende Spannungsmaximum (65), bei den Musikstudierenden zeigt sich hier ein merklicher Rückgang (unter 30), bei den Studierenden der Bildenden Künste bewegen sich die Werte im mittleren Spannungsniveau (über 50). Entsprechend der Abbildung 6 zeigt die Impuls- und Zeitdauern-Statistik für die Cluster-(Paare) 19–26 einen Anstieg der Impulszahlen für C26 (19, darunter die der dichtesten Kumulation 9). Auch in C22 liegt dieser Wert mit 14 höher als bei den umliegenden Clustern, C21 weist nur 11 Impulse auf. Das Cluster-Paar 25–26 hat zusammen 30 Impulse. Die Dauer der Cluster liegt zwischen 3–6 Sekunden, die Cluster 19, 22 und 26 sind hierbei länger, die Cluster 20, 21, 23–25 kürzer.

Abbildung

Abbildung 6: Cluster 19–26, a) Impuls-Statistik, b) Zeitdauern-Statistik

Abbildung 7 zeigt eine Gegenüberstellung der positiven Korrelation am Beispiel der Parameter-Daten für die Cluster 19–26 aus der Partitur mit COSM-Parameter-Tendenzen (steigend, fallend, unverändert) und Spannungsresultaten per Teilnehmenden-Gruppen (Expert*innen, Musik- und Kunststudierende). Der globale Vergleich der Spannungs-Gruppen mit den Parameter-Gruppen für die gesamte Dauer des Werkes (C01–48) findet sich in Anhang 1f. In C19 und C22 (fallend), in C24 und C26 (steigend) weisen alle Teilnehmenden-Gruppen (E, M, K) dieselbe Tendenz innerhalb des jeweiligen Clusters auf. Mit Ausnahme von C25 zeigt sich bei Hör-Protokollen für alle Cluster bei den Musik- und Kunststudierenden eine einheitliche Tendenz, die sich allerdings in den Protokollen der Expert*innen so nicht zeigt.

Es fällt auf, dass darüber hinaus bei beiden Teilnehmenden-Gruppen die Parameter-Gruppen-Statistik identisch ist. In C25 entsteht sowohl bei den Expert*innen als auch den Kunststudierenden keine Korrelation zwischen Spannungsmittelwert, COSM und Partitur-Parameter-Gruppen.

Abbildung

Abbildung 7: Cluster 19–26, Positive Korrelation a) per PP und SP Gruppe: COSM (n=14) vs. Spannungsmittelwert von E, M, K mit Parameter-Statistik der Partitur (Start → Ende + steigend, - fallend, uv unverändert); b) Parameter separat; c) Kurvenansicht.

Ferner fällt in Abbildung 7 auf, dass die Expert*innen grundsätzlich anders zu reagieren scheinen als die Musik- und Kunststudierenden. In den Clustern 19–22 der Expert*innen befinden sich viele Parameter (COSM und Partitur) im korrelierenden Abwärtstrend (keine sind steigend), bei den PP verlaufen COSM und Partitur-Daten spiegelbildlich ‒ die PP sind abwechselnd salienter,[92] die SP verlaufen jedoch parallel, die COSM-Parameter sind in C19 und 20 salienter: in den Clustern C20 und 21 ist die Wahrnehmung (COSM) klarer, als dies vermutlich der Fall gewesen wäre, wenn die Teilnehmenden des Experiments prima vista mit der Partitur konfrontiert worden wären. In C23 sind die COSM und Partitur-Parameter unverändert, in C24 und 26 sind die meisten Parameter in der Tendenz steigend sowie die SP salienter. Bei den Musik- und Kunststudierenden zeigt sich ein überwiegend paralleler Parameter-Verlauf zwischen PP und SP in COSM und der Partitur-Analyse. Wenn in C19 und C22 die COSM-PP dominieren, so sind es in C20 und 21 sowie C23 und 24 die COSM-SP. Im Cluster-Paar 22–23 fallen COSM und Partitur-Daten zusammen. Eine Schlussfolgerung daraus ist, dass für die Nicht-Expert*innen die SP (in C20, C21, C23) tatsächlich salienter erscheinen, im Gegensatz zu den PP, die für die Expert*innen salienter sind (in C20, C21). Allerdings zeigt sich bei allen Teilnehmer-Gruppen eine klare Abgrenzung um die Cluster 22 und 23 herum. Diese deutliche Regelmäßigkeit in den Daten visualisieren auch die Abbildungen 9 (Matrix) sowie die Abbildungen 10e und f für das gesamte Werk.

In Abbildung 8 werden die musikalischen Parameter-Ergebnisse von COSM der Cluster 21–23 nochmals detailliert abgebildet, nicht jedoch die zeitlichen Positionen der Impulse in jedem Cluster proportional zueinander. Um die Proportionalität der Impulse untereinander besser einordnen zu können, kann man die Abbildungen 8 und 4 zusammen betrachten. Es fällt auf, dass nicht für jeden Impuls alle Parameter angezeigt wurden. Die Salienzwert-Summen sind in Abbildung 8d dargestellt und zeigen, dass der Parameter Rhythmus in allen drei Clustern am häufigsten gewählt wurde, gefolgt von Tempo (C21) sowie von Instrumentation/Timbre (C22) und Instrumentation/Timbre sowie Faktur (C22). Weitere Parameter sind, besonders in C23, weniger salient. Darüber hinaus gestaltet sich die Verteilung der Parameter innerhalb der Cluster augenscheinlich variativ: es gibt keine temporal durchgehend salient-dominierenden Parameter, und bei genauer Betrachtung können sich lokale Muster für jeden Parameter ergeben.

Abbildung

Abbildung 8: Cluster 21–23, (von oben a–c) detaillierte COSM-Parameter-Statistik, Salienzwert-Summenvergleich (d).

Höranalyse der Cluster 19–26

Verbale Beschreibung der musikalischen Ereignisse in C19–26

Cluster-Paar 19–21(Dauer 00:09.884)

C19 (Dauer 00:04.844, 10:11.806–10:16.65) beginnt mit schnellem Tremolo in den Holzbläsern, diese gehen in zwei aufeinanderfolgende schnelle Abwärtspassagen (Quasi-Glissando) über, beim zweiten Mal steigt das Quasi-Glissando erneut an. Das Schlagzeug verwendet den aus C19 kommenden Hi-Hat Schlag – bis zu Beginn von C20 wird der Schlagzeugbesen leise und als Effekt eingesetzt.

Mit C20 (Dauer 00:03.55, 10:18.14–10:21.69) beginnt das Solo-Schlagzeug fast ununterbrochen mit Rockmusik-Rhythmen (Floortom, Tomtom, Große und Kleine Trommel). Eine einzelne Unterbrechung dieser Faktur ist aber nicht von einem Cluster erfasst worden (einzelne Teilnehmende haben aber darauf reagiert). In C20 ertönen auch (erneut) dunkle Blechbläserakkordsäulen (chromatische Bewegung dcis), die schon einige Zeit vorher für Spannung gesorgt haben.

Zu Beginn von C21 (Dauer 00:04.051, 11:49.39–11:53.44) endet die auf klangfarblich-dynamische (geräuschhafte) Kulminationseffekte ausgelegte Schlagzeugpartie (Ridebecken). In der zweiten Hälfte erklingen kontrastive Holzbläser in hohem Register (am Ende des Clusters ein Abwärts-Quasi-Glissando) sowie erneut die Rockmusik-Rhythmen des Solo-Schlagzeugs (Floortom, Tomtom, Große und Kleine Trommel).

Cluster-Paar 22–23 (Dauer 00:10.807)

In C22 (Dauer 00:05.441, 12:23.523–12:28.968) enden zunächst schnell (chromatisch) ansteigende und sich verlangsamende Blechbläserakkorde (in mittlerem bis hohem Register). In der zweiten Hälfte beginnt das Schlagzeug schnell zu pulsieren, wobei sich erneut die charakteristische punktierte Rhythmusfigur herauskristallisiert. In C23 (Dauer 00:03.679, 12:30.651–12:34.33) endet die zwischen beiden Clustern begonnene, modal ansteigende, diesmal aber sich beschleunigende Passage der Blechbläserakkorde (leise und mit leichtem crescendo). Diese endet direkt nach dem Cluster in einem hohen langen Ton. In der zweiten Hälfte kommen zudem schnelle Schläge der großen Trommel kontrastiv zum Einsatz, die erneut einen Spannungsanstieg hervorrufen.

Cluster-Paar 24–25 (Dauer 00:18.982)

In C24 (Dauer 00:02.844, 13:27.82–13:30.46) endet die bis zu diesem Zeitpunkt kulminierend verdichtete Steigerung des Kuhglockengeläuts. In der zweiten Hälfte begegnen abermals die Rockmusik-Rhythmen, die durch schnelles akzentuiertes Spiel auf der Großen Trommel eine Kontrastwirkung evozieren. Die Trommelschläge treten nicht zuletzt durch die Parallelführung mit den Holzbläsern im hohen Register (Motiv a-h-gis-a-h-c) klangfarblich deutlich hervor. Diese Schläge enden unmittelbar nach dem Cluster. Bis zu C25 übernehmen die Streicher das Motiv in hoher Lage und mit relativ geringer Lautstärke. Im Hintergrund von C24 erklingen lang gehaltene Basstöne sowie kurze schnelle Holzbläsermotive in hohem Register. Eine kulminierende Entwicklung vor C25, die jedoch weniger auf eine kontrastierende Wirkung hin angelegt ist, lässt sich nicht innerhalb eines Clusters erfassen. Allerdings beginnt C25 (Dauer 00:03.272, 13:43.53–13:46.802) mit dem klaren und verlangsamten Ende dieser kulminierenden Entwicklung durch das Schlagzeug (im Hintergrund die schon aus C24 bekannten langen Basstöne), und es erklingen kurze schnelle Blechblasmotive (erst vier, dann sechs Schläge mit gleichbleibender Tonhöhe) zusammen mit solistischen lauten, punktierten Schlagzeug-Motiven, die zu einem erneuten Spannungsanstieg führen, zugleich jedoch eine Art Abschluss der bisherigen Spannungsentwicklung bedeuten.

Cluster-Paar 25–26 (Dauer 00:17.751)

Im Cluster-Paar C25–26 ist der Endpunkt der bisherigen kulminierenden Entwicklung der Musik innerhalb des zweiten Drittels des gesamten Werkes – sogar noch vor Erreichen der zweiten Hälfte des zweiten Drittels – erreicht. Dieser Endpunkt mündet in die Solo-Kadenz des Schlagzeugs, die durch C27 erfasst ist. In C25 endet das ständige Solo-Schlagzeug. Bis zu C26 vollzieht sich eine Verlangsamung der Entwicklung. Zu Beginn von C26 (Dauer 00:05.713, 13:55.567–14:01.28) musizieren die Streicher rallentando in hohem Register (dritte Oktave: cis-d-e-f-d-f-d) Dann bilden die Blechbläser mit einem sukzessive aufwärtssteigenden übermäßigen Dreiklang (zweite Oktave: a-cis-eis-a) und dem darauf einsetzenden, die harmonische Spannung des a ins b auflösenden Tutti den vorläufigen Höhepunkt. Der Akkord, der mehr ein Cluster ist als ein Dreiklang, steht nicht zuletzt wegen seiner dunklen Klangfarbe in auffälligem Kontrast zu den Klängen der Streicher und Blechbläser.

In den Clustern C19–24 endet jeweils die dort kulminierende Spannungsentwicklung, und es baut sich eine neue auf. Diese Cluster sind zweigeteilt durch eine Zäsur in ihren Spannungsentwicklungen ungefähr auf der Hälfte ihrer Dauer. Es zeigt sich ein deutlicher Kontrast mit dem unmittelbar anschließenden Beginn einer neuen Phase mit zunehmender Spannung. C25 lässt als hybrider Cluster zwar das Auslaufen der bisherigen kulminierenden Entwicklung erklingen, die Spannung bleibt gleichwohl erhalten. In C26 ist die in ihrem Spannungsverlauf wieder ansteigende Abschlussphase des B-Teils zu hören, die in eine erneute, zwar langsame, aber nach wie vor spannungsgeladene Entwicklung mündet. Dies alles bereitet die Schlagzeug-Solokadenz vor, die sich exakt in der Mitte des 30:50 Min. dauernden Werkes ereignet, nämlich zwischen 14:26 und 16:17 Min.

Integrative Analyse

Aus der folgenden integrativen Analyse – einem Vergleich der Formanalyse mit den COSM-Parametern und den slider controller-/Spannungsmittelwerten – ergeben sich die Regelmäßigkeiten, die zuvor in der Lokal-Analyse der Cluster 19/21–23/26 schon im Detail zu erkennen waren. Die vertikal-chronologische Matrix der Abbildung 9 stellt die detaillierten Tendenzen für die Spannungsmittelwerte (nach Teilnehmenden-Gruppen) den Parameter-Gruppen (PP und SP) gegenüber und zeigt hingegen eine überwiegend unregelmäßige Struktur auf. Einzig in den Clustern 21–23 bzw. 19–26 lassen sich einige Regelmäßigkeiten erkennen, indem alle Spannungs-Teilnehmenden-Gruppen sowie sämtliche PP- und SP-Gruppen dieselben steigenden oder fallenden Tendenzen wahrnehmen.

Abbildung

Abbildung 9: Matrix: Slider Controller und COSM-PP+SP, detaillierte Tendenz der Mittelwerte per COSM-Cluster Start (S) → Ende (E)

Im Folgenden werden die horizontal-chronologischen Grafiken der Abbildungen 10a–e beschrieben. In Abbildung 10a wird die musikalische Form einer Analyse unterzogen nach Kriterien der Sonatenform sowie der klassischen Rhetorik. In 10b werden die durch den DBSCAN generierten COSM-Daten-Cluster und -Cluster-Paare dargestellt, die sich gut in die Formanalyse einordnen lassen. Sie unterteilen den A-Teil in A1 und A2, was auch der Spannungsmittelwert mehr (1d, die exakten ›Start → Ende‹-Daten für jeden Cluster) oder weniger (1c, die Mittelwerte aus ›Start → Ende‹-Daten für jeden Cluster) bestätigt. 1e zeigt die höchste Formalisierung (positive Korrelation) der Daten von COSM- (Parameter-Tendenzen) und slider controller-Tendenzen.

Abbildung

Abbildung 10a: Musikalische Formanalyse (Kotta 2011) nach Hepokoski und Darcys (2006) rhetorischer Formanalyse

Abbildung 10a vergleicht zwei Formschemata der wellenförmig fließenden, sich ständig verändernden kulminativen und kontrastiven Musik ‒ hier 4. Sinfonie / Schlagzeug-Konzert (2002) von Tüür ‒, die unter der Kategorisierung »langsame«, »schnelle« und »kontinuierliche« Zeit[93] analysiert worden ist – im ersten Satz geht die Entwicklung von der »kontinuierlichen« zur »schnellen« Zeit über, im Scherzo und im Finale überwiegt die »schnelle« Zeit, im langsamen Satz und in der Coda findet eine bedingt ähnliche Transformation wie im ersten Satz statt. Das musikalische Material wird rhetorisch rotierend entwickelt.[94] Klassisch klare thematische Anfangs- oder Endpunkte als formale Segmentationspunkte scheint es kaum zu geben. Dies hat den Autor dieses Artikels dazu veranlasst, kulminative Höhepunkte als formbildende Segmentationspunkte zu bezeichnen.[95]

Abbildung

Abbildung 10b: DBSCAN, COSM-Cluster-Paare und CACs

Abbildung 10b zeigt, wie die durch den DBSCAN-Algorithmus ausgewählten 48 Cluster der COSM-Daten in Cluster-Paare und korrelierende Cluster-Paar-Abschnitte (CACs) eingeteilt werden können (A–E). Die Grundlage hierfür ist die zeitliche Nähe/Ferne der Solo-Cluster/Cluster-Paare zueinander. Innerhalb der Cluster-Paare liegt diese für C19–21 zwischen 1 und 13 Sekunden: C19–20 (00:01.49) (siehe Abbildung 4), C22–23 (00:01.683), C24–25 (00:12.866), C25–26 (00:08.766). Zwischen den Cluster-Paaren/Solo-Clustern beträgt sie zwischen 30 Sekunden und 1.30 Minuten: C20 und 21 (01:27.699), C21 und C22 (00:30.087), C23 und C24 (00:53.419). Diese Daten lassen sich in Einklang bringen mit der Sonaten-Zyklusanalyse im Anhang 1a, nur der erste Satz unterteilt sich nochmals in zwei Abschnitte (A1, A2), welche deutlich durch eine Zäsur in der Musik und durch die Spannungsergebnisse erklärbar sind (siehe Abbildung 10c–d).

Abbildung

Abbildung 10c: Slider controller-(Spannungs-)Mittelwerte per COSM-Cluster-Paar und CACs, Start (S) → Ende (E)

Abbildung 10c zeigt, wie die Spannungsmittelwerte (Expert*innen, Musikstudierende und Kunststudierende jeweils separat) per COSM-Cluster-Paar und CACs sich ebenfalls in die Formanalyse/Cluster-Paar/CAC-Analyse einfügen (A–E). Während Daten der Expert*innen (E) in den Teilen B–E höhere Mittelwerte aufweisen, sind es in Teil A2 die der Nicht-Musiker*innen. In A1 zeigen die Gruppen alternierende Ergebnisse. Die Daten der Musikstudierenden (M) nähern sich abwechselnd mehr denen der Expert*innen oder denen der Kunststudierenden (K) an. Dies zeigt sich in Teil B: in den Clustern 19–23 liegen die Daten der M und K nahe beieinander, in den Clustern 24–26 die der M und E. Deutlich gehen die Mittelwerte in Teil C sowie in Teil D (ab i) auseinander, sie unterscheiden sich am klarsten in Teil E (k): die Daten der Expert*innen zeigen eine weiterhin hohe Spannung bis ins Maximum, die der Musikstudierenden fallen ins mittlere Niveau ab, die Daten der Kunststudierenden fallen deutlich ab.

Abbildung

Abbildung 10d: Slider controller-(Spannungs-)Mittelwerte per COSM-Cluster und Absolutwerte per Parameter, Start (S) → Ende (E)

Abbildung 10d zeigt, wie sich die Spannungsmittelwerte detailliert per Cluster (Start → Ende) und Gruppen (Expert*innen, Musik- und Kunststudierenden separat) darstellen im Vergleich zu den Absolutwerten per Parameter. Mit gestrichelten Umrahmungen sind visuell auffallende ›S→E‹-Ergebnisse der Parameter hervorgehoben (steigend, fallend), die mit den slider controller-Werten verglichen werden können. Diese Daten sind in Abbildung 10e in ihrer Tendenz vergleichend summarisch generalisiert (per PP- und SP-Parameter-Gruppen).

Abbildung

Abbildung 10e: Slider controller-(Spannungs-)Mittelwerte und COSM-PP+SP, summierte Tendenz der Mittelwerte per COSM-Cluster, Start (S) → Ende (E)

Abbildung

Abbildung 10f: Slider controller-(Spannungs-) und COSM-PP+SP-Tendenz der Mittelwerte per COSM-Cluster, Start (S) → Ende (E), per Teilnehmenden-Gruppen: E – Expert*innen, M – Musikstudierende, K – Kunststudierende

Abbildung 10f zeigt die Spannungs-, Parameter- und COSM-Mittelwert-Tendenzen per PP- und SP-Gruppen. Wenn eine oder mehrere Gruppen keine Tendenz zeigen, sind sie unverändert und in der Grafik nicht vertreten. Per Cluster wird auf der Vertikalachse neben der positiven (steigenden) und negativen (fallenden) Tendenz auch die Anzahl der beteiligten Parameter abgebildet. Es fällt auf, dass in Teil B bei Cluster 21–23 einmalig die Extreme erreicht werden. In C21 und C22 eignet allen SP steigende, in C23 dagegen fallende Tendenz. In C21 weisen ebenfalls sämtliche PP fallende Tendenz auf, in C22 jedoch nur noch zwei (Tonhöhe und Harmonie); in C23 zeigt lediglich ein PP (Tonhöhe) fallende und ein weiterer (Rhythmus) steigende Tendenz, während ein dritter (Harmonie) unverändert bleibt. In unerwarteter Weise korrelieren die Spannungs-Tendenzen: in C21 zeigen allein die Resultate zweier Gruppen (M und K) steigende, die der Expert*innen dagegen fallende Tendenz, ausgehend allerdings von einem Maximum. In C22 weisen alle, in C23 nur zwei Gruppen (M und K) fallende Tendenz auf, während sich die Ergebnisse bei den Expert*innen auf unverändert hohem Niveau bewegen. In den Clustern 19–20 sowie 21–22, 22–23 und 24–25 vollzieht sich eine gegenläufige Entwicklung zwischen Spannungs- und Parameter-Tendenzen innerhalb der Cluster ‒ ein Phänomen, das sich auch in anderen Teilen findet. Daher kann nicht eindeutig von einer Korrelation der Tendenzen innerhalb der Cluster über das gesamte Werk hinweg gesprochen werden.

Schlussfolgerungen und Diskussion

Ausgehend von Abbildung 9 (Matrix) muss die erste eingangs gestellte Frage negativ beantwortet werden: SP sind bei post-tonaler Musik im Stil Tüürs nicht salienter als PP. Nur in den Clustern 21 und 22 verlaufen alle SP in steigenden Tendenzen, in C15, 20, 25 und 29 zeigen alle PP steigende Tendenzen. Einzig in C22 zeigen alle SP fallende Tendenzen. In allen anderen Clustern ergeben sich über das Werk hinweg kaum regelmäßige Muster. Die Hypothese 1 muss im Vergleich mit den slider controller-Spannungsmittelwerten negativ beantwortet werden, da die Veränderung der musikalischen Spannung nicht zugleich eine Veränderung bei den SP und umgekehrt nach sich zieht.

Ausgehend von den Abbildungen 7, 8, 9, 10e und f ergeben sich für die Beantwortung der zweiten Frage zur narrativen Rolle der musikalischen Parameter für die strukturelle Spannung von post-tonaler Musik erwartete und unerwartete Kombinationen von steigenden und fallenden Tendenzen sowohl innerhalb der Untergruppen der Teilnehmer (Expert*innen, Musik- und Kunststudierende) als auch innerhalb von Untergruppen der musikalischen Parameter (PP, SP) sowie zwischen Spannungs-Mittelwert- und PP/SP-Tendenzen.

Die beiden möglichen Antworten auf die erste Frage sind:

a) Es ergibt sich ein systematisch reguläres Bild über das ganze Werk hinweg, welches es ermöglicht, die Rolle der PP/SP eindeutig zu den Spannungsmittelwerten in Bezug zu setzen, als Bestätigung der Hypothese 1.

b) Es ergibt sich kein systematisch reguläres Bild in den Darstellungen; unerwartete Zusammenhänge werden erkannt und interpretiert. Einzelne Cluster, Clusterpaare, korrelierende Abschnitte oder größere Formabschnitte können allerdings interessante Muster aufweisen, was hier auch der Fall ist. Hypothese 1 ist daher teilweise bestätigt für einzelne Cluster und Teilnehmenden-Gruppen – Musik- und Kunststudierende zeigen dies in den näher untersuchten Clustern.

Die Hypothese 2, nach der saliente Veränderungen im Fluss der Zeit durch Spannungsmittelwerte global und lokal sowie durch musikalische Parameter nur lokal angezeigt werden und deutliche Regelmäßigkeiten aufzeigen, kann, wie die Abbildungen  10c–f zeigen, für den ersten Teil (Spannungsmittelwerte) bestätigt werden. Für den zweiten Teil (musikalische Parameter im COSM-Experiment) bestätigt sie sich hingegen nicht, da im Zuge der Höranalyse keine deutlichen Regelmäßigkeiten erkannt wurden. Bei sämtlichen Abbildungen handelt es sich um generalisierende und mehr oder weniger detaillierte ›Hörgeschichten‹.

Ausgehend von Abbildung 9 und Anhang 1e kann festgestellt werden, dass innerhalb der Cluster die Tendenzen der Spannungsmittelwerte in Teil A1, dem Beginn von A2 und Teil D eher steigend sind. Im weiteren Verlauf von A2, besonders in B und E, sind sie überwiegend fallend. Da in B und E die höchsten Spannungsmaxima-Mittelwerte erreicht werden (Abbildung, Anhang 1c und d), kann die fallende Tendenz damit erklärt werden, dass zum Zeitpunkt der Reaktion der Teilnehmenden (Anzeigen von Impulsen im COSM-Experiment) die Zeitverschiebung zwischen Ereignis und Reaktion sehr deutlich ist, weshalb der eigentliche Anstieg in den Clustern nicht erkennbar wird. Um dies zu überprüfen, wären die Spannungsmittelwerte um die Cluster herum separat zu untersuchen. Die fallende Tendenz könnte allerdings auch der Tatsache geschuldet sein, dass die im Experiment ermittelten Spannungsmittelwerte nur Start- und Endpunkte per Cluster berücksichtigen, nicht aber Maxima und Minima, die auch innerhalb der Cluster größere Extreme erreichen können. Letztere sind jedoch systematisch komplizierter zu erfassen. Schließlich könnte sie auch darauf zurückzuführen sein, dass viele Cluster (insbesondere die hier genauer betrachteten Cluster 19–26) zweiteilig sind: in der ersten Hälfte ein Spannungsabfall, dann ein kontrastives musikalisches Geschehen, das zu einem erneuten Spannungsanstieg führt. Hinzu kommt, dass sich der Spannungsverlauf in Cluster-Paaren oder in noch längeren Einheiten vollzieht, so dass die Tendenz nur einen Ausschnitt abbildet. Darüber hinaus ist zu betonen, dass es sich bei den Spannungsdaten nur um Mittelwerte handelt, die sich aus den individuellen Verläufen aller Teilnehmenden ergeben. Folglich wären auch individuelle Spannungsverläufe näher zu untersuchen.

Die Rolle der musikalischen Parameter bezüglich der musikalischen Spannungsmittelwerte in C21 und C22–23 kann anhand der zuvor gegebenen verbalen Beschreibung als durchaus korrelierend angesehen werden: in C21 sind die SP salienter durch klangfarblich-dynamische (geräuschhafte) Kulminations-Effekte des Schlagzeugs, und auch die Holzbläser erklingen kontrastiv, in hohem Register und mit Effekten wie dem Quasi-Glissando. Vermutlich drängen sie daher die PP (Tonhöhe, Rhythmus, Harmonie) in den Hintergrund. Überdies verlieren hier die Rockmusik-Rhythmen des Solo-Schlagzeugs durch Wiederholung an Salienz. Auch in C22 sind sämtliche SP mit steigender Tendenz vertreten. Erneut erklingen die sich verlangsamenden Blechbläserakkorde in mittlerem bis hohem Register, was vermutlich zu einer höheren Salienz der PP ›Tonhöhe‹ und ›Harmonie‹ führt. Hier scheint die charakteristische punktierte Rhythmusfigur, die sich aus der schnellen Pulsierung des Schlagzeugs herauskristallisiert, ebenfalls durch Wiederholung weniger salient zu sein. In C23 endet die sich beschleunigende Akkordpassage des Blechs (leise und mit leichtem crescendo), daher ist PP ›Harmonie‹ unverändert, während sich der PP ›Rhythmus‹ steigend und der PP ›Tonhöhe‹ fallend darstellen. Interessanterweise sind hier alle SP fallend, auch wenn in der zweiten Hälfte des Clusters schnelle Schläge der Großen Trommel kontrastierend einen vom Autor verbal beschriebenen erneuten Spannungsanstieg verursachen könnten, was sich aber nicht in den Spannungsmittelwerten bestätigt.

Bei empirisch-statistischen Mittelwert-Ergebnissen treten individuelle Hörstrategien in den Hintergrund. Es kommen nur besonders kumulierende Phänomene zum Tragen. Wenn im Extremfall die musikalische Struktur nur Neues bietet, also keine Variationszusammenhänge zum vorher Erklungenen erkennen lässt und die Frequenz von salienten Ereignissen zu dicht wird, hängt die Annahme eines Spannungsanstiegs bzw. -abfalls von den Voraussetzungen ab, die die Hörenden mitbringen: musikalisch erfahrene Personen finden vermutlich Metastrukturen, die ihrerseits Regelmäßigkeiten bieten können, wodurch sich die Interpretationsmöglichkeit als Narrativ erhöht. Musikalisch Unerfahrene hingegen geben an diesem Punkt vermutlich auf und zeigen einen Spannungsabfall an, so dass die Interpretationsmöglichkeit als Narrativ abnimmt. Bezüglich musikalischer Parameter kommt es hier vermutlich auf die Wiederholung (identisch oder variiert) von Salienz-Kombinationen im Vergleich zwischen den Clustern an, welche sich bei den Hörenden im Verlauf des Experiments als Strategie mehr oder weniger herausbilden können. Wenn Hörer*innen eines Teilnehmenden-Samples sich nur auf bestimmte Parameter konzentrieren, fallen die anderen Parameter aus den Ergebnissen heraus, was jedoch nicht bedeutet, dass die anderen Parameter nicht wirksam gewesen wären (siehe Theorieaspekte des COSM-Modells). Die Ergebnisse dieser Studie werden daher als Grad der Narrativität interpretiert, nicht als direkte (bzw. naturwissenschaftlich nachweisbare) Spannungs-Parameter-Korrelationen oder gar Ursache-Wirkungs-Phänomene.

Zusammenfassung

Resümierend lässt sich sagen, dass die Spannungsmittelwerte der unterschiedlichen Gruppen (Expert*innen, Musik- und Kunststudierende: E, M, K) in der globalen Tendenz ähnlich verlaufen. Hinsichtlich der verschiedenen Formabschnitte des Werkes ergeben sich jedoch auf der relativen vertikalen psychophysischen Intensitätsskala wechselnde signifikante Unterschiede, insbesondere gegen Ende des Werkes. Offenkundig sind Expert*innen sowie Musikstudierende mehr daran gewöhnt, Musik bis zum Ende mit Spannung zu verfolgen, als die meisten Kunststudierenden. Bezüglich der Parameter-Gruppierungen (PP, SP) sowie einer möglichen Rolle der musikalischen Parameter für die Wahrnehmung der musikalischen Spannung ergeben sich bis auf die Cluster 21–23 vor der Solokadenz in der Mitte des Werkes keine klaren Muster. Am deutlichsten stellt sich die Situation der musikalischen Parameter ‒ PP fallend, SP steigend ‒ im höchsten Spannungsmaximum (C21) vor der Solokadenz des Schlagzeugs dar. Das darauffolgende Cluster-Paar 22–23 ist bezüglich der SP kontrastiv: in C22 sind sämtliche SP steigend (allerdings negativ korrellierend mit der fallenden Tendenz der Spannungsmittelwerte aller Teilnehmer-Gruppen), in C23 fallend (diesmal korrelierend mit der Tendenz der Spannungsmittelwerte von zwei Teilnehmenden-Gruppen, siehe Abbildung 10e). Es ergeben sich in anderen Clustern keine klaren positiven Korrelationen zwischen Spannungsmittelwert- und musikalischen Parameter-Tendenzen. Dies spricht für die tatsächliche Variativität von Tüürs Musik und zeigt, dass ihr gegenüber unterschiedliche Hörstrategien möglich sind, welche im Rahmen dieser Untersuchung durch Mittelwerte eher künstlich im Sinne einer vermeintlich einheitlichen Tendenz zusammengezwungen wurden.

Nach Wilfried Gruhn[96] besteht eine Verbindung zwischen dem Rezeptionsvorgang – zwischen Wahrnehmen als physiologischer Perzeption und Verstehen als Kognition im Sinne eines bedeutungsgebenden, interpretatorischen Akts des Denkens, Verarbeitens, (Wieder-)Erkennens, Erinnerns und Verstehens ‒ sowie konnektionistischen Modellen (selbstorganisierender dynamischer neuronaler Netze) mit Hilfe narrativer Methoden (Erfinden einer Hörgeschichte) beim Finden von Zugängen zu musikalischen Hörerlebnissen. Gruhns Verbalisierung der Erkenntnisakte bei der Perzeption im Sinne von ›von etwas‹ und der Kognition im Sinne von ›als etwas‹ beinhaltet eine narrative Dimension. Es wird hierbei erkannt, dass etwas ist (als Ereignis, Impuls), dieses wird benannt als etwas (basierend auf schon vorhandenen Mustern und Erfahrungen). Mit COSM kann die Aufeinanderfolge solcher Ereignisse formalisiert und grafisch dargestellt werden.

Der holistische Ansatz der neuen kognitiv-empirischen Analyse-Methode COSM befindet sich in der ersten Phase, wenn die Musik ohne Unterbrechung bis zu Ende analysiert wird (Form als Ganzheit). Hierbei wird von der Ganzheitlichkeit des Systems Musik (Klang) bzw. der ›Musik als Umwelt‹ (System/Umwelt als Ganzheit) ausgegangen. In der zweiten Phase führt das vermutete ständige Zusammenwirken aller (hierbei ausgewählten acht) Parameter in jedem Moment (musikalisches Material als Ganzheit) zu einer holistischen Perzeption.

Da jede Grafik in der Wissenschaft auch verbal erklärt, erzählt und begründet wird und signifikante bzw. ausgewählte Elemente enthält, gelangt man unweigerlich auf die narrative Ebene. Auch wenn man bei musikalischer Spannung von Kulminationsdramaturgie spricht,[97] unterstützt dies die Analogie zur Narrativität im Sinne eines Plots, der sich in der musikalischen Form widerspiegelt. Wenn, wie in diesem Artikel, die Rolle musikalischer Parameter bei der Analyse musikalischer Spannung post-tonaler Musik untersucht wird, ist dies qua Terminus (interpretiert als Rolle) eine narrative Herangehensweise, die auf den Erwartungen der Hörenden (Hörstrategien) und Analysierenden (Hypothesen) z. B. bezüglich der primären und sekundären Parameter beruht.

Auch wenn COSM hauptsächlich nonverbal und über audiovisuelle Analogien funktioniert, wird es durch die Fokussierung auf ausgewählte musikalische Parameter im zweiten Schritt ebenfalls auf die verbale Ebene gehoben. Die Teilnehmenden des Experiments sollten eine Vorstellung von den musikalischen Parametern besitzen, die sie auf die wahrzunehmende Musik im Rahmen eines Wiedererkennungsprozesses anwenden können. Ein solcher Prozess führt seinerseits zu einer den selbstorganisierenden Lernprozess einschließenden kognitiven Strategie. Die musikalischen Parameter wurden im Verlauf des COSM-Experiments quantifiziert (in Daten umgewandelt). Danach musste das grafisch darstellbare Ergebnis verbalisiert werden, und es entstand eine entweder individuelle oder eine empirisch verallgemeinerbare Hörgeschichte einer Anzahl von Teilnehmenden. Somit kann das COSM als eine formalisierte und empirische Realisierung der Gruhn’schen narrativen Methode zum Verstehen des Hörerlebnisses verstanden werden.

Anmerkungen

1

Almén 2006, 1.

2

Der Text ist aus einem Teil der sich im Abschluss befindenden Doktorarbeit des Autors entwickelt, die er unter der Betreuung von Prof. Dr. Kerri Kotta an der Estnischen Akademie für Musik und Theater schreibt.

3

Lock/Kotta 2015.

4

Salienz bezeichnet in der Wahrnehmungspsychologie das Hervortreten von Merkmalen und kommt der Alltagsbedeutung von ›Auffälligkeit‹ nahe.

5

Neuwirth 2008, 558, 560, 562–564.

6

Lock 2017.

7

Meyer 1989; Snyder 2000.

8

Chouvel 2014.

9

Snyder 2000; Abbott 2002; Purwins/Herrera/Grachten/Hazan/Marxer/Serra 2008.

10

Ockelford 2009, empirisch getestet von Thorpe/Ockelford/Aksentijevic 2012.

11

Rohrmeier 2013.

12

Müller/Chew/Bello 2016, 148.

13

Clifton 2019.

14

Fu 2011.

15

Conklin 2006, 349; Tenkanen 2010, 16.

16

Bor 2009.

17

Addessi/Caterina 2000.

18

Guigue/de Paiva Santana 2018.

19

Diese Aspekte werden hier nur durch die Analyse eines einzigen Werkes eines konkreten Komponisten veranschaulicht, weshalb die Ergebnisse nicht verallgemeinert werden können; denn um verallgemeinerbare Aussagen zu erhalten, wären ein gesamtes Œuvre oder Beispiele einer Stilperiode empirisch zu untersuchen. Es gibt für post-tonale Musik bisher kaum Korpusstudien. Kirschbaum (2001) thematisiert zwar Werke zehn post-tonaler Komponisten mit unterschiedlichen Personalstilen (u. a. Anton Webern, Karlheinz Stockhausen, György Ligeti, Morton Feldman und Helmut Lachenmann), geht aber streng genommen nicht empirisch vor, da er keine Probanden einbezieht; Addessi und Caterina (2000) vergleichen die Musik von Darius Milhaud, Bruno Maderna und Webern, bei der sich jeweils eine Gradation von ›noch-tonalen‹ bis hin zur Abwesenheit tonaler Strukturen zeigt.

20

Im Sinne einer Aufeinanderfolge von Höhepunkten als »Zonen besonders gesteigerter Intensität« (auch »Attraktionspunkte« genannt), die »das Erfassen der Form im Gedächtnis unterstützen«. Dies wird von Martin Kirschbaum übergeordnet als Dramaturgie bezeichnet und des Weiteren als gleichbedeutend mit dem musikalischen Spannungsverlauf erachtet. Kirschbaum führt in diesem Zusammenhang die enge Beziehung zwischen Form und Dramaturgie in traditionellen Formen, z. B. der Sonatenform, an. Durch den Wegfall feststehender Formen seit dem 20. Jahrhundert kam es Kirschbaum zufolge zum Verlust einer solchen formimmanenten Dramaturgie, was ihn zur Analyse der Dramaturgie und des »formalen Spannungsverlaufes« in post-tonaler Musik anregte. Vgl. Kirschbaum 2001, 8 f.

21

Eitan/Granot 2009, 165.

22

Siehe einige der grundlegenden Publikationen aus dem Feld der kognitiven Musikwissenschaft, die auch explizit die Wahrnehmung von musikalischen Parametern untersuchen, wie z. B. Seifert 1993, 1999 und 2008; Lerdahl/Jackendoff 1983; Purwins/Herrera/Grachten/Hazan/Marxer/Serra 2008; Reybrouck 2010; Pearce/Rohrmeier 2012; Koelsch 2013.

23

Attentive listening; ›aufmerksam‹ bedeutet auch ›achtsam‹ und ›sorgfältig‹; vgl. Deliège/Mélen 1997, 388.

24

Chouvel 2014.

25

Rothbart 2004, xi.

26

Känd 2016.

27

Gruhn 1992.

28

Vgl. ebd.

29

Pressnitzer/McAdams/Winsberg/Fineberg 2000.

30

In einer Komposition sind die Werte der Parameter mehr oder weniger genau in der Partitur fixiert (präskriptiv). Vom Interpreten werden diese Werte entweder so exakt wie möglich oder mit improvisatorischer Freiheit zum Klingen gebracht. Die zu untersuchenden Zusammenhänge zwischen der Partitur und dem Erklingenden sind daher meistens approximativ.

31

Vgl. die Entwicklung interdisziplinärer konzeptueller und kognitiver Modelle bei Zbikowski 1997, 2002.

32

Ester/Kriegel/Xu 1996.

33

Dies wird seit den 1960er Jahren postuliert. Vgl. Bauer 2001, 38.

34

Wiggins 2010.

35

Ockelford 2009.

36

Auf den Umwelt-Aspekt bei der Wahrnehmung von Musik stützen sich auch Deliège/Mélen/Stammers/Cross 1996; Jensenius 2002 (mit dem Begriff Soundscape) und Reybrouck 2015. Dieser Vergleich ist sinnvoll, wenn man die Salienz von Klangparametern und somit den Akt der Analyse durch die Wahrnehmenden als universell-biologisch betrachtet (siehe auch Huron 2006). Wenn Musik und insbesondere der Stil bestimmter Komponistinnen und Komponisten für die Hörenden überwiegend unbekannt ist ‒ so auch die Musik von Erkki-Sven Tüür ‒ wird man beim Hören ähnlich herausgefordert, als wenn man sich in einer unbekannten Umwelt (natürlich, aber auch urban) bewegt und orientieren muss: in beiden Fällen ist man mit bekannten Parametern, aber auch unbekannten Kombinationen von Parametern konfrontiert. Darüber hinaus kann Musikwahrnehmung auch als erweitertes rechnergestütztes kognitives System (extended computational cognitive system) im Umweltkontext (ecological acoustics) betrachtet werden. Vgl. Kersten 2014.

37

Jensenius 2002; Lerdahl 1989, 2001.

38

Fu 2011.

39

Ebd., 1.

40

Lock 2010a und b.

41

Vgl. Koelsch/Siebel 2005, 579; Koelsch 2013, 90; Purwins/Herrera/Grachten/Hazan/Marxer/Serra 2008; .Abbott 2002, 12; Snyder 2000.

42

Vgl. Deliège/Mélen 1997.

43

Reybrouck 2010, 2015.

44

Meyer 1989; Snyder 2000.

45

Lehrdahl 2001, 143.

46

Eitan/Granot 2009, 143.

47

Lehrdahl 2001, 143.

48

Deliège/Mélen/Stammers/Cross 1996, 128.

49

Agawu 1982.

50

Kirschbaum 2001.

51

Lerdahl/Jackendoff 1983.

52

Lerdahl 1989, 2001.

53

Vines/Nuzzo/Levitin 2005; Mailman 2010.

54

Neuwirth 2008. Zu musikalischer Expektanz und Spannung in klassischer und Jazz-Harmonik vgl. Rohrmeier 2013, zur Erwartungssituation der performativen Analyse tonaler und post-tonaler Musik vgl. Utz 2013.

55

Huron 2006.

56

Eine Literaturübersicht bietet Teo 2020, 61–64.

57

Farbood 2006, 2012.

58

Pressnitzer/McAdams/Winsberg/Fineberg 2000 vor allem über Orchester-Timbres und psychoakustische Rauheit in post-tonaler Musik. Zur Rolle von Rauheit und Inharmonizität in der neurodynamischen Modellierung musikalischer Spannung s. Hadrava/Hlinka 2020.

59

Lerdahl/Krumhansl 2007.

60

Teo 2020.

61

Literaturübersichten siehe Granot/Eitan 2011, 219–221 und Farbood 2012, 387–391.

62

Juslin/Soboda 2010; Lehne/Koelsch 2015.

63

Lehne/Koelsch 2015, 3, 7.

64

Neuwirth 2008, 564.

65

Dahlhaus 2004, 326.

66

Ligeti 1966, 23 f.

67

Neuwirth 2008, 562 f.

68

Ebd.

69

Saupe/Wiedemann 2015.

70

Ebd.

71

Herman 2009.

72

Ebd., 79.

73

Gruhn 1992.

74

Ebd., 49.

75

Almén 2003, 12 f.

76

Kotta 2008, 2011.

77

Zu möglichen Ermüdungseffekten der Teilnehmenden aufgrund der langen Dauer sowohl der Musik wie auch des Experiments ist Folgendes festzuhalten: Da die Dauer des Experiments vom Teilnehmer selbst abhängt ‒ je nachdem, wie viele Impulse indiziert werden und wie detailliert die Parameter analysiert werden ‒, können keine generellen Vorgaben festgelegt werden. Es ist davon auszugehen, dass die Teilnehmenden entsprechend ihren persönlichen Dispositionen (z. B. Big-Five-Modell) mehr oder weniger intensiv reagieren und somit in der Lage sind, ihre Kräfte einzuteilen.

78

Kotta 2008, 2011.

79

Vgl. Lock 2010a, 65.

80

Lehne/Koelsch 2015, 3.

81

Primäre Parameter (PP): Tonhöhe, Rhythmus, Harmonie; Sekundäre Parameter (SP): Dynamik, Tempo, Instrumentation/Timbre, Faktur, Effekte.

82

Der TEDEA (Tension Design Apparatus) wurde 2011 von Gerhard Lock (Konzeption) und Hans-Gunter Lock (Software Max/MSP, Arduino, Hardware) entwickelt. http://www.schoenberg.ee/tension-design/tension-design.html (11.12.2020)

83

Eitan/Granot 2009.

84

Der Ausdruck ›kontinuierlich‹ ist technisch nicht ganz korrekt, da das Max/MSP-Programm slider controller-Daten nur alle 500 ms erfasst, und gleichbleibende Datenpunkte nicht mitgeschrieben werden aus Gründen der ökonomischeren Datenweiterverarbeitung.

85

Deliège/Mélen 1997, 388.

86

›Analytisches Hören‹ nach Eitan/Granot 2009 entspricht dem ›synthetischen Hören‹ nach Purwins/Herrera/Grachten/Hazan/Marxer/Serra 2008.

87

Es sind acht Parameter – PP: Tonhöhe, Rhythmus, Harmonie; SP: Dynamik, Tempo, Instrumentation/Klangfarbe, Faktur und Effekte ‒, die beinahe mit denen von Kirschbaum (2001) zusammenfallen. Allerdings betrachtet der Autor des vorliegenden Beitrags im Gegensatz zu Kirschbaum die Faktur von Instrumentation und Klangfarbe getrennt und unterteilt den Tonhöhen-Parameter nicht in die Unterkategorien Bewegung und Register, da diese im Kontext der Musikwahrnehmung kaum voneinander zu trennen sind. Eine solche Unterscheidung vermögen weder Amateur*innen noch Nicht-Musiker*innen zu leisten, sondern allein Expert*innen. Das Modell konzentriert sich daher eher auf die Unterschiedlichkeit der gewählten Parameter. Über Kontrast als einen separaten, zusammengesetzten Aspekt äußert sich ebenfalls Kirschbaum.

88

Albrecht 2012.

89

Vgl. Jensen 1979 und Libet 2004, 54 f.

90

Libet 2004.

91

Vgl. Koelsch/Siebel 2005, 570 sowie Koelsch 2013, 90.

92

Salienter bedeutet hier und des Weiteren, dass auf Basis der Ergebnisse mehr Parameter per Cluster auf der vertikalen Skala der Grafiken als steigend oder fallend dargestellt werden können.

93

Vgl. Kotta 2008, 2011.

94

Vgl. Kotta 2011, 104–108 und die dort präsentierten Modelle rhetorischer Formanalyse. Zum Prinzip der rhetorischen Rotation in der Sonatenform vgl. Hepokoski/Darcy 2006, 611.

95

Vgl. Lock 2010a, 2010b.

96

Gruhn 1992, 44 und 49.

97

U. a. Kirschbaum 2001.

Literatur

Agawu, Victor Kofi (1982), The Structural Highpoint as Determinant of Form in Nineteenth Century Music, Stanford: Stanford University Press.

Abbott, Alison (2002), »Music, Maestro, Please!«, Nature, Heft 416, 12–14.

Addessi, Anna Rita / Roberto Caterina (2000), »Perceptual Musical Analysis: Segmentation and Perception of Tension«, Musicae Scientiae 4/1, 31–54.

Addessi, Anna Rita (2010), »Auditive Analysis of the Quartetto per Archi in Due Tempi (1955) by Bruno Maderna«, Understanding Musical Structure and Form: Papers in Honour of Irène Deliège, 225–249.

Albrecht, Joshua (2012), Affective Analysis of Music Using the Progressive Exposure Method: The Influence of Bottom-Up Features on Perceived Musical Affect, Ph.D., The Ohio State University Columbus.

Almén, Byron (2003), »Narrative Archetypes: A Critique, Theory, and Method of Narrative Analysis«, Journal of Music Theory 47/1, 1–39.

Almén, Byron (2006), »Modes of Analysis«, Theory and Practice. Journal of the Music Theory Society of New York State 31, 1–38.

Bauer, Amy (2001), »›Composing the Sound Itself‹: Secondary Parameters and Structure in the Music of Ligeti«, Indiana Theory Review 22/1, 37–64.

Bor, Mustafa (2009), Contour Reduction Algorithms: A Theory of Pitch and Duration Hierarchies for Post-Tonal Music, Ph.D., The University of British Columbia Vancouver.

Burrows, David (1997), »A Dynamical Systems Perspective on Music«, The Journal of Musicology 15/4, 529–545.

Chouvel, Jean-Marc (2014), »Categories and Representation in Musical Analysis«, Sonus 35/1, 17–35.

Clifton, Christopher (2019), »Data Mining«, in: Encyclopaedia Britannica. https://www.britannica.com/technology/data-mining (11.12.2020)

Conklin, Darell (2006), »Melodic Analysis with Segment Classes«, Machine Learning 65/2–3, 349–360.

Dahlhaus, Carl (2004), »Wagners dramatisch-musikalischer Formbegriff«, in: ders., Gesammelte Schriften, hg. von Hermann Danuser in Verbindung mit Hans-Joachim Hinrichsen und Tobias Plebuch, Bd. 7, Laaber: Laaber, 322–332.

Deliège, Irène / Marc Mélen (1997), »Cue Abstraction in the Representation of Musical Form«, in: Perception and Cognition of Music, hg. von Irène Deliège und John Sloboda, New York: Psychology Press, 387–412.

Deliège, Irène / Marc Mélen / Diana Stammers / Ian Cross (1996), »Musical Schemata in Real-Time Listening to a Piece of Music«, Music Perception 14/2, 117–159.

Eitan, Zohar / Roni Y. Granot (2009), »Primary Versus Secondary Musical Parameters and the Classification of Melodic Motives«, Musicae Scientiae Discussion Forum 48, 139–179.

Ester, Martin / Hans-Peter Kriegel / Jörg Sander / Xiaowei Xu (1996), »A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise«, Proceedings of the 2nd International Conference on Knowledge Discovery and Data Mining (KDD-96), Palo Alto: AAAI Press, 226–231.

Farbood, Morwaread M. (2006), A Quantitative, Parametric Model of Musical Tension, Ph.D., Cambridge (MA): MIT Press.

Farbood, Morwaread M. (2012), »A Parametric, Temporal Model of Musical Tension«, Music Perception 29/4, 387–428. https://doi.org/10.1525/mp.2012.29.4.387 (11.12.2020)

Fu, Tak-chung (2011), »A Review on Time Series Data Mining«, Engineering Applications of Artificial Intelligence 24, 164–181.

Gabrielson, Alf (2002), »Emotion Perceived and Emotion Felt: Same or Different?«, Musicae Scientiae 5/1, 123–147.

Granot, Roni Y. / Zohar Eitan (2011), »Musical Tension and the Interaction of Dynamic Auditory Parameters«, Music Perception 28/3, 219–245. https://doi.org/10.1525/mp.2011.28.3.219 (11.12.2020)

Gruhn, Wilfried (1992), »Wahrnehmen und Verstehen. Kognitive Grundlagen der Repräsentation musikalischer Elemente und Strukturen. Entwurf zu einem Forschungsprogramm«, in: Musikalische Erfahrung. Wahrnehmen, Erkennen, Aneignen, hg. von Hermann J. Kaiser, Essen: Die Blaue Eule.

Guigue, Didier / Charles de Paiva Santana (2018), »The Structural Function of Musical Texture: Towards a Computer-Assisted Analysis of Orchestration«, Journées d’Informatique Musicale (JIM 2018), 97–103. https://hal.archives-ouvertes.fr/hal-01791398 (11.12.2020)

Hadrava, Michal / Jaroslav Hlinka (2020), »A Dynamical Systems Approach to Spectral Music: Modeling the Role of Roughness and Inharmonicity in Perception of Musical Tension«, in: Frontiers in Applied Mathematics and Statistics 6, 1–14, https://doi.org/10.3389/fams.2020.00018 (20.12.2020)

Herman, David (2009), »Cognitive Approaches to Narrative Analysis«, in: Cognitive Poetics: Goals, Gains and Gaps, hg. von Geert Brône und Jeroen Vandaele, Berlin: Mouton de Gruyter, 79–118.

Hepokoski, James / Warren Darcy (2006), Elements of Sonata Theory: Norms, Types, and Deformations in the Late-Eighteenth-Century Sonata, Oxford: Oxford University Press.

Huron, David (2006), Sweet Anticipation. Music and the Psychology of Expectation, Cambridge (MA): MIT Press.

Jensen, Arthur (1979), »g: Outmoded Theory of Unconquered Frontier«, Creative Science and Technology 2, 16–29.

Jensenius, Alexander Refsum (2002), How Do We Recognize a Song in One Second. The Importance of Salience and Sound in Music Perception, Master of Arts, Music Technology Department of Music and Theatre University of Oslo.

Juslin, Patrik N. / John A. Sloboda (2010), Handbook of Music and Emotion: Theory, Research, Applications, Oxford: Oxford University Press.

Kallinen, Kari (2006), Towards a Comprehensive Theory of Musical Emotions. A Multidimensional Research Approach and Some Empirical Findings, Ph.D, University of Jyväskylä, Jyväskylä: University of Jyväskylä.

Kallinen, Kari / Niklas Ravaja (2006), »Emotion Perceived and Emotion Felt: Same and Different«, Musicae Scientiae 10, 191–213.

Kersten, Luke (2014), »Music and Cognitive Extension«, Empirical Musicology Review 9, 193–202.

Kirschbaum, Martin (2001), Höhepunktbildung und Dramaturgie in Neuer Musik. Die Erstellung »formaler Spannungsverläufe« als Ergänzung der musikalischen Analyse, Köln: Dohr.

Koelsch, Stefan (2013), Brain and Music, Oxford: Willey-Blackwill.

Koelsch, Stefan / Walter A. Siebel (2005), »Towards a Neural Basis of Music Perception«, Trends in Cognitive Sciences 9, 578–584. https://doi.org/10.1016/j.tics.2005.10.001 (11.12.2020)

Kotta, Kerri (2008), »Zur musikalischen Zeit: Über die formalen Grundlagen der Werke von Erkki-Sven Tüür – ein Beschreibungsversuch«, in: Schwarze Milch und bunte Steine. Der Komponist Erkki-Sven Tüür, hg. von Hans-Klaus Jungheinrich, Mainz: Schott, 23–38.

Kotta, Kerri (2011), »Classical Formal Archetypes in Selected Works by Erkki-Sven Tüür«, Lietuvos muzikologija [Lituanian musicology] 12, 102–110.

Känd, Elisa Johanna (2016), Narratiivsuse ja pinge taju valitud »Valtari Mystery Film Experiment« audiovisuaalteostes (Perception of Narrativity and Tension in Chosen Audiovisual Works of the »Valtari Mystery Film Experiment«), Audiovisual Media Bachelor, Tallinn University.

Lehne, Moritz / Stefan Koelsch (2015), »Towards a General Psychological Model of Tension and Suspense«, Frontiers in Psychology 6, 1–11. https://doi.org/10.3389/fpsyg.2015.00079 (11.12.2020)

Lerdahl, Fred (1989), »Atonal Prologational Structure«, Contemporary Music Review 4, 65–87.

Lerdahl, Fred (2001), Tonal Pitch Space, Oxford: Oxford University Press.

Lerdahl, Fred / Carol Krumhansl (2007), »Modelling Tonal Tension«, Music Perception 24/4, 329–366.

Lerdahl, Fred / Ray Jackendoff (1983), A Generative Theory of Tonal Music, Cambridge (MA): MIT Press.

Libet, Benjamin (2004), Mind Time. The Temporal Factor in Consciousness, Cambridge (MA): Harvard University Press.

Libet, Benjamin / Elwood W. Wright Jr. / Bertram Feinstein / Dennis K. Pearl (1979), »Subjective Referral of the Timing for a Conscious Sensory Experience – a Functional Role for the Somatosensory Specific Projection System in Man«, Brain 102, 193–224. https://doi.org/10.1093/brain/102.1.193 (11.12.2020)

Ligeti, György (1966), »Über Form in der Neuen Musik«, in: Form in der Neuen Musik, hg. von Ernst Thomas, Darmstadt: Schott’s Söhne, 23–35.

Lock, Gerhard (2010a), »Muusikalist pinget mõjutavad tegurid ja nende tajumine Erkki-Sven Tüüri teoses Oxymoron« [On Factors Influencing Musical Tension and its Perception in Erkki-Sven Tüür’s piece »Oxymoron«], Res musica 2, 63−74.

Lock, Gerhard (2010b), »Tension Design Analysis as Listening Analysis Strategy for Contemporary Music: Perception of Tension in Contemporary Post-Tonal Orchestral Music: a Case Study«, Poster-Präsentation bei der 11th International Conference on Music Perception and Cognition (ICMPC11), 23.–27. August 2011, Seattle (WA). http://depts.washington.edu/icmpc11/ (11.12.2020)

Lock, Gerhard (2017), »Models and Scientific Modelling in Music Context«, Problems in Music Pedagogy 16/2, 25−45. http://pmp.du.lv/wp-content/uploads/2016/08/PMP_2017_Vol-16-2.pdf (11.12.2020)

Lock, Gerhard / Kerri Kotta (2012), »Musical Tension as a Response to Musical Form«, in: Proceedings of the »12th International Conference on Music Perception and Cognition« (ICMPC) / »8th Triennial Conference of the European Society for the Cognitive Sciences of Music« (ESCOM), Thessaloniki: Aristotle University of Thessaloniki, 612–617. http://icmpc-escom2012.web.auth.gr/ (11.12.2020)

Lock, Gerhard / Kerri Kotta (2015), »A Preliminary Cognitive Model of Musical Tension in Contemporary Orchestral Music«, Paper-Präsentation bei der 12th international Music Analysis and Theory Conference, 24.–27. September 2015, Istituto Superiore di Studi Musicali »G. Lettimi«, Rimini.

Mailman, Joshua B. (2010), Temporal Dynamic Form in Music: Atonal, Tonal, and Other, Ph.D., University of Rochester.

Meyer, Leonard B. (1989), Style and Music. Theory, History, and Ideology, Chicago (IL): University of Chicago Press.

Müller, Meinard / Elaine Chew / Juan Pablo Bello (2016), »Computational Music Structure Analysis«, Dagstuhl Reports 6/2, 147–190. http://www.dagstuhl.de/16092 (11.12.2020)

Neuwirth, Markus (2008), »Das Konzept der Expektanz in der musikalischen Analyse: Möglichkeiten und Probleme einer kognitiv orientierten Musikanalyse«, in: Musiktheorie im Kontext. 5. Kongress der Gesellschaft für Musiktheorie Hamburg 2005, hg. von Jan Philipp Sprick, Reinhard Bahr und Michael von Troschke, Berlin: Weidler, 557–573.

Ockelford, Adam (2009), »Zygonic Theory: Introduction, Scope, and Prospects«, Zeitschrift der Gesellschaft für Musiktheorie 6/1, 91–172.

Pearce, Marcus / Martin Rohrmeier (2012), »Music Cognition and the Cognitive Sciences«, Topics in Cognitive Science 4, 468–484. https://doi.org/10.1111/j.1756-8765.2012.01226.x (11.12.2020)

Pressnitzer, Daniel / Stephen McAdams / Suzann Winsberg / Joshua Fineberg (2000), »Perception of Musical Tension for Nontonal Orchestral Timbres and its Relation to Psychoacoustic Roughness«, Perception & Psychophysics 22, 66–80.

Purwins, Hendrik / Perfecto Herrera / Maarten Grachten / Amaury Hazan / Ricard Marxer / Xavier Serra (2008), »Computational Models of Music Perception and Cognition I: The Perceptual and Cognitive Processing Chain«, Physics of Life Reviews 5, 151–168. https://doi.org/10.1016/j.plrev.2008.03.004 (11.12.2020)

Reybrouck, Mark (2010), »Music Cognition and Real-Time Listening: Denotation, Cue Abstraction, Route Description and Cognitive Maps«, Musicae Scientiae 14/2, 187–202.

Reybrouck, Mark (2015), »Music as Environment: An Ecological and Biosemiotic Approach«, Behavioral Sciences 5, 1–26. https://doi.org/10.3390/bs5010001 (11.12.2020)

Rohrmeier, Martin (2013), »Musical Expectancy – Bridging Music Theory, Cognitive and Computational Approaches«, Zeitschrift der Gesellschaft für Musiktheorie 10/2, 343–371. https://doi.org/10.31751/724 (11.12.2020)

Rothbart, Daniel (Hg.) (2004), Modeling: Gateway to the Unknown. A Work by Rom Harré, Amsterdam: Elsevier.

Saupe, Achim / Felix Wiedemann (2015), »Narration und Narratologie. Erzähltheorien in der Geschichtswissenschaft«, in: Docupedia-Zeitgeschichte, hg. vom Zentrum für zeithistorische Forschung Potsdam, Institut der Leibniz-Gemeinschaft, Version 1.0. http://dx.doi.org/10.14765/zzf.dok.2.580.v1 (11.12.2020)

Seifert, Uwe (1993), Systematische Musiktheorie und Kognitionswissenschaft – Zur Grundlegung der kognitiven Musikwissenschaft, Bonn: Verlag für systematische Musikwissenschaft.

Seifert, Uwe (1999), Systematische Musiktheorie als Kognitionswissenschaft – Modellbildung und Computersimulation kognitiver Prozesse in der Geisteswissenschaft, Habil., Universität Hamburg.

Seifert, Uwe (2008), »Kognitive Musikwissenschaft, Systematische Musiktheorie und die Frage ›Quid sit musica?‹«, in: Musiktheorie im Kontext. 5. Kongress der Gesellschaft für Musiktheorie Hamburg 2005, hg. von Jan Philipp Sprick, Reinhard Bahr und Michael von Troschke, Berlin: Weidler, 509–526.

Snyder, Bob (2000), Music and Memory. An Introdruction, Cambridge (MA): MIT Press.

Tenkanen, Atte (2010), Comparison Structure Analysis, Ph.D., University of Turku.

Teo, Yvonne (2020), »Measuring Harmonic Tension in Post-Tonal Repertoire«, Empirical Musicology Review 15, 61–104. https://doi.org/10.18061/emr.v15i1-2.6994 (11.12.2020)

Thorpe, Michael / Adam Ockelford / Aleksandar Aksentijevic (2012), »An Empirical Exploration of the Zygonic Model of Expectation in Music«, Psychology of Music 40/4, 429–470. https://doi.org/10.1177/0305735610392103 (11.12.2020)

Utz, Christian (2013), »Das zweifelnde Gehör. Erwartungssituationen als Module im Rahmen einer performativen Analyse tonaler und posttonaler Musik«, Zeitschrift der Gesellschaft für Musiktheorie 10/2, 225–257. https://doi.org/10.31751/720 (11.12.2020)

Vicario, Giovanni Bruno (2003), »Prolegomena to the Perceptual Study of Sounds«, in: The Sounding Object, hg. von Davide Rocchesso und Federico Fontana, Firenze: Edizioni di Mondo Estremo, 17–31.

Vines, Bradley W. / Regina L. Nuzzo / Daniel J. Levitin (2005), »Analyzing Temporal Dynamics in Music: Differential Calculus, Physics, and Functional Data Analysis Techniques«, Music Perception 23, 137–152.

Wiggins, Geraint A. (2010), »Cue Abstraction, Paradigmatic Analysis and Information Dynamics: Towards Music Analysis by Cognitive Model«, Musicae Scientiae 14/2, 307–331.

Zbikowski, Lawrence M. (1997), »Conceptual Models and Cross-Domain Mapping: New Perspectives on Theories of Music and Hierarchy«, Journal of Music Theory 41/2, 193–225.

Zbikowski, Lawrence M. (2002), Conceptualizing Music: Cognitive Structure, Theory, and Analysis, Oxford: Oxford University Press.

Dieser Text erscheint im Open Access und ist lizenziert unter einer Creative Commons Namensnennung 4.0 International Lizenz.

This is an open access article licensed under a Creative Commons Attribution 4.0 International License.