Einleitung
Auf unserem Weg in eine Wissensgesellschaft wird
Information zum strategischen Rohstoff, Wissen
zum wichtigsten Produktionsfaktor. Die neuen Informations-
und Kommunikationsmedien machen
das globale Gesamtwissen an jedem Ort und zu jeder
Zeit verfügbar – sie schaffen eine beispiellose
Fülle an Daten und Informationen. Die Fähigkeit,
Informationen zu selektieren, zu nutzen und Wissen
zu systematisieren wird damit zu der Schlüsselqualifikation
in der Informationsgesellschaft.1) Mit
diesen Worten begrüßt die Initiative Bildungswege
in die Informationsgesellschaft (BIG) die Besucher
ihrer Homepage und greift damit die Thematik
auf, die uns nahezu tagtäglich von Politikern,
Journalisten und Vertretern der Wirtschaft in den
Medien ins Bewusstsein gerufen wird: Unser Leben
im Zeitalter des Computers wird mehr denn
je von Informationen bestimmt. Die Fähigkeit,
rele vante Informationen aufzufinden, sie von weniger
relevanten zu trennen und die Resultate in
geeigneter Weise zu nutzen, bestimmt den Alltag
in vielen Branchen. So verwundert es auch nicht,
dass als Konsequenz aus dieser Einsicht zunehmend
Schulen vernetzt und Schüler mit Notebooks
ausgerüstet werden, um im Fachunterricht
mithilfe geeigneter didaktisch-methodischer Konzepte
grundlegende Fertigkeiten in der so genannten
„Schlüsselqualifikation" zu erwerben. Je mehr
die Beschaffung von Informationen aber an Bedeutung
gewinnt, desto wichtiger wird gleichzeitig das
Wissen darüber, welche Daten überhaupt zur Verfügung
stehen und wie diese für die Verarbeitung
durch die Informationstechnologien aufbereitet
werden. Die nach wie vor verbreitete Vorstellung,
mit Computer und Zugang zum Internet könne der
Anwender über jede erdenkliche Information verfügen
oder gar aus einem „globalen Gesamtwissen"
schöpfen, sollte sich auf diese Weise zumindest
teilweise relativieren lassen.
Gerade im Bezug auf Musik und Musikwissenschaft
trifft man bei genauerer Betrachtung der tatsächlich
zur Verfügung stehenden Informationen
auf eine recht ambivalente Situation. Einerseits
lassen sich unzählige Musikstücke aus sämtlichen
Sparten sowie eine ansehnliche Zahl an Texten
und bibliografischen Informationen über Musik
auffinden, aber andererseits bleiben gleichzeitig
viele Informationen auch unauffindbar bzw. können
zurzeit noch nicht in angemessener Weise über
das Internet bereitgestellt werden. Diese Tatsache
hängt unmittelbar mit der besonderen Stellung
der Musik als hochkomplexe nonverbale Kommunikationsform
zusammen, deren vielschichtige
Informationsebenen mit den aktuellen Recherchemöglichkeiten
des Internet nur sehr bedingt in
Einklang gebracht werden können. Aufgrund der
zahlreichen Aspekte, unter denen Musik betrachtet
werden kann, herrscht eine nahezu unüberschaubare
Zahl an häufig inkompatiblen Datenformaten,
welche die globale Bereitstellung der darin verborgenen
Informationen erschweren. Zwar werden für
jedes Format geeignete Verarbeitungsalgorithmen
angeboten, doch kommen diese oft nur lokal oder
auf lokalen Datenmengen zum Einsatz, sodass sich
zwangsläufig viele voneinander isolierte „Dateninseln"
bilden, welche dem aus Sicht des Anwenders
wünschenswerten Ziel einer vereinheitlichten globalen
Infrastruktur entgegenstehen. Bevor diese
Aspekte jedoch näher beleuchtet werden, scheint
es sinnvoll, zunächst den Begriff Information zu
definieren und ihn von häufig synonym verwandten
Wörtern abzugrenzen.
Was sind Informationen?
Der Informationsbegriff ist einer der unklarsten
und doch heute einer der am häufigsten sowohl
in der Wissenschaft als auch in der Öffentlichkeit
verwendeten Begriffe. Oft bleibt zum Beispiel unklar,
wo Information eigentlich entsteht: in den
Köpfen der Menschen, in der Sprache oder in der
Welt sonst?2) Tatsächlich gibt es heute zahlreiche,
mehr oder weniger stark voneinander abweichende
Definitionen des Informationsbegriffs. Sie erstrecken
sich von sehr differenzierten Erklärungen bis
hin zu der groben und gleichermaßen unbefriedigenden
Generalisierung „alles ist Information".
Häufig taucht dieser Begriff aber nicht isoliert
auf, sondern wird in Verbindung mit den ebenso
selbstverständlich gewordenen Schlagwörtern Daten
und Wissen verwendet. Mangels eindeutiger
Abgrenzungen herrscht dann in vielen Äußerungen
und Aufsätzen ein häufig zur weiteren Verwirrung
beitragendes Durcheinander hinsichtlich der Begrifflichkeiten.
Eine recht gebräuchliche und durchaus nachvollziehbare
Definition des Begriffstrios basiert
auf einem schrittweisen aufbauenden Ansatz: Die
unterste Ebene der Begriffshierarchie bilden die
Daten. Jede Form von Zahlen-, Zeichen-oder
Sym bolfolgen, welche zunächst keinerlei Bedeutung
tragen müssen, werden diesem Begriff zugeordnet.
Während Daten isoliert auf Datenträgern
abgelegt werden können, erfordern Informationen
eine Kommunikation zwischen mindestens
zwei Parteien: Ein „Sender" übermittelt Daten
an einen „Empfänger". Kann der Empfänger den
Daten während oder nach der Transmission eine
Semantik entnehmen, so gewinnt er daraus Informationen.
Voraussetzung für diesen Austausch
ist zweifellos die Einigung auf eine gemeinsame
Kommunikationsbasis, ohne die die übermittelten
Daten letztlich unverständlich bleiben. Dies gilt
nicht nur für den Informationsaustausch zwischen
Menschen, sondern lässt sich gleichermaßen auf
den Computer übertragen: Eine MP3-Datei besitzt
nur aus Sicht eines geeigneten Decoders informativen
Charakter; jedes Bildverarbeitungsprogramm
scheitert beim Versuch, die Datei in eine grafische
Darstellung zu überführen.
Die Auseinandersetzung mit neu gewonnenen
Informationen sowie deren Interpretation führt
schließlich zu erweitertem Wissen3), welches in
hohem Maße subjektiver Natur ist und laut den
Ausführungen in der Literatur bis heute dem Menschen
und einigen Tierarten vorbehalten bleibt. Ein
zentrales Merkmal des Wissens besteht darin, dass
es als Folge der menschlichen Informationsverarbeitung
u. a. durch Abstraktion, Kombination und
Reorganisation bereits existenter Strukturen im
Kopf des Individuums entsteht. Ein globales, alles
individuelle Teilwissen vereinendes Gesamtwissen,
wie es in den eingangs zitierten Sätzen postuliert
wurde, kann auf dieser Definitionsgrundlage
nicht existieren. Auch objektives Wissen, welches
im Sinne Karl Poppers intersubjektiven Prüfungen
standhält3), dürfte sich weltweit nur in beschränktem
Maße nachweisen lassen.
Musikinformationen
Der zentrale Unterschied zwischen Daten und Informationen
besteht also darin, dass letztere eine
semantische Komponente besitzen. Nun stellt
sich die Frage, welche im Internet vorhandenen
Daten sich als Musikinformationen deuten lassen.
Auch der Begriff Musikinformation ist aus Sicht
der Musikwissenschaft recht vage und keinesfalls
eindeutig erklärt. So könnte man sich fragen, ob
etwa das Geburtsdatum Beethovens bereits eine
Musikinformation darstellt oder ob dies nicht eher
als relativ neutrale historische Zahl zu werten ist.
Bedeutet die Verbindung eines Datums zu einem
Musiker oder Komponisten automatisch, dass
die ses als originär musikspezifische Auskunft betrachtet
werden muss? Natürlich nicht. Informationen
werden in ihrer Kategorisierung maßgeblich
von dem Kontext bestimmt, aus dem sie beleuchtet
werden. Demzufolge verwischen die künstlichen
Grenzen zwischen sprachlich und organisatorisch
klar voneinander getrennten Fachgebieten. Eine
eindeutige fachliche Zuordnung vieler Informationen
ist prinzipiell nicht zu leisten. Dennoch
dürften u. a. elementare biografische Komponisteninformationen
überwiegend von Musikern und
Musikwissenschaftlern benötigt sowie von den
meisten Menschen dem musikalischen Umfeld
zugeordnet werden, sodass die Aufnahme dieser
Informationen in Musikdatenbanken durchaus
nach vollziehbar ist.
Die Frage nach Berücksichtigung einer historischen
Information in einer Musikdatenbank mag
für die konkrete Realisierung eines entsprechenden
Projekts von nicht unerheblicher Bedeutung
sein, aus übergeordneter Sicht erscheint sie jedoch
als eher marginal. Wenn von Musikinformationen
die Rede ist, stellen wir uns darunter unabhängig
vom konkreten Inhalt zunächst oft kürzere Aufsätze,
ganze Bücher oder auch bibliografische
Auskünfte zum Auffinden gesuchter Informationen
vor. In diesen Fällen werden die gewonnenen Erfahrungen
mit den bewährten Publikationsformen,
wie Bücher, Zeitschriften bzw. Bibliografien, auf
das elektronische Medium übertragen. Tatsächlich
wagen immer mehr Verlage den Schritt ins
Internet und bieten dort einen mehr oder weniger
tiefen Einblick in ihr Programm. Neben den klassischen
Buchverlagen, deren Schwerpunkt auf dem
Vertrieb gedruckter Bücher und Zeitschriften liegt,
entstehen zunehmend reine Internet-Verlage, die
ihre Aufgabe primär darin sehen, ihre Publikationen
in elektronischer Form anzubieten. Durch
die Einsparung vieler personeller und technischer
Zwischenschritte, die zur Herstellung der Druckfassungen
erforderlich sind, erreichen die elektronischen
Versionen oft ein früheres Publikationsdatum
und besitzen damit größere Aktualität. Etwaige
Fehler können unmittelbar ohne Neuauflage
gekennzeichnet und verbessert werden. Darüber
hinaus erreicht der Anbieter bei einer Distribution
über das Internet sofort ein breites internationales
Publikum. Gleichzeitig bringt diese Art der Veröffentlichung
aber auch Schwierigkeiten mit sich. So
müssen nicht nur bei Texten aus dem wissenschaftlichen
Umfeld sowohl Fragen bezüglich Permanenz
und Zitierfähigkeit der Dokumente als auch
solche zum Urheberschutz geklärt werden.
Mit dem Begriff Internet wird heute üblicherweise
das World Wide Web assoziiert, also jener
Dienst, zu dem der Nutzer mithilfe eines Browsers
Zugang erlangt. Nicht zuletzt die Vereinigung von
Texten, Bildern und Klängen unter einer Oberfläche,
gepaart mit der Möglichkeit, verschiedenste
lokale oder entfernte Dokumente via Hyperlinks
zu referenzieren, trug deutlich zur allgemeinen
Attraktivitätssteigerung des Internet bei. Das zur
Beschreibung der Web-Seiten eingesetzte, primär
für die Bildschirmdarstellung entworfene Standardformat
HTML eignet sich jedoch nur bedingt
zur Speicherung von strukturierten Dokumenten.
So bietet es z. B. nur marginale Gliederungs- bzw.
Formatierungsanweisungen und ferner beeinflusst
die Breite des Browserfensters, anders als etwa
von Textverarbeitungen gewohnt, den Zeilenumbruch.
Auch Seiten im Sinne eines Buches sind
nicht vorgesehen; entsprechend unzureichend fallen
damit ebenso die Konvertierungsmöglichkeiten
zwischen seitenorientierten Dateiformaten und
HTML aus.
Einige Internet-Verlage, wie beispielsweise
der im Aufbau befindliche Verlag epOs Music der
Universität Osnabrück5), bieten manuell nach Vorlage
der Druckfassung paginierte HTML-Seiten
sämtlicher Bücher an, um einerseits eine schnelle
Volltextsuche realisieren und andererseits eine seitenweise
zitierfähige Online-Version anbieten zu
können. Die alternativ erhältlichen und vollständig
mit dem Druck identischen PDF-Dateien6) eignen
sich aufgrund ihrer Größe weniger zum schnellen
Überfliegen des Inhalts, erfüllen aber bezüglich
der Wiedergabe eines rechnerübergreifend konsistenten
Layouts die gewünschten Anforderungen.
Seine offene Spezifikation sowie die an keinerlei
Lizenzgebühren gebundene Nutzung und Unterstützung
tragen entscheidend zur beobachtbaren
steigenden Verbreitung des Portable Document
Formats bei. Ebenso zwingt Adobe dem potenziellen
Nutzer keine teure proprietäre Anwendung zur
Generierung der Dateien auf. Mit Ghostscript7) und
(pdf) LaTeX8) stehen beispielsweise zwei kostenlose
Programme zur Erzeugung von PDF-Dateien
bereit. Die beiden plattformunabhängigen Formate
HTML und PDF bilden zurzeit die meistgenutzte
Grundlage zur Verbreitung textbezogener Informationen
im Internet. Dabei ergänzen sie sich
gegenseitig durch ihre jeweils charakteristischen
Eigenschaften.
Mindestens ebenso wichtig wie die Bereitstellung
von Informationen ist ihr schnelles Auffinden
im Internet. Ohne geeignete Suchmöglichkeiten
bleibt jede ungeordnete, heterogene Ansammlung
von Daten nahezu wertlos, denn das manuelle Heraussuchen
der aktuell relevanten Informationen
kann mit beschränktem Zeitaufwand so gut wie
nicht geleistet werden. Die zentralen Hilfsmittel
bei der Fahndung nach relevanten Informationen
aus einer unüberschaubaren Datenmenge sind im
Bezug auf Internet und Datenbanken zweifellos
die Suchmaschinen, deren Aufgabe darin besteht,
eine indizierte Datenmenge – im Falle des Internet
besteht diese üblicherweise aus einer Auswahl
tatsächlich aktiver Webseiten und darin verlinkter
Dokumente – nach Textausschnitten oder Regulären
Ausdrücken9) zu durchsuchen und die Treffer
nach diversen Ranking-Kriterien entsprechend
vorsortiert auszugeben. Auch wenn Suchmaschinen
wie Google regelmäßig eine Vielzahl der aktuell
zugänglichen Daten indizieren, muss sich
der Recherchierende dennoch im Klaren darüber
sein, dass ein nicht unerheblicher Teil der unter
Umständen relevanten Seiten aus verschiedenen
Gründen von den Indizierungsalgorithmen übersehen
oder als irrelevant verworfen wird. Nicht
auffindbare Informationen unterscheiden sich von
nicht vorhandenen aber nur graduell und sind damit
im Allgemeinen wertlos. Folglich bemühen
sich private, wissenschaftliche und kommerzielle
Anbieter, ihre Webseiten als hochrangige Treffer in
den Datenbanken möglichst vieler stark frequentierter
Suchmaschinen unterzubringen. Da dies
für Informationen aller Qualitätsstufen in nahezu
sämtlichen Fachgebieten angestrebt wird, stellt
sich die individuelle Suche aus Sicht des Anwenders
mitunter als recht frustrierend bzw. wenig
ergiebig heraus, denn inhaltlich betrachtet haben
die zuoberst gelisteten Suchergebnisse oft wenig
gemein. Die Erwartungen der Anwender an den
tat sächlichen Informationsgehalt der Suchresultate
können allerdings stark differieren, sodass die Betreiber
der Suchdienste eine generelle Qualitätsgarantie
nur schwer zusichern können.
Ein generelles Problem bei der Suche nach
Textdokumenten bleibt dennoch die Tatsache, dass
die Zieldokumente in aller Regel lediglich auf das
Vorkommen der eingegebenen syntaktischen Suchmuster
beschränkt bleiben. Die darin ausgedrückte
Semantik wird üblicherweise nicht berücksichtigt
und so produzieren Suchanfragen wie „Musik in
der Natur" und „Natur in der Musik" ohne weitere
Angaben trotz unterschiedlicher Bedeutung dieselben
Ergebnisse. Durch semantische Analysen der
Suchanfragen versuchen Datenbankspezialisten
und Computerlinguisten die Qualität der Resultate
zu verbessern. Ein Produkt solcher Forschungsarbeiten
stellt unter anderem das Osnabrück Intelligent
Research Information System (OSIRIS)
dar10), mit dessen Hilfe Datenbestände auf natürlichsprachliche
Eingaben hin durchsucht werden können.
Musikimmanente Informationen
Schriftliche Musikinformationen, die mithilfe von Suchmaschinen wie Google aufgefunden werden können, stellen eine wichtigen Bestandteil musikbezogener Informationen dar. Viele musikalische Aspekte, analytische Ergebnisse oder auch historische Fakten können bislang nur beschreibend in textueller Form verbreitet werden. Dennoch existieren jenseits der Fakten über Musik ebenso musikimmanente Informationen, Informationen also, welche die Musik selbst vermittelt. Sie besitzt ein vielfach geschichtetes Informationspotenzial, welches die Grundlage jeglicher konstruktiven Auseinandersetzung mit Musik bildet und Ausgangspunkt für die meisten Aufsätze über Musik ist. Im Gegensatz zu dem überwiegenden Teil niedergeschriebener Texte, welche zur Übermittlung der darin enthaltenen Informationen in den meisten Fällen nicht notwendigerweise durch einen Sprecher akustisch wiedergegeben werden müssen, stellt die Interpretation jeder Komposition einen wesentlichen Bestandteil des Werks und somit der gesamten Musik dar. Die Partitur spiegelt in abstrakter Weise die Gedanken des Komponisten wider, zwingt den Interpreten aber nicht, die primitive Rolle einer „Spielmaschine" zu übernehmen, in welcher er lediglich die Noteninformationen in klar definierte mechanische Aktionen umsetzen müsste, sondern fordert ganz im Gegenteil das klangliche Herausarbeiten latenter, nicht notierter oder notierbarer Informationen. Letztere kann der Interpret durch Intuition oder Analyse, basierend auf ästhetischem Empfinden oder angeeignetem Wissen, gewinnen; in jedem Fall trägt die daraus resultierende Interpretation, durchaus beeinflusst von den technischen Fertigkeiten des Ausführenden, einen hochgradig subjektiven Charakter. Der Hörer ist schließlich das letzte Glied in dieser Informationskette. Er lässt die Musik auf sich wirken und vervollständigt durch seine persönliche Rezeption einen Zweig des Gesamtwerks. Somit fließen Informationen aus dem Notenbild zum Ausführenden und von diesem in transformierter Form zum Hörer. Mazzola bemerkt dazu:
Die Identität des Werkes ist nach [...] kommunikationstheoretischen Betrachtungen dreifach geschichtet. Zunächst ist das Werk in der Weise, wie es vor jeder Analyse vorliegt, in einer vorderhand noch abstrakten Identität gegeben. Es wird dann auf dem neutralen Niveau in der Vielfalt der neutralen Identität geführt. Diese Identität ist ihrerseits Basis für die Varietät der ästhetischen [...] Wertungen. Die ästhetische Identität schliesslich wird aus all den ästhetischen Einzelperspektiven und ihren gegenseitigen Beziehungen aufgebaut. Das Werk ist gemäss diesen Überlegungen erst vollständig identifiziert, wenn der unendliche Prozess der Aesthesis aufgrund der abstrakten und der neutralen Identifikation vollendet ist.11)
Eine aus dieser Sichtweise unmittelbar hervorgehende Folgerung ist die zwangsläufige Trennung zwischen drei Kategorien musikspezifischer In formationen, die besonders bei der formalen Beschreibung sowie der algorithmischen Verarbeitung von musikalischen Aspekten eine zentrale Stellung einnehmen:
Auch wenn die Recherchemöglichkeiten nach Texten über Musik durchaus noch Verbesserungspotenzial besitzen, liefern die zurzeit weltweit nutzbaren Suchmaschinen im Schnitt sehr brauchbare Ergebnisse. Ihre Betreiber bemühen sich darüber hinaus um eine großflächige Indizierung verschiedener Online-Dokumente und versuchen auf diese Weise ein wenig Ordnung in die heterogene Struktur des Internet zu bringen. Während auf diesem Wege Biografien und ausgewählte Werke verschiedener Komponisten sowie diverse Aufsätze zu Kompositionen bzw. Urhebern ausfindig zu machen sind, geht die Suche nach den beschriebenen werkimmanenten Informationen ins Leere. Keine der bekannten Internet-Suchmaschinen oder frei zugänglichen spezialisierten Datenbanken ist beispielsweise in der Lage, beliebige Rhythmen oder Akkordfolgen in den zahlreich abrufbaren Partituren aufzufinden12), um etwa die Untersuchung charakteristischer Stilmittel eines Komponisten oder gar einer Epoche zu erleichtern. Solche Informationen findet man im günstigsten Fall ausschließlich in Form von Texten über das betreffende Werk. Hierbei ist der Recherchierende einerseits auf die Zuverlässigkeit des Autors angewiesen und erfährt andererseits nur etwas über die Aspekte, welche beim Verfassen des betreffenden Aufsatzes oder Artikels berücksichtigt wurden. Ein Ziel der aktuellen Forschung im Bereich der Musik-und Medieninformatik besteht infolgedessen darin, Verfahren zu entwickeln, die direkte Recherchen auf musikalischen Daten ermöglichen, um unmittelbar Informationen aus dem musikalischen Material zu gewinnen. Die Realisierung geeigneter Verfahren stellt aus verschiedenen Gründen eine besondere Herausforderung dar. Insbesondere stellt sich die Frage, wie musikimmanente Informationen so repräsentiert werden können, dass eine computerbasierte Verarbeitung möglich wird.
Die Repräsentation von musikimmanenten Informationen
Seit über 35 Jahren wird die Computertechnologie
auch im Bereich der Musik eingesetzt, so entstanden
z. B. schon Mitte der 1960er-Jahre erste
computergestützte Systeme zur Musiknotation
sowie zur Katalogisierung von musikalischem Material.13)
Da jeder unter algorithmischen Gesichtspunkten
betrachtete Aspekt der Musik ganz individueller
Lösungsansätze bedarf, konzentriert sich
die Arbeit der Forscherteams seit vielen Jahren auf
klar voneinander abgegrenzte Bereiche. Während
eine Gruppe den Schwerpunkt auf notierte Musik
legt bzw. Analysen auf Grundlage von Partituren
aufbaut, sehen andere ihre Aufgabe in der Verarbeitung
von Daten interpretierter Werke, bei denen
die Partitur nur noch eine untergeordnete Rolle
spielt. Entsprechend den unterschiedlichen Ansätzen
entstanden mit der Zeit ebenso viele, auf die
jeweiligen Anforderungen zugeschnittene, untereinander
selten kompatible Datenformate. Diese
lassen sich in Anlehnung an die musikalischen
Kommunikationsebenen im Wesentlichen in die
drei Kategorien notations-, klang-und analyseorientierte
Datenformate unterteilen.
Die notationsorientierten Formate versuchen,
die zweidimensionale und hochgradig von grafischen
Anteilen geprägte Notenschrift so auf
line are, also eindimensionale Zeichensequenzen
abzubilden, dass der Computer daraus die Partitur
rekonstruieren und auf dem Bildschirm darstellen
kann. Darüber hinaus sollen diese Formate die
Suche auf Partiturdaten erlauben sowie Transformationen
im Sinne der musikalischen Logik, wie
Transposition oder Augmentation, ermöglichen.
Letztere ebnen beispielsweise den Weg zur Realisierung
von Suchfunktionen, die über starre Identitätsvergleiche
hinausgehen und die Erkennung von
Ähnlichkeiten in transformierten Notensequenzen
oder Akkordfolgen berücksichtigen.
Zu den ältesten Datenformaten dieser Art gehört
der Anfang der 1970er-Jahre von Barry Brook
und Murray Gould entwickelte Plaine and Easy
Code (PEC) zur Beschreibung monophoner Notensequenzen.14)
Das Prinzip besteht hierbei darin,
die verschiedenen Notenparameter, wie Stammton,
Versetzungszeichen, Oktave, Notenwert usw.,
welche in der konventionellen Notenschrift durch
variierende grafische Informationen und vertikale
Anordnungen quasi in einem Symbol verschmelzen,
in separate Zeichenfolgen zu zerlegen. Eine
in Viertelnoten notierte und in der eingestrichenen
Oktave beginnende aufsteigende D-Dur-Tonleiter
im Violinschlüssel besitzt im Plaine and Easy
Code die Gestalt
G-2 4'd e xf g a b''xc d.
Diese vergleichsweise intuitive Codierung kommt
noch heute bei verschiedenen Institutionen zum
Einsatz. In der umfangreichen Musikhandschriften-Datenbank
des RISM15) wird der Code zur Speicherung
von Musikincipits genutzt. Eine ebenfalls
auf PEC basierende Suchfunktion gestattet so das
schnelle Auffinden vergleichbarer Themen oder
Motive.
Da die alphanumerische Partiturbeschreibung
nicht nur zur Speicherung, sondern auch zur Generierung
neuer bzw. modifizierter Notenbilder
verwendet werden kann, eignet sich das Format
ebenfalls gut zum Einsatz in adaptiven Lernprogrammen.
Die Gehörbildung des Computerkollegs
Musik16) beispielsweise erzeugt die im Zusammenhang
mit einer Höraufgabe präsentierten Notengrafiken
erst in dem Moment aus einem Derivat des
Plaine and Easy Codes, in dem sie tatsächlich auf
dem Bildschirm angezeigt werden müssen. Dies
befreit den Programmierer einerseits von dem
Zwang, eine Vielzahl oft nur leicht variierender
statischer Grafiken in die Anwendung einbinden
zu müssen und erlaubt andererseits die gezielte,
am Kenntnisstand des Lernenden ausgerichtete
Generierung geeigneter Notenbeispiele.
Besonders hervorzuheben ist ein weiteres alphanumerisches
Datenformat zur Beschreibung
notationsbezogener Inhalte, das in dieser Kategorie
aufgrund einer großen Zahl vorliegender Transkriptionen
eine wichtige Stellung einnimmt. MuseData17) wurde
am Center for Computer Assisted
Research in the Humanities der Stanford University
entwickelt und wird weiterhin aktiv gepflegt.
Im Gegensatz zu PEC können mit MuseData beliebige
konventionell notierte Partituren beschrieben
werden. Die über das Internet erreichbare Datenbank
umfasst rund 900 Werke überwiegend barocker
Komponisten und kann nach einer kostenlosen
Registrierung zu privaten, wissenschaftlichen
und Ausbildungszwecken genutzt werden.
Neben PEC und MuseData existieren unzählige
weitere alphanumerische Notencodes mit jeweils
unterschiedlichen Schwerpunkten, die zum
größten Teil wie MuseData die Beschreibung
komplexer polyphoner Partituren erlauben.18)
Zur Repräsentation der Interpretation eines Notensatzes
eignen sie sich hingegen nur bedingt. In diesem
Anwendungsfeld spielt üblicherweise das bekannte
MIDI-Format eine dominierende Rolle, das im
Gegensatz zu den diversen Notencodes eine frühzeitige
Standardisierung erfahren hat und auf diese
Weise die Parallelentwicklung zahlreicher proprietärer
Formate mit vergleichbarem Einsatzgebiet
verhindert hat. Zwar existieren einige nicht vom
Standard abgedeckte lokal genutzte MIDI-Erweiterungen,
denen jedoch keine größere Verbreitung
gelang. Anders als auf den ersten Blick vielleicht
zu vermuten wäre, kommt den Audioformaten
als Musikinformationsmedium ebenfalls keine
besondere Bedeutung zu. Die bei der akustischen
Aufzeichnung zu einem Konglomerat verschmelzenden
musikspezifischen Daten lassen sich aus
den gesampleten Daten kaum algorithmisch rekonstruieren,
sodass die in Wave-oder MP3-Dateien
gespeicherten Werte zwar unter akustischen
Gesichtspunkten von Interesse sind, als Träger
computertechnisch auswertbarer musikalischer
Informationen eignen sie sich ab einem gewissen
Komplexitätsgrad der Musik jedoch nicht.
MIDI bildet heute nach wie vor die Ausgangsbasis
für viele performanceorientierte Musikanwendungen.
Bekanntermaßen werden hier Noteninformationen
lediglich als Zahlen abgelegt, die
eine bestimmte Taste der Klaviatur bezeichnen,
d. h. Unterscheidungen bezüglich der Enharmonik
sind nicht mehr möglich. Ähnliches gilt auch für
die Notenwerte, die zwar noch relativ zu einem
Grundschlag codiert werden, denen allerdings jeder
direkte Bezug zur notierten Taktart und dem
dadurch induzierten Metrum fehlt19), zumal die
Dauer einer MIDI-Note nicht nur den entsprechenden
Notenwert der Partitur sondern gleichzeitig
Artikulations- und Agogikangaben abbilden muss.
Diese Loslösung von der Partitur und die Verlagerung
des Schwerpunkts auf die Interpretation,
einschließlich aller notationstechnisch nur schwer
fassbaren Tempoangaben sowie der natürlichen
Unregelmäßigkeiten beim Musizieren, öffnet einen
völlig anders gearteten Raum musikalischer
Informationen. Dieser wird von Forscherteams u. a.
dazu genutzt, Hinweise auf Zusammenhänge zwischen
musikalischem Material und verschiedenen
Interpretationen desselben zu gewinnen. Mit dieser
Thematik beschäftigt sich u. a. die maßgeblich von
Guerino Mazzola an der ETH Zürich vorangetriebene
Mathematische Musiktheorie, aus der auch
das Computerprogramm Rubato20) zur Generierung
musikalischer Interpretationen hervorgegangen ist.
Aufgrund der Standardisierung sowie der allgemeinen
Akzeptanz von MIDI-Dateien als musikorientiertes
Vektorformat, werden im Internet unterschiedliche
Einspielungen verschiedenster Stücke
in allen Qualitätsstufen kostenlos zum Download
angeboten. Allein die Classical Music Archives21)
umfassen mehr als 19 000 MIDI-Dateien von über
1 000 Komponisten aus dem Bereich der „klassischen
Musik". Dazu kommen weitere vergleichbare
Angebote aus nahezu allen Musiksparten. Datenmaterial
steht somit reichlich zur Verfügung.
Musikimmanente Informationen erschließen
sich dem Hörer der Musik oder dem Betrachter
einer Partitur oft erst durch eine Analyse, gerade
wenn das Augenmerk auf komplexere als die offensichtlichen
Strukturen gelegt wird. Die daraus
hervorgehenden Resultate werden, wie bereits erwähnt,
meist in Textform dargelegt und entziehen
sich somit einer weiteren algorithmischen Verarbeitung,
insbesondere also der Suche nach genau
solchen Informationen. Diese Informationen sind
es mitunter aber, welche die Grundlage weiterer
Analysen bilden. Es liegt also nahe, die Resultate
einer zuvor erfolgten Analyse ebenfalls in computerlesbarer
Form zu beschreiben. Eine frühe Umsetzung
dieses Ansatzes stellt das Humdrum-Toolkit22)
in Verbindung mit dem Notenrepräsentationsformat
Kern dar, welches dazu entwickelt wurde,
Antworten auf Fragen bezüglich einer Komposition
oder einer ganzen Klasse von Kompositionen
zu erhalten. So ist das System beispielsweise in
der Lage festzustellen, ob Komponisten im Allgemeinen
dazu tendieren, die Wörter „hoch", „high"
oder „haute" in Vokalwerken durch hohe Töne
zu unterstreichen.23) Die Ergebnisse einer solchen
Auswertung können wieder in einer selbst zu definierenden
Humdrum-Repräsentation abgelegt und
weiterverarbeitet werden.
Wenn es darum geht, Erkenntnisse über Musik
mit der interessierten Öffentlichkeit auszutau schen,
behindern die zahlreichen lokalen Daten formate
dieses Anliegen mangels geeigneter Konvertierungsprogramme.
Ferner bieten die wenigsten
für ein spezielles Anliegen ad hoc entworfenen
Formate geeignetes Verallgemeinerungs-oder
Aus baupotenzial, um es als gemeinsame Basis für
Arbeitsgruppen mit verschiedenen Schwerpunkten
nutzen zu können. Formale Abhilfe schafft hier die
Extensible Markup Language (XML). XML bietet
die Möglichkeit zur plattformunabhängigen Speicherung
und Beschreibung strukturierter Daten.
Die Besonderheit gegenüber anderen Formaten besteht
darin, dass XML eine Metasprache zur Definition
so genannter Markup-Sprachen darstellt und
damit anders als z. B. das verwandte HTML keine
eindeutig festgelegte Semantik besitzt, sondern
abhängig vom jeweiligen Anwendungsbereich
individuell gestaltet werden kann. Die einheitliche
Syntax in Verbindung mit den strukturiert beschriebenen
Daten gestattet einen deutlich vereinfachten
Datenaustausch. Selbst wenn ein definiertes
XML-Format weiterentwickelt oder modifiziert
wird, können die zuvor gespeicherten Daten leicht
übertragen werden.
Das zunehmend an Bedeutung gewinnende
MusicXML24) soll laut seinen Entwicklern nach und
nach die vielfältigen Musikformate ablösen und
ihre jeweiligen Fähigkeiten in sich vereinigen. So
ist geplant, neben der bisher realisierten Beschreibung
von Partituren auch performanceorientierte
Daten à la MIDI sowie Metadaten zur Struktur der
Musik in die Spezifikation aufzunehmen. Damit
würde sich MusicXML u. a. als allgemeine Datenbasis
für die Suche nach musikimmanenten Informationen
eignen. Die vom Hersteller Recordare
angebotenen Konverter für MuseData und das
Notationsprogramm Finale treiben die Verbreitung
von MusicXML zusätzlich voran und es ist anzunehmen,
dass es mittelfristig einen bedeutenden
Stellenwert beim allgemeinen Austausch musikalischer
Informationen erlangen wird.
Einen etwas anderen Ansatz verfolgt das MUSITECH-
Projekt25) der Forschungsstelle Musik-und
Medientechnologie der Universität Osnabrück.
Hier wird versucht, eine allgemeine Infrastruktur
für musikspezifische Computeranwendungen unterschiedlichster
Art zu schaffen. Dies schließt
ganz ausdrücklich auch internetbasierte Lernprogramme
mit ein. Basierend auf einem in Java
realisierten, erweiterbaren Objektmodell können
beliebige Strukturen aller Informationsschichten
beschrieben werden. Ausgehend von diesem
Modell lassen sich die Daten und Relationen der
virtuellen Objekte u. a. in das MusicXML-Format
abbilden, um auch hier einen systemübergreifenden
Datenaustausch zu ermöglichen. Geplant sind
ebenso die Bereitstellung geeigneter Konverter für
verschiedene Formate sowie die Entwicklung benutzerfreundlicher
Hilfsmittel und Komponenten
zur Erstellung der Musikanwendungen.
Aus dem großen Spektrum der unterschiedlichen
Musikformate konnte an dieser Stelle nur
ein kleiner Ausschnitt berücksichtigt werden. Die
steigende Bedeutung des Internet gerade auch im
Hinblick auf Musikinformationen erfordert die
vereinheitlichende zeitlich stabile Repräsentation
unterschiedlichster Daten, denn nur dadurch wird
das zur Verfügung stehende Informationspotenzial
langfristig effizient nutzbar. Aus dieser Sicht
scheint sich die Vielfalt der Datenformate zunehmend
zugunsten vereinheitlichender Repräsentationsformen
zu verlagern. XML stellt in dieser
Hinsicht eine vielversprechende Grundlage dar,
sodass auch Musikinformationen mittelfristig in
größerer Zahl in dieses Format übertragen und auf
diese Weise einer globalen Recherche zugänglich
gemacht werden.
Zusammenfassung
Die heutige Gesellschaft ist auf Informationen jeglicher
Art angewiesen. Mit dem Internet steht eine
Infrastruktur zur Verfügung, die den weltweiten
Austausch beliebiger Daten ermöglicht und somit
eine ideale Informationsquelle darstellt. Aufgrund
der heterogenen Struktur des Internet liegen bereitgestellte
Daten in uneinheitlicher Form und
in stark differierender Qualität vor. Infolgedessen
werden Techniken zur Strukturierung bzw. zum
schnellen Auffinden gesuchter Informationen benötigt.
Da der Wert einer Information im Wesentlichen
von den Ansprüchen des Informationssuchenden
abhängt, stellen Linklisten und Archive zu
ausgewählten Themen nur ein bedingt geeignetes
Mittel dar, denn sie wurden schließlich nach den
subjektiven Kriterien des Anbieters zusammengestellt.
Letztlich scheinen großflächig indizierende
Suchmaschinen das einzig universelle Instrument
zum Auffinden individuell relevanter Informationen
zu sein.
Während die Suche über Textdokumente recht
fortgeschritten ist, fehlt es im Bereich der Musikformate
an vergleichbaren Hilfsmitteln. Musikimmanente
Informationen können in textlich
beschreibender Form nur bedingt transportiert
werden – die vollständige Information wird nur
via Partitur bzw. durch die Musik selbst vermittelt.
Ziel vieler Forschungsarbeiten ist es deshalb, Verfahren
zu entwickeln, welche die direkte Suche auf
musikalischen Daten ermöglichen. Da die Schwerpunkte
der lokalen Gruppen jedoch oft unterschiedlich
ausgerichtet sind, entstehen zahlreiche,
zueinander inkompatible Formate, mit deren Hilfe
zwar zahlreiche Kompositionen bzw. Interpretationen
geeignet repräsentiert, aber nicht übergreifend
mit einheitlichen Techniken ausgewertet werden
können. Eine solche, zumindest partielle Vereinheitlichung
bildet aber die Voraussetzung für eine
Suche auf großen Datenmengen.
Als allgemein akzeptierte Basis zur Datenspeicherung
setzt sich zunehmend das XML-Format
durch. Dieses eignet sich dank der starken Strukturierungsmöglichkeiten
auch zur Beschreibung von
Musik und musikalischen Zusammenhängen. Mit
MusicXML steht schon jetzt ein Dateiformat zur
Ver f ügung, das im Hinblick auf die Beschreibung
von Partituren kaum noch Wünsche offen lässt. Es
bleibt zu hoffen, dass diese oder eine vergleichbare
Repräsentationsform um die noch fehlenden
Aspekte zur Speicherung performancespezifischer
bzw. analytisch-struktureller Daten erweitert wird,
damit auf diese Weise ein universelles Format
entsteht, das dazu beitragen kann, beliebige Musikinformationen
im Sinne der eingangs zitierten
Worte an jedem Ort und zu jeder Zeit verfügbar zu
machen.
Martin Gieseking ist wissenschaftlicher Mitarbeiter der Forschungsstelle Musik- und Medientechnologie der Universität Osnabrück.
1) www.big-internet.de/initiative.htm (Stand: 2.6.2002).
2) Hans Strohner, Information, Wissen und Bedeutung – Eine Analyse systemischer Strukturen sprachlicher Kommunikation, in: Rüdiger Weingarten, Information ohne Kommunikation? Die Loslösung der Sprache vom Sprecher, Frankfurt am Main 1990, S. 211.
3) Vgl. z. B. Gerhard L. Endres, Die Zauberlehrlinge und der Mythos Computer. Über den falschen Glauben an die Informationsgesellschaft. Fragen an den Informatik-Pionier Joseph Weizenbaum, in: Publik-Forum 10/ 2000, S. 8 –10.
4) Karl Popper, Objektive Erkenntnis, Hamburg 1995.
6) Das Portable Document Format (PDF) wurde von dem US-amerikanischen Software-Hersteller Adobe Systems Inc. (www.adobe.com) definiert und wird weiterhin aktiv gepflegt und weiterentwickelt. Die vollständige PDF-Spezifikation sowie die zugehörige Anwendung zum Be trachten der Dokumente (Adobe Acrobat Reader) können kostenlos von den Web-Seiten des Herstellers heruntergeladen werden.
9) Bei Regulären Ausdrücken handelt es sich um spezielle Suchmuster, die den syntaktischen Aufbau ähnlicher Zeichenfolgen beschreiben. Sie stellen u. a. ein mächtiges Hilfsmittel zum Auffinden von Textstellen dar, deren exakte Syntax unbekannt ist. Ausführliche Informationen findet der interessierte Leser u. a. in: Jeffrey Friedl, Reguläre Ausdrücke, Köln 1998.
10) www.ub.uos.de/osiris/index.html. Vgl. auch Marc Ronthaler und Hartmut Zillmann, Literaturrecherche mit OSIRIS – Ein Test der OSIRIS-Retrievalkomponente, in: Bibliotheksdienst: Organ der Bundesvereinigung Deutscher Bibliotheksverbände, Heft 7, 1998.
11) Guerino Mazzola, Geometrie der Töne – Elemente der Mathematischen Musiktheorie, Basel 1990.
12) Eines der zahlreichen Notenarchive ist das Werner Icking Music Archive (http://icking-music-archive.sunsite.dk).
13) Vgl. z. B. Donald Byrd, Music Notation by Computer, Indiana University 1985, S. 100.
14) Vgl. z. B. Barry S. Brook, The Plaine and Easy Code, in: Musicology and the Computer, Three Symposia, New York 1970, S. 53ff.
15) Répertoire International des Sources Musicales (http://rism. harvard. edu/rism).
16) www.schott-online.com/nocache/smi/produkte/multimedia/Wissen/ComputerkollegMusik.
18) Einen Überblick findet der Leser z. B. in: Eleanor Selfridge-Field, (Hg.), Beyond MIDI – The Handbook of Musical Codes, Massachusetts 1997.
19) Vgl. z. B. Martin Gieseking, Codebasierte Generierung interaktiver Notengraphik, Osnabrück, 2001, S. 93ff.
21) www.classicalarchives.com.
22) www.music-cog.ohio-state.edu/Humdrum.
23) Vgl. www.music-cog.ohio-state.edu/Humdrum/sample.problems.html.
24) www.recordare.com. Vgl. auch: Walter B. Hewlett, Eleanor Selfridge-Field (Hg.), The Virtual Score – Representation, Retrieval, Restoration. Computing in Musicology Bd. 12. Cambridge 2001, S. 113ff.
25) http://musitech.fmt.uni-osnabrueck.de.