Martin Gieseking
Musikinformationen im Internet – Ein Überblick über Repräsentation und Recherche auf musikspezifischen Daten

Einleitung

Auf unserem Weg in eine Wissensgesellschaft wird Information zum strategischen Rohstoff, Wissen zum wichtigsten Produktionsfaktor. Die neuen Informations- und Kommunikationsmedien machen das globale Gesamtwissen an jedem Ort und zu jeder Zeit verfügbar – sie schaffen eine beispiellose Fülle an Daten und Informationen. Die Fähigkeit, Informationen zu selektieren, zu nutzen und Wissen zu systematisieren wird damit zu der Schlüsselqualifikation in der Informationsgesellschaft.1) Mit diesen Worten begrüßt die Initiative Bildungswege in die Informationsgesellschaft (BIG) die Besucher ihrer Homepage und greift damit die Thematik auf, die uns nahezu tagtäglich von Politikern, Journalisten und Vertretern der Wirtschaft in den Medien ins Bewusstsein gerufen wird: Unser Leben im Zeitalter des Computers wird mehr denn je von Informationen bestimmt. Die Fähigkeit, rele vante Informationen aufzufinden, sie von weniger relevanten zu trennen und die Resultate in geeigneter Weise zu nutzen, bestimmt den Alltag in vielen Branchen. So verwundert es auch nicht, dass als Konsequenz aus dieser Einsicht zunehmend Schulen vernetzt und Schüler mit Notebooks ausgerüstet werden, um im Fachunterricht mithilfe geeigneter didaktisch-methodischer Konzepte grundlegende Fertigkeiten in der so genannten „Schlüsselqualifikation" zu erwerben. Je mehr die Beschaffung von Informationen aber an Bedeutung gewinnt, desto wichtiger wird gleichzeitig das Wissen darüber, welche Daten überhaupt zur Verfügung stehen und wie diese für die Verarbeitung durch die Informationstechnologien aufbereitet werden. Die nach wie vor verbreitete Vorstellung, mit Computer und Zugang zum Internet könne der Anwender über jede erdenkliche Information verfügen oder gar aus einem „globalen Gesamtwissen" schöpfen, sollte sich auf diese Weise zumindest teilweise relativieren lassen.
Gerade im Bezug auf Musik und Musikwissenschaft trifft man bei genauerer Betrachtung der tatsächlich zur Verfügung stehenden Informationen auf eine recht ambivalente Situation. Einerseits lassen sich unzählige Musikstücke aus sämtlichen Sparten sowie eine ansehnliche Zahl an Texten und bibliografischen Informationen über Musik auffinden, aber andererseits bleiben gleichzeitig viele Informationen auch unauffindbar bzw. können zurzeit noch nicht in angemessener Weise über das Internet bereitgestellt werden. Diese Tatsache hängt unmittelbar mit der besonderen Stellung der Musik als hochkomplexe nonverbale Kommunikationsform zusammen, deren vielschichtige Informationsebenen mit den aktuellen Recherchemöglichkeiten des Internet nur sehr bedingt in Einklang gebracht werden können. Aufgrund der zahlreichen Aspekte, unter denen Musik betrachtet werden kann, herrscht eine nahezu unüberschaubare Zahl an häufig inkompatiblen Datenformaten, welche die globale Bereitstellung der darin verborgenen Informationen erschweren. Zwar werden für jedes Format geeignete Verarbeitungsalgorithmen angeboten, doch kommen diese oft nur lokal oder auf lokalen Datenmengen zum Einsatz, sodass sich zwangsläufig viele voneinander isolierte „Dateninseln" bilden, welche dem aus Sicht des Anwenders wünschenswerten Ziel einer vereinheitlichten globalen Infrastruktur entgegenstehen. Bevor diese Aspekte jedoch näher beleuchtet werden, scheint es sinnvoll, zunächst den Begriff Information zu definieren und ihn von häufig synonym verwandten Wörtern abzugrenzen.

Was sind Informationen?

Der Informationsbegriff ist einer der unklarsten und doch heute einer der am häufigsten sowohl in der Wissenschaft als auch in der Öffentlichkeit verwendeten Begriffe. Oft bleibt zum Beispiel unklar, wo Information eigentlich entsteht: in den Köpfen der Menschen, in der Sprache oder in der Welt sonst?2) Tatsächlich gibt es heute zahlreiche, mehr oder weniger stark voneinander abweichende Definitionen des Informationsbegriffs. Sie erstrecken sich von sehr differenzierten Erklärungen bis hin zu der groben und gleichermaßen unbefriedigenden Generalisierung „alles ist Information". Häufig taucht dieser Begriff aber nicht isoliert auf, sondern wird in Verbindung mit den ebenso selbstverständlich gewordenen Schlagwörtern Daten und Wissen verwendet. Mangels eindeutiger Abgrenzungen herrscht dann in vielen Äußerungen und Aufsätzen ein häufig zur weiteren Verwirrung beitragendes Durcheinander hinsichtlich der Begrifflichkeiten.
Eine recht gebräuchliche und durchaus nachvollziehbare Definition des Begriffstrios basiert auf einem schrittweisen aufbauenden Ansatz: Die unterste Ebene der Begriffshierarchie bilden die Daten. Jede Form von Zahlen-, Zeichen-oder Sym bolfolgen, welche zunächst keinerlei Bedeutung tragen müssen, werden diesem Begriff zugeordnet. Während Daten isoliert auf Datenträgern abgelegt werden können, erfordern Informationen eine Kommunikation zwischen mindestens zwei Parteien: Ein „Sender" übermittelt Daten an einen „Empfänger". Kann der Empfänger den Daten während oder nach der Transmission eine Semantik entnehmen, so gewinnt er daraus Informationen. Voraussetzung für diesen Austausch ist zweifellos die Einigung auf eine gemeinsame Kommunikationsbasis, ohne die die übermittelten Daten letztlich unverständlich bleiben. Dies gilt nicht nur für den Informationsaustausch zwischen Menschen, sondern lässt sich gleichermaßen auf den Computer übertragen: Eine MP3-Datei besitzt nur aus Sicht eines geeigneten Decoders informativen Charakter; jedes Bildverarbeitungsprogramm scheitert beim Versuch, die Datei in eine grafische Darstellung zu überführen.
Die Auseinandersetzung mit neu gewonnenen Informationen sowie deren Interpretation führt schließlich zu erweitertem Wissen3), welches in hohem Maße subjektiver Natur ist und laut den Ausführungen in der Literatur bis heute dem Menschen und einigen Tierarten vorbehalten bleibt. Ein zentrales Merkmal des Wissens besteht darin, dass es als Folge der menschlichen Informationsverarbeitung u. a. durch Abstraktion, Kombination und Reorganisation bereits existenter Strukturen im Kopf des Individuums entsteht. Ein globales, alles individuelle Teilwissen vereinendes Gesamtwissen, wie es in den eingangs zitierten Sätzen postuliert wurde, kann auf dieser Definitionsgrundlage nicht existieren. Auch objektives Wissen, welches im Sinne Karl Poppers intersubjektiven Prüfungen standhält3), dürfte sich weltweit nur in beschränktem Maße nachweisen lassen.

Musikinformationen

Der zentrale Unterschied zwischen Daten und Informationen besteht also darin, dass letztere eine semantische Komponente besitzen. Nun stellt sich die Frage, welche im Internet vorhandenen Daten sich als Musikinformationen deuten lassen. Auch der Begriff Musikinformation ist aus Sicht der Musikwissenschaft recht vage und keinesfalls eindeutig erklärt. So könnte man sich fragen, ob etwa das Geburtsdatum Beethovens bereits eine Musikinformation darstellt oder ob dies nicht eher als relativ neutrale historische Zahl zu werten ist. Bedeutet die Verbindung eines Datums zu einem Musiker oder Komponisten automatisch, dass die ses als originär musikspezifische Auskunft betrachtet werden muss? Natürlich nicht. Informationen werden in ihrer Kategorisierung maßgeblich von dem Kontext bestimmt, aus dem sie beleuchtet werden. Demzufolge verwischen die künstlichen Grenzen zwischen sprachlich und organisatorisch klar voneinander getrennten Fachgebieten. Eine eindeutige fachliche Zuordnung vieler Informationen ist prinzipiell nicht zu leisten. Dennoch dürften u. a. elementare biografische Komponisteninformationen überwiegend von Musikern und Musikwissenschaftlern benötigt sowie von den meisten Menschen dem musikalischen Umfeld zugeordnet werden, sodass die Aufnahme dieser Informationen in Musikdatenbanken durchaus nach vollziehbar ist.
Die Frage nach Berücksichtigung einer historischen Information in einer Musikdatenbank mag für die konkrete Realisierung eines entsprechenden Projekts von nicht unerheblicher Bedeutung sein, aus übergeordneter Sicht erscheint sie jedoch als eher marginal. Wenn von Musikinformationen die Rede ist, stellen wir uns darunter unabhängig vom konkreten Inhalt zunächst oft kürzere Aufsätze, ganze Bücher oder auch bibliografische Auskünfte zum Auffinden gesuchter Informationen vor. In diesen Fällen werden die gewonnenen Erfahrungen mit den bewährten Publikationsformen, wie Bücher, Zeitschriften bzw. Bibliografien, auf das elektronische Medium übertragen. Tatsächlich wagen immer mehr Verlage den Schritt ins Internet und bieten dort einen mehr oder weniger tiefen Einblick in ihr Programm. Neben den klassischen Buchverlagen, deren Schwerpunkt auf dem Vertrieb gedruckter Bücher und Zeitschriften liegt, entstehen zunehmend reine Internet-Verlage, die ihre Aufgabe primär darin sehen, ihre Publikationen in elektronischer Form anzubieten. Durch die Einsparung vieler personeller und technischer Zwischenschritte, die zur Herstellung der Druckfassungen erforderlich sind, erreichen die elektronischen Versionen oft ein früheres Publikationsdatum und besitzen damit größere Aktualität. Etwaige Fehler können unmittelbar ohne Neuauflage gekennzeichnet und verbessert werden. Darüber hinaus erreicht der Anbieter bei einer Distribution über das Internet sofort ein breites internationales Publikum. Gleichzeitig bringt diese Art der Veröffentlichung aber auch Schwierigkeiten mit sich. So müssen nicht nur bei Texten aus dem wissenschaftlichen Umfeld sowohl Fragen bezüglich Permanenz und Zitierfähigkeit der Dokumente als auch solche zum Urheberschutz geklärt werden.
Mit dem Begriff Internet wird heute üblicherweise das World Wide Web assoziiert, also jener Dienst, zu dem der Nutzer mithilfe eines Browsers Zugang erlangt. Nicht zuletzt die Vereinigung von Texten, Bildern und Klängen unter einer Oberfläche, gepaart mit der Möglichkeit, verschiedenste lokale oder entfernte Dokumente via Hyperlinks zu referenzieren, trug deutlich zur allgemeinen Attraktivitätssteigerung des Internet bei. Das zur Beschreibung der Web-Seiten eingesetzte, primär für die Bildschirmdarstellung entworfene Standardformat HTML eignet sich jedoch nur bedingt zur Speicherung von strukturierten Dokumenten. So bietet es z. B. nur marginale Gliederungs- bzw. Formatierungsanweisungen und ferner beeinflusst die Breite des Browserfensters, anders als etwa von Textverarbeitungen gewohnt, den Zeilenumbruch. Auch Seiten im Sinne eines Buches sind nicht vorgesehen; entsprechend unzureichend fallen damit ebenso die Konvertierungsmöglichkeiten zwischen seitenorientierten Dateiformaten und HTML aus.
Einige Internet-Verlage, wie beispielsweise der im Aufbau befindliche Verlag epOs Music der Universität Osnabrück5), bieten manuell nach Vorlage der Druckfassung paginierte HTML-Seiten sämtlicher Bücher an, um einerseits eine schnelle Volltextsuche realisieren und andererseits eine seitenweise zitierfähige Online-Version anbieten zu können. Die alternativ erhältlichen und vollständig mit dem Druck identischen PDF-Dateien6) eignen sich aufgrund ihrer Größe weniger zum schnellen Überfliegen des Inhalts, erfüllen aber bezüglich der Wiedergabe eines rechnerübergreifend konsistenten Layouts die gewünschten Anforderungen. Seine offene Spezifikation sowie die an keinerlei Lizenzgebühren gebundene Nutzung und Unterstützung tragen entscheidend zur beobachtbaren steigenden Verbreitung des Portable Document Formats bei. Ebenso zwingt Adobe dem potenziellen Nutzer keine teure proprietäre Anwendung zur Generierung der Dateien auf. Mit Ghostscript7) und (pdf) LaTeX8) stehen beispielsweise zwei kostenlose Programme zur Erzeugung von PDF-Dateien bereit. Die beiden plattformunabhängigen Formate HTML und PDF bilden zurzeit die meistgenutzte Grundlage zur Verbreitung textbezogener Informationen im Internet. Dabei ergänzen sie sich gegenseitig durch ihre jeweils charakteristischen Eigenschaften.
Mindestens ebenso wichtig wie die Bereitstellung von Informationen ist ihr schnelles Auffinden im Internet. Ohne geeignete Suchmöglichkeiten bleibt jede ungeordnete, heterogene Ansammlung von Daten nahezu wertlos, denn das manuelle Heraussuchen der aktuell relevanten Informationen kann mit beschränktem Zeitaufwand so gut wie nicht geleistet werden. Die zentralen Hilfsmittel bei der Fahndung nach relevanten Informationen aus einer unüberschaubaren Datenmenge sind im Bezug auf Internet und Datenbanken zweifellos die Suchmaschinen, deren Aufgabe darin besteht, eine indizierte Datenmenge – im Falle des Internet besteht diese üblicherweise aus einer Auswahl tatsächlich aktiver Webseiten und darin verlinkter Dokumente – nach Textausschnitten oder Regulären Ausdrücken9) zu durchsuchen und die Treffer nach diversen Ranking-Kriterien entsprechend vorsortiert auszugeben. Auch wenn Suchmaschinen wie Google regelmäßig eine Vielzahl der aktuell zugänglichen Daten indizieren, muss sich der Recherchierende dennoch im Klaren darüber sein, dass ein nicht unerheblicher Teil der unter Umständen relevanten Seiten aus verschiedenen Gründen von den Indizierungsalgorithmen übersehen oder als irrelevant verworfen wird. Nicht auffindbare Informationen unterscheiden sich von nicht vorhandenen aber nur graduell und sind damit im Allgemeinen wertlos. Folglich bemühen sich private, wissenschaftliche und kommerzielle Anbieter, ihre Webseiten als hochrangige Treffer in den Datenbanken möglichst vieler stark frequentierter Suchmaschinen unterzubringen. Da dies für Informationen aller Qualitätsstufen in nahezu sämtlichen Fachgebieten angestrebt wird, stellt sich die individuelle Suche aus Sicht des Anwenders mitunter als recht frustrierend bzw. wenig ergiebig heraus, denn inhaltlich betrachtet haben die zuoberst gelisteten Suchergebnisse oft wenig gemein. Die Erwartungen der Anwender an den tat sächlichen Informationsgehalt der Suchresultate können allerdings stark differieren, sodass die Betreiber der Suchdienste eine generelle Qualitätsgarantie nur schwer zusichern können.
Ein generelles Problem bei der Suche nach Textdokumenten bleibt dennoch die Tatsache, dass die Zieldokumente in aller Regel lediglich auf das Vorkommen der eingegebenen syntaktischen Suchmuster beschränkt bleiben. Die darin ausgedrückte Semantik wird üblicherweise nicht berücksichtigt und so produzieren Suchanfragen wie „Musik in der Natur" und „Natur in der Musik" ohne weitere Angaben trotz unterschiedlicher Bedeutung dieselben Ergebnisse. Durch semantische Analysen der Suchanfragen versuchen Datenbankspezialisten und Computerlinguisten die Qualität der Resultate zu verbessern. Ein Produkt solcher Forschungsarbeiten stellt unter anderem das Osnabrück Intelligent Research Information System (OSIRIS) dar10), mit dessen Hilfe Datenbestände auf natürlichsprachliche Eingaben hin durchsucht werden können.

Musikimmanente Informationen

Schriftliche Musikinformationen, die mithilfe von Suchmaschinen wie Google aufgefunden werden können, stellen eine wichtigen Bestandteil musikbezogener Informationen dar. Viele musikalische Aspekte, analytische Ergebnisse oder auch historische Fakten können bislang nur beschreibend in textueller Form verbreitet werden. Dennoch existieren jenseits der Fakten über Musik ebenso musikimmanente Informationen, Informationen also, welche die Musik selbst vermittelt. Sie besitzt ein vielfach geschichtetes Informationspotenzial, welches die Grundlage jeglicher konstruktiven Auseinandersetzung mit Musik bildet und Ausgangspunkt für die meisten Aufsätze über Musik ist. Im Gegensatz zu dem überwiegenden Teil niedergeschriebener Texte, welche zur Übermittlung der darin enthaltenen Informationen in den meisten Fällen nicht notwendigerweise durch einen Sprecher akustisch wiedergegeben werden müssen, stellt die Interpretation jeder Komposition einen wesentlichen Bestandteil des Werks und somit der gesamten Musik dar. Die Partitur spiegelt in abstrakter Weise die Gedanken des Komponisten wider, zwingt den Interpreten aber nicht, die primitive Rolle einer „Spielmaschine" zu übernehmen, in welcher er lediglich die Noteninformationen in klar definierte mechanische Aktionen umsetzen müsste, sondern fordert ganz im Gegenteil das klangliche Herausarbeiten latenter, nicht notierter oder notierbarer Informationen. Letztere kann der Interpret durch Intuition oder Analyse, basierend auf ästhetischem Empfinden oder angeeignetem Wissen, gewinnen; in jedem Fall trägt die daraus resultierende Interpretation, durchaus beeinflusst von den technischen Fertigkeiten des Ausführenden, einen hochgradig subjektiven Charakter. Der Hörer ist schließlich das letzte Glied in dieser Informationskette. Er lässt die Musik auf sich wirken und vervollständigt durch seine persönliche Rezeption einen Zweig des Gesamtwerks. Somit fließen Informationen aus dem Notenbild zum Ausführenden und von diesem in transformierter Form zum Hörer. Mazzola bemerkt dazu:

Die Identität des Werkes ist nach [...] kommunikationstheoretischen Betrachtungen dreifach geschichtet. Zunächst ist das Werk in der Weise, wie es vor jeder Analyse vorliegt, in einer vorderhand noch abstrakten Identität gegeben. Es wird dann auf dem neutralen Niveau in der Vielfalt der neutralen Identität geführt. Diese Identität ist ihrerseits Basis für die Varietät der ästhetischen [...] Wertungen. Die ästhetische Identität schliesslich wird aus all den ästhetischen Einzelperspektiven und ihren gegenseitigen Beziehungen aufgebaut. Das Werk ist gemäss diesen Überlegungen erst vollständig identifiziert, wenn der unendliche Prozess der Aesthesis aufgrund der abstrakten und der neutralen Identifikation vollendet ist.11)

Eine aus dieser Sichtweise unmittelbar hervorgehende Folgerung ist die zwangsläufige Trennung zwischen drei Kategorien musikspezifischer In formationen, die besonders bei der formalen Beschreibung sowie der algorithmischen Verarbeitung von musikalischen Aspekten eine zentrale Stellung einnehmen:

Auch wenn die Recherchemöglichkeiten nach Texten über Musik durchaus noch Verbesserungspotenzial besitzen, liefern die zurzeit weltweit nutzbaren Suchmaschinen im Schnitt sehr brauchbare Ergebnisse. Ihre Betreiber bemühen sich darüber hinaus um eine großflächige Indizierung verschiedener Online-Dokumente und versuchen auf diese Weise ein wenig Ordnung in die heterogene Struktur des Internet zu bringen. Während auf diesem Wege Biografien und ausgewählte Werke verschiedener Komponisten sowie diverse Aufsätze zu Kompositionen bzw. Urhebern ausfindig zu machen sind, geht die Suche nach den beschriebenen werkimmanenten Informationen ins Leere. Keine der bekannten Internet-Suchmaschinen oder frei zugänglichen spezialisierten Datenbanken ist beispielsweise in der Lage, beliebige Rhythmen oder Akkordfolgen in den zahlreich abrufbaren Partituren aufzufinden12), um etwa die Untersuchung charakteristischer Stilmittel eines Komponisten oder gar einer Epoche zu erleichtern. Solche Informationen findet man im günstigsten Fall ausschließlich in Form von Texten über das betreffende Werk. Hierbei ist der Recherchierende einerseits auf die Zuverlässigkeit des Autors angewiesen und erfährt andererseits nur etwas über die Aspekte, welche beim Verfassen des betreffenden Aufsatzes oder Artikels berücksichtigt wurden. Ein Ziel der aktuellen Forschung im Bereich der Musik-und Medieninformatik besteht infolgedessen darin, Verfahren zu entwickeln, die direkte Recherchen auf musikalischen Daten ermöglichen, um unmittelbar Informationen aus dem musikalischen Material zu gewinnen. Die Realisierung geeigneter Verfahren stellt aus verschiedenen Gründen eine besondere Herausforderung dar. Insbesondere stellt sich die Frage, wie musikimmanente Informationen so repräsentiert werden können, dass eine computerbasierte Verarbeitung möglich wird.

Die Repräsentation von musikimmanenten Informationen

Seit über 35 Jahren wird die Computertechnologie auch im Bereich der Musik eingesetzt, so entstanden z. B. schon Mitte der 1960er-Jahre erste computergestützte Systeme zur Musiknotation sowie zur Katalogisierung von musikalischem Material.13) Da jeder unter algorithmischen Gesichtspunkten betrachtete Aspekt der Musik ganz individueller Lösungsansätze bedarf, konzentriert sich die Arbeit der Forscherteams seit vielen Jahren auf klar voneinander abgegrenzte Bereiche. Während eine Gruppe den Schwerpunkt auf notierte Musik legt bzw. Analysen auf Grundlage von Partituren aufbaut, sehen andere ihre Aufgabe in der Verarbeitung von Daten interpretierter Werke, bei denen die Partitur nur noch eine untergeordnete Rolle spielt. Entsprechend den unterschiedlichen Ansätzen entstanden mit der Zeit ebenso viele, auf die jeweiligen Anforderungen zugeschnittene, untereinander selten kompatible Datenformate. Diese lassen sich in Anlehnung an die musikalischen Kommunikationsebenen im Wesentlichen in die drei Kategorien notations-, klang-und analyseorientierte Datenformate unterteilen.
Die notationsorientierten Formate versuchen, die zweidimensionale und hochgradig von grafischen Anteilen geprägte Notenschrift so auf line are, also eindimensionale Zeichensequenzen abzubilden, dass der Computer daraus die Partitur rekonstruieren und auf dem Bildschirm darstellen kann. Darüber hinaus sollen diese Formate die Suche auf Partiturdaten erlauben sowie Transformationen im Sinne der musikalischen Logik, wie Transposition oder Augmentation, ermöglichen. Letztere ebnen beispielsweise den Weg zur Realisierung von Suchfunktionen, die über starre Identitätsvergleiche hinausgehen und die Erkennung von Ähnlichkeiten in transformierten Notensequenzen oder Akkordfolgen berücksichtigen.
Zu den ältesten Datenformaten dieser Art gehört der Anfang der 1970er-Jahre von Barry Brook und Murray Gould entwickelte Plaine and Easy Code (PEC) zur Beschreibung monophoner Notensequenzen.14) Das Prinzip besteht hierbei darin, die verschiedenen Notenparameter, wie Stammton, Versetzungszeichen, Oktave, Notenwert usw., welche in der konventionellen Notenschrift durch variierende grafische Informationen und vertikale Anordnungen quasi in einem Symbol verschmelzen, in separate Zeichenfolgen zu zerlegen. Eine in Viertelnoten notierte und in der eingestrichenen Oktave beginnende aufsteigende D-Dur-Tonleiter im Violinschlüssel besitzt im Plaine and Easy Code die Gestalt

G-2 4'd e xf g a b''xc d.

Diese vergleichsweise intuitive Codierung kommt noch heute bei verschiedenen Institutionen zum Einsatz. In der umfangreichen Musikhandschriften-Datenbank des RISM15) wird der Code zur Speicherung von Musikincipits genutzt. Eine ebenfalls auf PEC basierende Suchfunktion gestattet so das schnelle Auffinden vergleichbarer Themen oder Motive.
Da die alphanumerische Partiturbeschreibung nicht nur zur Speicherung, sondern auch zur Generierung neuer bzw. modifizierter Notenbilder verwendet werden kann, eignet sich das Format ebenfalls gut zum Einsatz in adaptiven Lernprogrammen. Die Gehörbildung des Computerkollegs Musik16) beispielsweise erzeugt die im Zusammenhang mit einer Höraufgabe präsentierten Notengrafiken erst in dem Moment aus einem Derivat des Plaine and Easy Codes, in dem sie tatsächlich auf dem Bildschirm angezeigt werden müssen. Dies befreit den Programmierer einerseits von dem Zwang, eine Vielzahl oft nur leicht variierender statischer Grafiken in die Anwendung einbinden zu müssen und erlaubt andererseits die gezielte, am Kenntnisstand des Lernenden ausgerichtete Generierung geeigneter Notenbeispiele.
Besonders hervorzuheben ist ein weiteres alphanumerisches Datenformat zur Beschreibung notationsbezogener Inhalte, das in dieser Kategorie aufgrund einer großen Zahl vorliegender Transkriptionen eine wichtige Stellung einnimmt. MuseData17) wurde am Center for Computer Assisted Research in the Humanities der Stanford University entwickelt und wird weiterhin aktiv gepflegt. Im Gegensatz zu PEC können mit MuseData beliebige konventionell notierte Partituren beschrieben werden. Die über das Internet erreichbare Datenbank umfasst rund 900 Werke überwiegend barocker Komponisten und kann nach einer kostenlosen Registrierung zu privaten, wissenschaftlichen und Ausbildungszwecken genutzt werden.
Neben PEC und MuseData existieren unzählige weitere alphanumerische Notencodes mit jeweils unterschiedlichen Schwerpunkten, die zum größten Teil wie MuseData die Beschreibung komplexer polyphoner Partituren erlauben.18) Zur Repräsentation der Interpretation eines Notensatzes eignen sie sich hingegen nur bedingt. In diesem Anwendungsfeld spielt üblicherweise das bekannte MIDI-Format eine dominierende Rolle, das im Gegensatz zu den diversen Notencodes eine frühzeitige Standardisierung erfahren hat und auf diese Weise die Parallelentwicklung zahlreicher proprietärer Formate mit vergleichbarem Einsatzgebiet verhindert hat. Zwar existieren einige nicht vom Standard abgedeckte lokal genutzte MIDI-Erweiterungen, denen jedoch keine größere Verbreitung gelang. Anders als auf den ersten Blick vielleicht zu vermuten wäre, kommt den Audioformaten als Musikinformationsmedium ebenfalls keine besondere Bedeutung zu. Die bei der akustischen Aufzeichnung zu einem Konglomerat verschmelzenden musikspezifischen Daten lassen sich aus den gesampleten Daten kaum algorithmisch rekonstruieren, sodass die in Wave-oder MP3-Dateien gespeicherten Werte zwar unter akustischen Gesichtspunkten von Interesse sind, als Träger computertechnisch auswertbarer musikalischer Informationen eignen sie sich ab einem gewissen Komplexitätsgrad der Musik jedoch nicht.
MIDI bildet heute nach wie vor die Ausgangsbasis für viele performanceorientierte Musikanwendungen. Bekanntermaßen werden hier Noteninformationen lediglich als Zahlen abgelegt, die eine bestimmte Taste der Klaviatur bezeichnen, d. h. Unterscheidungen bezüglich der Enharmonik sind nicht mehr möglich. Ähnliches gilt auch für die Notenwerte, die zwar noch relativ zu einem Grundschlag codiert werden, denen allerdings jeder direkte Bezug zur notierten Taktart und dem dadurch induzierten Metrum fehlt19), zumal die Dauer einer MIDI-Note nicht nur den entsprechenden Notenwert der Partitur sondern gleichzeitig Artikulations- und Agogikangaben abbilden muss. Diese Loslösung von der Partitur und die Verlagerung des Schwerpunkts auf die Interpretation, einschließlich aller notationstechnisch nur schwer fassbaren Tempoangaben sowie der natürlichen Unregelmäßigkeiten beim Musizieren, öffnet einen völlig anders gearteten Raum musikalischer Informationen. Dieser wird von Forscherteams u. a. dazu genutzt, Hinweise auf Zusammenhänge zwischen musikalischem Material und verschiedenen Interpretationen desselben zu gewinnen. Mit dieser Thematik beschäftigt sich u. a. die maßgeblich von Guerino Mazzola an der ETH Zürich vorangetriebene Mathematische Musiktheorie, aus der auch das Computerprogramm Rubato20) zur Generierung musikalischer Interpretationen hervorgegangen ist. Aufgrund der Standardisierung sowie der allgemeinen Akzeptanz von MIDI-Dateien als musikorientiertes Vektorformat, werden im Internet unterschiedliche Einspielungen verschiedenster Stücke in allen Qualitätsstufen kostenlos zum Download angeboten. Allein die Classical Music Archives21) umfassen mehr als 19 000 MIDI-Dateien von über 1 000 Komponisten aus dem Bereich der „klassischen Musik". Dazu kommen weitere vergleichbare Angebote aus nahezu allen Musiksparten. Datenmaterial steht somit reichlich zur Verfügung. Musikimmanente Informationen erschließen sich dem Hörer der Musik oder dem Betrachter einer Partitur oft erst durch eine Analyse, gerade wenn das Augenmerk auf komplexere als die offensichtlichen Strukturen gelegt wird. Die daraus hervorgehenden Resultate werden, wie bereits erwähnt, meist in Textform dargelegt und entziehen sich somit einer weiteren algorithmischen Verarbeitung, insbesondere also der Suche nach genau solchen Informationen. Diese Informationen sind es mitunter aber, welche die Grundlage weiterer Analysen bilden. Es liegt also nahe, die Resultate einer zuvor erfolgten Analyse ebenfalls in computerlesbarer Form zu beschreiben. Eine frühe Umsetzung dieses Ansatzes stellt das Humdrum-Toolkit22) in Verbindung mit dem Notenrepräsentationsformat Kern dar, welches dazu entwickelt wurde, Antworten auf Fragen bezüglich einer Komposition oder einer ganzen Klasse von Kompositionen zu erhalten. So ist das System beispielsweise in der Lage festzustellen, ob Komponisten im Allgemeinen dazu tendieren, die Wörter „hoch", „high" oder „haute" in Vokalwerken durch hohe Töne zu unterstreichen.23) Die Ergebnisse einer solchen Auswertung können wieder in einer selbst zu definierenden Humdrum-Repräsentation abgelegt und weiterverarbeitet werden.
Wenn es darum geht, Erkenntnisse über Musik mit der interessierten Öffentlichkeit auszutau schen, behindern die zahlreichen lokalen Daten formate dieses Anliegen mangels geeigneter Konvertierungsprogramme. Ferner bieten die wenigsten für ein spezielles Anliegen ad hoc entworfenen Formate geeignetes Verallgemeinerungs-oder Aus baupotenzial, um es als gemeinsame Basis für Arbeitsgruppen mit verschiedenen Schwerpunkten nutzen zu können. Formale Abhilfe schafft hier die Extensible Markup Language (XML). XML bietet die Möglichkeit zur plattformunabhängigen Speicherung und Beschreibung strukturierter Daten. Die Besonderheit gegenüber anderen Formaten besteht darin, dass XML eine Metasprache zur Definition so genannter Markup-Sprachen darstellt und damit anders als z. B. das verwandte HTML keine eindeutig festgelegte Semantik besitzt, sondern abhängig vom jeweiligen Anwendungsbereich individuell gestaltet werden kann. Die einheitliche Syntax in Verbindung mit den strukturiert beschriebenen Daten gestattet einen deutlich vereinfachten Datenaustausch. Selbst wenn ein definiertes XML-Format weiterentwickelt oder modifiziert wird, können die zuvor gespeicherten Daten leicht übertragen werden.
Das zunehmend an Bedeutung gewinnende MusicXML24) soll laut seinen Entwicklern nach und nach die vielfältigen Musikformate ablösen und ihre jeweiligen Fähigkeiten in sich vereinigen. So ist geplant, neben der bisher realisierten Beschreibung von Partituren auch performanceorientierte Daten à la MIDI sowie Metadaten zur Struktur der Musik in die Spezifikation aufzunehmen. Damit würde sich MusicXML u. a. als allgemeine Datenbasis für die Suche nach musikimmanenten Informationen eignen. Die vom Hersteller Recordare angebotenen Konverter für MuseData und das Notationsprogramm Finale treiben die Verbreitung von MusicXML zusätzlich voran und es ist anzunehmen, dass es mittelfristig einen bedeutenden Stellenwert beim allgemeinen Austausch musikalischer Informationen erlangen wird.
Einen etwas anderen Ansatz verfolgt das MUSITECH- Projekt25) der Forschungsstelle Musik-und Medientechnologie der Universität Osnabrück. Hier wird versucht, eine allgemeine Infrastruktur für musikspezifische Computeranwendungen unterschiedlichster Art zu schaffen. Dies schließt ganz ausdrücklich auch internetbasierte Lernprogramme mit ein. Basierend auf einem in Java realisierten, erweiterbaren Objektmodell können beliebige Strukturen aller Informationsschichten beschrieben werden. Ausgehend von diesem Modell lassen sich die Daten und Relationen der virtuellen Objekte u. a. in das MusicXML-Format abbilden, um auch hier einen systemübergreifenden Datenaustausch zu ermöglichen. Geplant sind ebenso die Bereitstellung geeigneter Konverter für verschiedene Formate sowie die Entwicklung benutzerfreundlicher Hilfsmittel und Komponenten zur Erstellung der Musikanwendungen.
Aus dem großen Spektrum der unterschiedlichen Musikformate konnte an dieser Stelle nur ein kleiner Ausschnitt berücksichtigt werden. Die steigende Bedeutung des Internet gerade auch im Hinblick auf Musikinformationen erfordert die vereinheitlichende zeitlich stabile Repräsentation unterschiedlichster Daten, denn nur dadurch wird das zur Verfügung stehende Informationspotenzial langfristig effizient nutzbar. Aus dieser Sicht scheint sich die Vielfalt der Datenformate zunehmend zugunsten vereinheitlichender Repräsentationsformen zu verlagern. XML stellt in dieser Hinsicht eine vielversprechende Grundlage dar, sodass auch Musikinformationen mittelfristig in größerer Zahl in dieses Format übertragen und auf diese Weise einer globalen Recherche zugänglich gemacht werden.

Zusammenfassung

Die heutige Gesellschaft ist auf Informationen jeglicher Art angewiesen. Mit dem Internet steht eine Infrastruktur zur Verfügung, die den weltweiten Austausch beliebiger Daten ermöglicht und somit eine ideale Informationsquelle darstellt. Aufgrund der heterogenen Struktur des Internet liegen bereitgestellte Daten in uneinheitlicher Form und in stark differierender Qualität vor. Infolgedessen werden Techniken zur Strukturierung bzw. zum schnellen Auffinden gesuchter Informationen benötigt. Da der Wert einer Information im Wesentlichen von den Ansprüchen des Informationssuchenden abhängt, stellen Linklisten und Archive zu ausgewählten Themen nur ein bedingt geeignetes Mittel dar, denn sie wurden schließlich nach den subjektiven Kriterien des Anbieters zusammengestellt. Letztlich scheinen großflächig indizierende Suchmaschinen das einzig universelle Instrument zum Auffinden individuell relevanter Informationen zu sein.
Während die Suche über Textdokumente recht fortgeschritten ist, fehlt es im Bereich der Musikformate an vergleichbaren Hilfsmitteln. Musikimmanente Informationen können in textlich beschreibender Form nur bedingt transportiert werden – die vollständige Information wird nur via Partitur bzw. durch die Musik selbst vermittelt. Ziel vieler Forschungsarbeiten ist es deshalb, Verfahren zu entwickeln, welche die direkte Suche auf musikalischen Daten ermöglichen. Da die Schwerpunkte der lokalen Gruppen jedoch oft unterschiedlich ausgerichtet sind, entstehen zahlreiche, zueinander inkompatible Formate, mit deren Hilfe zwar zahlreiche Kompositionen bzw. Interpretationen geeignet repräsentiert, aber nicht übergreifend mit einheitlichen Techniken ausgewertet werden können. Eine solche, zumindest partielle Vereinheitlichung bildet aber die Voraussetzung für eine Suche auf großen Datenmengen.
Als allgemein akzeptierte Basis zur Datenspeicherung setzt sich zunehmend das XML-Format durch. Dieses eignet sich dank der starken Strukturierungsmöglichkeiten auch zur Beschreibung von Musik und musikalischen Zusammenhängen. Mit MusicXML steht schon jetzt ein Dateiformat zur Ver f ügung, das im Hinblick auf die Beschreibung von Partituren kaum noch Wünsche offen lässt. Es bleibt zu hoffen, dass diese oder eine vergleichbare Repräsentationsform um die noch fehlenden Aspekte zur Speicherung performancespezifischer bzw. analytisch-struktureller Daten erweitert wird, damit auf diese Weise ein universelles Format entsteht, das dazu beitragen kann, beliebige Musikinformationen im Sinne der eingangs zitierten Worte an jedem Ort und zu jeder Zeit verfügbar zu machen.

Martin Gieseking ist wissenschaftlicher Mitarbeiter der Forschungsstelle Musik- und Medientechnologie der Universität Osnabrück.


1) www.big-internet.de/initiative.htm (Stand: 2.6.2002).

2) Hans Strohner, Information, Wissen und Bedeutung – Eine Analyse systemischer Strukturen sprachlicher Kommunikation, in: Rüdiger Weingarten, Information ohne Kommunikation? Die Loslösung der Sprache vom Sprecher, Frankfurt am Main 1990, S. 211.

3) Vgl. z. B. Gerhard L. Endres, Die Zauberlehrlinge und der Mythos Computer. Über den falschen Glauben an die Informationsgesellschaft. Fragen an den Informatik-Pionier Joseph Weizenbaum, in: Publik-Forum 10/ 2000, S. 8 –10.

4) Karl Popper, Objektive Erkenntnis, Hamburg 1995.

5) www.epos.uos.de.

6) Das Portable Document Format (PDF) wurde von dem US-amerikanischen Software-Hersteller Adobe Systems Inc. (www.adobe.com) definiert und wird weiterhin aktiv gepflegt und weiterentwickelt. Die vollständige PDF-Spezifikation sowie die zugehörige Anwendung zum Be trachten der Dokumente (Adobe Acrobat Reader) können kostenlos von den Web-Seiten des Herstellers heruntergeladen werden.

7) www.cs.wisc.edu/~ghost.

8) www.dante.de.

9) Bei Regulären Ausdrücken handelt es sich um spezielle Suchmuster, die den syntaktischen Aufbau ähnlicher Zeichenfolgen beschreiben. Sie stellen u. a. ein mächtiges Hilfsmittel zum Auffinden von Textstellen dar, deren exakte Syntax unbekannt ist. Ausführliche Informationen findet der interessierte Leser u. a. in: Jeffrey Friedl, Reguläre Ausdrücke, Köln 1998.

10) www.ub.uos.de/osiris/index.html. Vgl. auch Marc Ronthaler und Hartmut Zillmann, Literaturrecherche mit OSIRIS – Ein Test der OSIRIS-Retrievalkomponente, in: Bibliotheksdienst: Organ der Bundesvereinigung Deutscher Bibliotheksverbände, Heft 7, 1998.

11) Guerino Mazzola, Geometrie der Töne – Elemente der Mathematischen Musiktheorie, Basel 1990.

12) Eines der zahlreichen Notenarchive ist das Werner Icking Music Archive (http://icking-music-archive.sunsite.dk).

13) Vgl. z. B. Donald Byrd, Music Notation by Computer, Indiana University 1985, S. 100.

14) Vgl. z. B. Barry S. Brook, The Plaine and Easy Code, in: Musicology and the Computer, Three Symposia, New York 1970, S. 53ff.

15) Répertoire International des Sources Musicales (http://rism. harvard. edu/rism).

16) www.schott-online.com/nocache/smi/produkte/multimedia/Wissen/ComputerkollegMusik.

17) www.musedata.org.

18) Einen Überblick findet der Leser z. B. in: Eleanor Selfridge-Field, (Hg.), Beyond MIDI – The Handbook of Musical Codes, Massachusetts 1997.

19) Vgl. z. B. Martin Gieseking, Codebasierte Generierung interaktiver Notengraphik, Osnabrück, 2001, S. 93ff.

20) www.rubato.org.

21) www.classicalarchives.com.

22) www.music-cog.ohio-state.edu/Humdrum.

23) Vgl. www.music-cog.ohio-state.edu/Humdrum/sample.problems.html.

24) www.recordare.com. Vgl. auch: Walter B. Hewlett, Eleanor Selfridge-Field (Hg.), The Virtual Score – Representation, Retrieval, Restoration. Computing in Musicology Bd. 12. Cambridge 2001, S. 113ff.

25) http://musitech.fmt.uni-osnabrueck.de.