quinta-feira, 7 de fevereiro de 2008

Access to Music Archives

Nota importante: a tradução (ainda em curso) é minha por isso é bastante deficiente. Aconselho vivamente a leitura do original em inglês.

«Access to Music Archives Project»

«O projecto Access to Music Archives visa crear um portal de acesso a fundos arquivísticos de música independentemente da sua localização geográfica. O projecto irá desenvolver software para pesquisar metadados de catálogos de fundos arquivísticos de música existentes em linha e, ao mesmo tempo, criar um protótipo de base de dados para instituições que não tenham a possibilidade de desenvolver um, com vista a assegurar uma ampla participação. As bases de dados individuais serão mantidas pelas instituições detentoras dos arquivos e o projecto não será responsável por actualizar continuamente o seu conteúdo. Este projecto piloto é o trabalho de cooperação entre as maiores instituições musicais na Europa e na América do Norte sob os auspícios do IAML (International Association of Music Libraries, Archives, and Documentation Centres). O presidente Massimo Gentili-Tedeschi diz "Este é um projecto da máxima importância para os académicos de música uma vez que não existe um recurso que permita localizar facilmente fontes primárias de música em arquivos".»

«A complexidade dos arquivos de música no que diz respeito à sua localização, formatos, proveniência e acesso necessita de um projecto que unifique e torne acessíveis as fontes sources para os utilizadores. Os arquivos de música podem existir em instituições musicais, sociedades históricas, museus, bibliotecas ou outros arquivos não relacionados com música. Os fundos de música contêm documentos de uma grande variedade de formatos e meios tais como o papel (manuscritos musicais, documentos e cartas por exemplo), gravações (desde os cilindros de cera, aos 78 rotações, LP, cassetes, videocassetes, CD, DVD, etc.) e fotografias (ou outros formatos visuais); até ao momento apenas uma fracção deste material inestimável está disponível em catálogos em linha.»

«Os fundos de arquivo podem ser produzidos por indivíduos ou instituições tais como compositores, coros, orquestras, companhias de ópera, universdades e conservatórios, igrejas, bandas militares, editores e quaisquer instituições produtoras de música. O nível de descrição destes fundos também pode variar muito: catalogação completa e/ou EAD (Encoded Archival Description), catalogação mínima, catálogos manuais ou nenhuma catalogação de todo. Pelas nossas estimativas, menos de 5% dos instrumentos de descrição estão disponíveis em linha. Quando estão acessíveis, diferentes instituições podem ter diferentes metadados, sistemas de catalogação em linha ou motores de pesquisa. Acresce que o material de arquivo pode ainda estar incluído em colecções muito maiores que não são arquivos ou arquivos de música. Mesmo as boas bases de dados normalizadas como as das bibliotecas nacionais como Kalliope na Alemanha, Cecilia no reino Unido e NUCMC nos Estados Unidos, cada qual requere ao utilizador a aplicação de diferentes estratégias de pesquisapara obter informação sobre o mesmo assunto em diferentes bases de dados.»

«Esta situação cria barreiras e nega o acesso aos investigadores para localizar arquivos sobre temas de interesse uma vez que enfrentam uma multiplicidade de interfaces de pesquisa e localizações desconhecidas. Os motores de pesquisa existentes têm dois problemas: não permitem pesquisas em domínios específicos conduzindo a pesquisas com muito ruído; além disso, muitos arquivos de música de valor ainda não estão acessíveisna Internet ou aí referenciados contribuindo para a falta de resultados relevantes.»

«O projecto piloto»

«Considerando a situação actual dos arquivos de música o AMA Working Group embarcou num projecto que vai proporcional uma pesquisa partilhada para os utilizadores. Este registo vai periodicamente capturar metadados de bases de dados de arquivo existentes que participem no projecto (denominadas data providers). O uso de captação dinâmica assegurará a frequência de dados no registo e evitar importações manuais, catalogação duplicada e outras operações que não são sustentáveis a longo prazo. Ao mesmo tempo AMA irá criar uma base de dados para instituições que não podem pagar ou não têm possibilidades de criar uma; qualquer instituição que o deseje poderá participar. Esta base de dados será ela própria poderá ser objecto de captura como as outras. Prevemos que este projecto dure dois anos, a começar no Verão de 2007.»

Survey
AMA plans to carry out a survey to identify existing music archives and collections, as well as their existing cataloguing infrastructure (if any) and its suitability for OAI (Open Archive Initiative) access. The network1 and members of the IAML national branches will help publicize the survey and encourage participation by their fellow archivists. The survey will be carried out via a web form on the Society's home page, allowing for the convenience of the survey taker as well as ease of gathering the survey data. The aim of the survey is twofold: to identify the specifics about the collections (form of access, scope of materials, links to finding aids and/or digital images, ISAD-compliance, technical information, and physical condition) and to determine the eventual scope and size of the project. A survey carried out by the Society in 1988 revealed that there is a great variety in the registration and processing of music archival materials in the different types of musical and non-musical institutions such as libraries, museums, and archival institutions. The new survey will update us on their current technologies and the technical approach our project should take considering such a diverse group. It will also allow participants to comment on the survey and the project. Moreover, the survey will also inform us on the scope and scalability of our final project. The survey will be one of the first steps of our pilot project, and the survey design is already underway. This survey will also inform us where national archives groups may need to be established to manage the full project and ensure its sustainability in the future.

Modelling
Some ground work has already been laid in establishing the metadata model for the registry. AMA members have agreed that the principal fields in the database will be based on ISAD-G (the General International Standard Archival Description) as laid out by ICA (the International Council on Archives). Most of the established archival databases already use this standard, including UK's Cecilia, Germany's Kalliope, and the US's NUCMC. We have agreed that if we allow a core bibliographic record of only 4 basic fields as originally suggested by ICA, with the option of including more fields, we will encourage more archives to join the project and allow access to in-process collections as well. These minimal-level records can always be filled in with more information at a later date. After the informational survey, adjustments will have to be made as the survey results come in and when the database starts harvesting actual contents with different kinds of data. Other issues that have yet to be addressed include multiple languages and name authorities. We will look to IAML's other projects such as RISM and RILM as models on some of these issues because these projects have a proven record in resolving these particular issues.

Basic Architecture and Technologies
The server will harvest metadata from the participating institutions using the OAI protocol. Other protocols (such as Z39.50) may have to be considered in those cases where adding an OAI access point is technically or financially unfeasible.

The server will provide an interface to search or browse the collected metadata. Each metadata record will point to the original record in the participating institution, which may contain more information than the one in the registry does. The underlying software system we envision is an open source framework called SDX2, which is currently being used in two other portals at the technical lead's institution, IRCAM (the Institut de Recherche et Coordination Acoustique/Musique).

Each data provider will expose its metadata in a common format by putting it in a repository for the central registry to harvest via the selected protocol, while it will continue to administer its catalogue using its own formats. In other words, every data provider must enable harvesting via the selected protocol, and map its metadata to the common format. Those providers in the pilot project whose archives contain other material in addition to music archives will have to group them in distinct sets3 to allow for selective harvesting. The common metadata model will be designed in adherence to international archive standards. It will allow for the description of multi-level collections down to the item level. The registry will provide searching and browsing across all data providers, with the capability of restricting the scope to specific providers. Results will include the appropriate normalized records, which will contain the descriptions and locations of the corresponding collections or items. Each such record will also provide access to the original local metadata, which may contain more detailed information, and to the digitized item if available and accessible. Each data provider will be able to attach optional access rights to any level of their metadata (collections, items) and data (if available), thereby controlling access. The registry will also provide to those organizations which do not have an existing catalogue or database a basic web site allowing them to catalogue their collections. This site will then be harvested like the others.

The user query interface will be web-based, making it widely accessible.

Software Development
One of the principal tasks of the pilot project will be the development of the harvesting software. It will also include collaboration with the participating institutions in the adaptation of their systems to allow for harvesting.

Participants
Several organizations, all IAML members owning significant music archives, have agreed to participate in the pilot project: the British Library, the Bibliothèque nationale de France, the Staatsbibliothek zu Berlin, the Den Haag Gemeente Museum (NIMI), and a few smaller institutions will participate. We expect to have a total of eight institutions of varying types participating in our pilot project. This defined number of collections with diverse types of metadata (different countries, different kinds of institutions with different sizes) will be a good test for us to tease out the main design issues of our final database: the diversity in its platforms, languages and data models, access rights, scalability, and sustainability.

For the full project, we are seeking participation from all institutions with holdings of music archive collections.

Sem comentários: