버크 와이버그
스위스공연예술아카이브 프로젝트 매니저

스위스공연예술아카이브(The Swiss Archive of the Performing Arts, 이하 ‘SAPA’)는 처음에 베른, 로잔 그리고 취리히에 개별적으로 설립되어 있던 3개의 아카이브를 2017년에 통합하면서 만들어졌다. SAPA 이전 기관들의 역사를 살펴보면, 전승·발전을 통해 변화하는 무형문화유산과 마찬가지로 원형대로 보존될 수 없는 공연예술 분야의 기록을 위해 지속적으로 접근법을 개발해왔다는 것을 알 수 있다. 우리의 기록 보존을 위한 노력은 약 백 년 전 스위스의 극장 문화에 관한 서적과 다른 기록물을 수집하기 위한 계획에서 시작되었다. 이후 무대 설계도와 모형과 같은 공연 자료를 수집하여 작은 박물관에 소장하였다. 1990년대 들어 현대 무용의 영상 녹화 활용이 증가하면서2005년 취리히에 구(舊) 댄스미디어도서관(Dance Media Library)이 설립되었다.
공연예술 분야의 기록화 방법이 발전해온 이 짧은 연대기를 통해 알 수 있듯이 SAPA의 설립은 보다 종합적인 기록 유형으로, 다양한 종류의 데이터를 수집하고 융합하려는 시대적 흐름 속에서 이루어졌다. 따라서 우리의 핵심 임무는 기존의 흩어져 있던 다양한 데이터베이스를 하나의 데이터베이스(performing-arts.ch)로 통합하는 것이었다.
SAPA 설립 이전의 기관들은 데이터베이스의 활용에 있어서 뚜렷이 다른 접근법을 보였다. 예를 들어 전통적인 아카이브 데이터베이스의 경우는 보유 현황에 따라 자료를 계층적으로 보여주었다면, 도메인 특정 정보를 저장하기 위한 사용자 정의 필드를 갖춘 다양한 전문 데이터베이스도 있었다. 이들 데이터베이스에 있는 정보는 두 가지로 분류되는데, 하나는 우리가 보유한 자료 내의 공연예술 작품이나 출연진과 관련된 기록, 유물을 기술한 것이며, 나머지는 비록 우리가 기록 자료를 보유하고 있지 않지만 해당 분야의 작품과 출연진에 대해 기술한 것이다. 후자의 정보 유형 중 일부는 19세기 후반 이후 스위스에서 공연된 6만여 작품에 대한 제작 설명과 출연자의 이름이다. 데이터베이스의 이러한 기록물 정보는 3만여 개인 및 단체, 공연 장소에 대한 안정적인 식별자와 기본적인 사실을 제공하는 파일의 역할을 한다.
이러한 다양한 종류의 정보를 연결하기 위한 우리의 노력은 기록물 정보에 접근하는 기본적인 방법이 되는 출처(Provenance) 원칙의 보급에 의문을 제기하는 아카이브 공동체 내의 광범위한 움직임과 뜻을 같이했다. 기존 서사물의 영구 보존에 대한 회의론과 기록물 보존 기구를 활용하려는 권력구조는 국제아카이브협회(InternationalCouncil on Archives, ICA)가 현재 진행하고 있는 기준인 국제 보존 기록 기술 규칙(ISAD(G))을 대체할 새로운 기술적 표준 (Records-in-Context, 이하 ‘RiC’) 개발에서 가장 잘 드러난다. 이름이 보여주듯이 RiC는 독특한 식별자를 활용함으로써 기록과 기록 작성자뿐만 아니라 주제와 관련된 다른 특성들도 확인할 수 있도록 해 준다.


RiC의 개발은 기록물 기술 표준의 상당한 발전을 의미하지만, 아쉽게도 도메인별 정보를 제공하지 않는 보존기록 기록물 기술 표준으로 남아있다. 그래서 우리는 그것을 박물관을 위해 개발된 문화유산 연계를 위한 개념모형(이하 ‘CIDOC CRM’) 표준과 그 확장형인 서지 정보를 위한 데이터 모델인 FRBRoo와 조합했다.
특히 FRBRoo의 온톨로지(사물 간의 관계 및 여러 개념을 컴퓨터가 처리할 수 있는 형태로 표현하는 것)는 개념, 연출, 그리고 실제 공연을 구별하는 공연 예술의 분류법을 제공하고 있어 공연예술의 기록에 도움이 된다는 것이 증명되었다.2 CIDOC CRM와 FRBRoo가 무형문화유산 데이터 기록에 특히 적합한 이유는 이전의 데이터 모델은 박물관이나 아카이브에 소장된 물리적 대상에 대한 설명에 한정되어 대상을 이해하는 반면, 데이터를 생성 변경한 활동을 통해 대상을 구성한다는 점이다.
고도의 복잡성이 요구되는 더 상세하고 사실적인 공연 예술 데이터 모델 개발 역시 그래프 데이터베이스 개발에 의해 뒷받침 되었다. 여전히 지배적인 관계형 데이터베이스가 통일된 항목을 가진 일련의 구조화된 데이터가 되면, 그래프 데이터베이스는 사실상 점과 선으로 구성된 무한대의 네트워크로서 데이터를 담게된다. 이들은 온톨로지에 의해서 의미상 범위가 정해질 뿐이다.
RiC의 개발자들이 의도한 대로 이 리좀형(다양한 주체가 커다란 하나를 형성하는 것)의 구조는 출처 체계를 극복할 수 있는 데이터에 대한 새로운 관점을 제공하고 있다. 또한 지식 그래프의 내재된 다차원성은 사실상 모든 것을 식별할 수 있고 따라서 다른 공연 정보와도 연결될 수 있는 데이터베이스 안에서는 공연 장소를 포함해 모든 것이 네트워크의 중심이 될 수 있듯이, 인간중심주의를 극복하는 데에도 도움이 될 수 있다.
기존 데이터를 구조화된 데이터로 바꾸는 작업은 어렵고 힘든 과정이었다. 이 작업은 공연에 대한 다양한 유물들을 설명하고 출연진과 제작 과정과 관련된 기록물 데이터를 포함할 수 있는 모델을 개발하는 데에서 시작되었다.3 이제까지 자유 텍스트 영역에 저장되어 있었던 정보는 표기된 내용을 조정할 수 있도록 정리 되고 형식이 갖춰질 필요가 있었다. 결국 데이터를 유지, 편집하기 위한 인프라가 필요했다. 첫 단계에서는 단순히 시간과 인내가 필요했지만 두 번째 단계에서는 자원 기술 프레임워크(Resource Description Framework, RDF) 데이터를 이상적으로 저장하고 데이터 모델에 따라 사용자 지정 인터페이스를 구축할 수 있는 소프트웨어가 필요했다. 우리의 데이터베이스는 메타팩토리 지식 그래프 플랫폼을 기반으로 구축되었다. 이는 주로 트리플스토어 데이터베이스에 저장된 복합적인 데이터를 활용한 산업 프로젝트에서 점차 인기를 끌고 있지만, 문화 데이터에도 쉽게 활용될 수 있는 소프트웨어이다.
모든 관련 항목을 위한 지속적인 식별자와 플랫폼 독립 온톨로지를 갖춘 그래프 데이터베이스의 선택은 FAIR 데이터 원리(검색 가능성, 접근성, 상호 운용성, 재사용성)를 따르는 지속가능한 데이터 관리와 관련된다. 다른 전거 파일에 기술된 개인, 단체 혹은 장소와 같은 항목은 이들과 광범위하게 연결되며 통제된 어휘에도 동일하게 적용된다. 검색성을 개선하기 위해 정보가 우리는 위키미디어의 구조화된 데이터 플랫폼인 위키데이터에 많은 항목을 등록해야 했는데 이는 문화유산 기구들을 연결하는 허브로서 점점 더 관련성이 높아지고 있다. 빠진 항목이 위키데이터에 추가되고 나면 다른 사용자 혹은 봇(bot)에 의해 정보가 더 보강될 수 있다. 사용자들은 온톨로지의 질의 언어인 SPARQL(Simple Protocol and RDF Query Language)인터페이스를 통해 우리 데이터베이스에서 필요한 자료를 검색하여 저작권 표시, 동일조건변경허락(CC BY-SA)의 라이선스 하에서 사용 할 수 있다. 현재 데이터의 상호운용성은 기본적으로 우리가 국가문화유산의 시청각 자료 보존을 위한 스위스 네트워크인 메모리아프(Memoriav)와 그 데이터베이스(memobase.ch), 그리고 독일어 사용 연구 공동체를 위한 핵심 정보 출처인 극무용연구소를 위한 공연예술 전문정보서비스(Specialised Information Service, SIS)가 운영하는 정보 사이트(performing-arts.eu)에 고품질의 자료를 제공할 수 있도록 하고 있다.
performing-arts.ch는 현재 진행형 프로젝트다. 우리는 더 많은 공연 관련 정보를 찾아내고 더 많은 기존 데이터베이스를 흡수하여 정보의 다차원성을 확보할 것이다. 또한 지식 그래프 접근이 용이해질 수 있는 대안적 인터페이스에 대해 지속적으로 고민함으로써 데이터의 질을 향상시켜 나갈 것이다.

참고 자료

  1. Bogdan-Florin Popovici, “A Broader Perspective on Records as Seen by Records-in-Contexts,” Comma 2016:1–2 (January 2018):189–98, doi:10.3828/comma.2016.19.
  2. Martin Doerr, Patrick Le Boeuf, and Chryssoula Bekiari, “FRBRoo, a Conceptual Model for Performing Arts,” in 2008 Annual Conference of CIDOC, Athens, 2008, 15–18.
  3. For the original data model, see Beat Estermann and Christian Schneeberger, “Data Model for the Swiss Performing Arts Platform” (Draft Version 0.51, 2017), available at https://datahub.io/dataset/spa-data. The current implementation is documented at https://sapa.github.io/spa-specifications/.