“우리가 궁금한 것은 누가 예매를 했느냐가 아니라, 누가 공연장에 오느냐입니다!”

무더웠던 지난 2019년 여름, 예술경영지원센터와 데이터마케팅코리아가 함께 진행한 <빅데이터로 마케팅 혁신> 멘토링 과정 참여를 위해 선발된 단체들이 처음 만났을 때 나온 외침이었다. 공연장이나 공연단체는 회원과 예매자 데이터를 누구보다 풍부히 가지고 있을 거란 생각에 부럽기만 했는데 예매를 누가 했는지보다 누가 공연장에 오느냐가 더 중요하다니, 공연과 연관된 데이터에 대한 고정관념이 깨지기 시작한 순간이었다. 참여했던 모든 단체가 찾고자 했던 데이터는 한 방향을 가리키고 있었다. 바로 공연 관객은 어디에 있느냐에 대한 물음에 대한 답이다.

공연과 관련된 일을 하며 본격적으로 빅데이터라는 단어를 접한 것은 2018년으로 거슬러 올라간다. 입사 이래 지속해서 공연 관객을 위한 다양한 콘텐츠와 서비스를 기획하고 운영하고 있었지만, ‘관객’에 대해 더 잘 알고 싶다고 생각하던 중 예술경영지원센터의 예술경영아카데미특별과정 <모바일 시대의 신규 관객개발> 특강을 접하게 된 것이다.
‘빅데이터’는 ‘4차 산업혁명’과 더불어 여러 산업 분야에서 언급되기 시작하면서 비교적 익숙해진 단어였지만 한편으론 막연하게 느껴졌었다. 그런데 특강을 통해 빅데이터가 ‘우리가 이미 알고 있고 하고 있는’ 다양한 활동으로 인해 생성되는 것이며, 데이터에 어떻게 접근해야 하는지를 일차적으로 인지하게 되었다.
이 특강 이후 그로스해킹, 구글 애널리틱스 등을 통해 기존에 자사가 가지고 있는 데이터를 더 들여다보는 시간을 갖고, 과학기술정보통신부 산하 기관인 한국데이터산업진흥원의 여러 콘퍼런스를 통해 빅데이터에 대한 이해도를 높여가기 시작했다.

2019년 5월, 또 한번 빅데이터에 대해 접근할 수 있는 기회가 찾아왔다. 예술경영지원센터의 기술 초보 탈출 교육컨설팅 <빅데이터로 마케팅 혁신> 과정에 참여할 기회가 생긴 것이다.

<빅데이터로 마케팅 혁신> 교육 현장 모습
*출처: 데이터마케팅코리아 블로그 <빅데이터로 마케팅 혁신> 교육 현장 모습
*출처: 데이터마케팅코리아 블로그

그사이 뜨거워진 빅데이터에 대한 관심을 입증하듯, 3회 차 강의 과정에는 공연예술계의 다양한 종사자들이 참석했다. 이 과정을 통해 다양한 데이터 활용 사례, 데이터를 수집〮 분석하는 기술 실습 등 빅데이터에 대한 기본적인 접근 및 활용 방식을 경험할 수 있었다.
강의 이후에는 8회에 걸쳐 후속 컨설팅이 진행되었다. 컨설팅 과정에 선발된 4개의 팀은 공연장, 공연단체, 민간회사로 구성되었다. 첫날 자유 토크에서부터 데이터에 대한 열띤 고민과 토론이 시작되었다. 서로가 회사도 다르고, 하는 일도 달랐지만 궁극적으로 데이터를 통해서 찾고 싶었던 것은 ‘공연 관객’이었다. 이미 데이터를 가지고 있어도, 데이터를 수집할 방법을 알고 있어도 어떤 데이터를 어떻게 활용하여 기존 관객을 위한 서비스를 구축하고, 신규 관객을 찾을 것인가가 모두의 고민이었다. 고민에 대한 해답을 찾기 위해 멘토님과 대화하고 토론했던 시간은 녹록하지 않았지만 힘든 시간이었던 만큼 얻은 것도 많았다.

컨설팅 과정 중에는 당시 스테이지톡의 모든 데이터 그룹을 살펴보고, 그중에서 기존 서비스의 업그레이드 및 데이터의 양과 질을 함께 발전시킬 수 있는 아이템을 찾아 비즈니스 모델을 구체화하는 작업을 진행하였다. 데이터는 가치에 따라 어디에나 있을 수 있고, 어디에도 없을 수 있으며, 양이 많다고 빅데이터가 아니라는 것, 데이터에 어떤 가치를 부여해야 할지 판단해야 하는 것 등 빅데이터에 대한 기술적인 접근, 마케팅적인 접근의 개념을 배울 수 있는 중요한 시간이었다.

<빅데이터로 마케팅 혁신> 교육 현장과 결과 발표회
*출처: 데이터마케팅코리아 블로그 <빅데이터로 마케팅 혁신> 교육 현장과 결과 발표회
*출처: 데이터마케팅코리아 블로그
<빅데이터로 마케팅 혁신> 교육 현장과 결과 발표회
*출처: 데이터마케팅코리아 블로그

위 두 과정을 거쳐 빅데이터에 대한 개념과 마케팅적 접근법을 습득할 수 있었다면, 그다음에 참여한 한국데이터산업진흥원의 <빅데이터 아카데미> 최고 전략가 과정에서는 산업 측면에서 빅데이터를 다루는 과정을 접하게 되었다. 이 과정은 해당 산업 분야에서 10년 이상의 경력을 가진 이들만 참여가 가능했다. 선발된 25인 중 당시 경력 19년 차인 필자는 비교적 짧은 경력에 속했고 다양한 산업 분야에서 참여하신 경력 20년 이상의 베테랑들이 한자리에 모이게 되었다.

과정은 교육 후 비즈니스 전략을 수립하고 파일럿 프로젝트를 수행하는 것으로 구성되었다. 2주에 걸쳐 4차 산업혁명, 빅데이터가 나오게 되는 과정부터 시작하여 데이터를 수집, 가공, 분석하는 다양한 기술과 방법들을 학습하고 경험했으며 이후 멘토링 과정을 통해 파일럿 프로젝트를 준비하였다. 당시 에너지 연구, 의료정책 연구, 의료 데이터, 자동차 자율주행, 공연예술 분야 종사자로 구성된 조에 편성되었는데, 우리 조는 필자의 제안으로 ‘공연(뮤지컬)의 성공 요인 분석 및 롱런 가능성 예측 모델링’을 프로젝트 주제로 정했다.

먼저 문화체육관광 빅데이터 플랫폼(BigData MarketC), 공연정보 포털인 스테이지톡, 공연예술통합전산망을 통해 공연 정보와 관객 데이터를 모으고 국내외 선행 연구 사례를 탐색했다. 이후에는 EDA, Data Featuring, Machine Learning, Text Mining, 감성분석 등의 작업을 통해 공연의 성공 요인을 분석하였다.

● EDA(Exploratory Data Analysis, 탐색적자료분석): 주어진 자료의 구조와 특징을 파악하여 정보를 찾 아내는 과정
● Data Featuring: Machine Learning을 진행하기 전 데이터의 특성을 반영하고 성능을 높일 수 있도록 도메인지식(특정 영역에서 축적한 지식)을 바탕으로 데이터의 변수 및 특징을 찾아내는 과정
● Machine Learning(머신러닝, 기계 학습): 컴퓨터가 스스로 학습과정을 거쳐 패턴을 찾아, 새로운 분류 체계를 만들면서 데이터를 분석해 내는 기술
● Text Mining(텍스트 마이닝): 텍스트 데이터에서 자연어 처리 기술에 기반하여 유용한 정보를 추출하고 가공하는 것을 목적으로 하는 기술
● 감성분석: 소비자의 감성과 관련된 텍스트 정보를 추출하는 Text Mining 기술의 한 영역

빅데이터 과정 프로젝트 시 활용한 작업들
출처: <빅데이터 아카데미>최고전략가 과정 교재

각 과정에서 진행한 내용들은 다음과 같다. 먼저 국내외 선행 연구 사례를 분석해 보니 한국과 해외 관객들이 관람할 작품을 선택할 때 참고하는 요소가 서로 다르다는 특이점이 있었다. 해외의 경우 작품을 선택하는 데 있어 비평가의 후기나 비평이 가장 중요한 요인으로 작용했던 반면, 국내 관객의 경우 작품을 선택하는 데 있어 관람 환경과 비평가의 비평이 아닌 타인 즉 일반 관객의 후기 등이 주요한 요인으로 작용을 한다는 점이었다.
이후 EDA과정과 Data Featuring과정을 통해 공연(뮤지컬)의 성공 요인으로 맨파워(배우호감도), 공연의 유형(라이선스, 창작, 내한), 재공연 여부, 광고비 지출규모, 수상여부, 공연개시 직후 SNS 버즈 증가율, 최근 공연일수, 이전 공연일수, 관람료를 설정하였으며 특히 SNS 버즈 증가율을 주요 변수로 평가하여 진행하였다. 그리고 Machine Learning 진행에선 MS Azure의 Two-Class Decision Forest 알고리즘을 적용하였는데, 앞선 과정에서 추출한 요인을 적용한 모델의 정확도가 비교적 높은 수준으로 나타났다. 마지막으로 SNS를 분석해보니 작품의 흥행에는 캐스팅, 광고량, SNS 버즈량 등이 중요한 요인으로 작용을 하고 있었고, 작품과 관련하여 관객이 가장 많이 언급한 단어는 배우, 연기, 무대, 노래, 연출로서 공연의 해당 요소들이 작품의 흥행에 가장 큰 영향을 미치는 것으로 나타났다.

<빅데이터 최고 전략가 과정> 프로젝트 발표회 <빅데이터 최고 전략가 과정> 프로젝트 발표회
<빅데이터 최고 전략가 과정> 프로젝트 발표회

다만, 해당 프로젝트는 파일럿 형태로 준비 기간이 짧고 수집할 수 있는 데이터의 범위가 작아 해당 모델을 공연산업에 바로 적용하고 일반화하기에는 보완해야 할 점이 많으며 완성도를 제고해야 할 필요가 있었다. 또한 당시 프로젝트를 진행하면서 상세한 공연 관련 데이터, 관객 데이터에 대한 아쉬움이 많았고, 현재 진행되는 여러 빅데이터 사업을 통해 이 부분이 보완되기를 간절히 바란다.

지나고 보니 데이터를 알기 위해 참여하였던 모든 과정은 결국 공연산업에 없어서는 안 될 ‘관객’이라는 가장 중요한 데이터를 찾는 시간이었다. 관객이 남긴 발자취를 따라 길을 가보기도 하고, 직접 찾아오실 수 있게 길을 만들어도 보고, 잘못된 길을 만들었다면 어떻게 수정해야 하는지 고민해 보는 모든 것이 빅데이터라는 생각이 든다. 가장 중요한 이 데이터를 찾는 방법이 좀 더 많아져, 공연시장이 더 커지기를 바라며 아마도 앞으로 계속 같은 질문을 던질 것이다.

“관객 여러분, 어디에 계세요?”

  • 김민희
  • 필자소개

    김민희는 공연콘텐츠와 서비스를 만드는 문화기획자이다. 2001년 공연 마케팅 및 매니지먼트 회사인 클립서비스에 입사해 예매시스템, CRM, 기업임직원 문화서비스, 전문 고객센터시스템 구축 등 오프라인 중심이던 공연 관객 서비스를 온라인화하기 위한 다양한 서비스 및 프로그램을 개발, 운영해왔다. 현재는 공연포털 스테이지톡, 공연매거진 더뮤지컬을 통해 다양한 문화사업을 진행 중이다.
    이메일

  • 페이스북 바로가기
  • 트위터 바로가기
  • URL 복사하기
정보공유라이센스 2.0