문헌정보학

도서관 이용 패턴 분석, 문헌정보학 기반 빅데이터 실습기!

memo03300 2025. 7. 19. 16:40

도서관도 데이터를 모은다, 그리고 해석한다

우리는 흔히 도서관을 ‘조용한 공간’, ‘책이 많은 곳’ 정도로만 인식한다. 그러나 오늘날의 도서관은 더 이상 단순히 책을 빌리고 반납하는 공간이 아니다. 사람의 행동 데이터를 수집하고, 이를 통해 정보 서비스를 개선하는 ‘데이터 기반 공간’으로 변모하고 있다. 특히 디지털 기술이 접목된 이후, 도서관은 이용자 행동, 자료 접근 로그, 검색어 기록, 좌석 사용 이력 등 다양한 형태의 빅데이터를 축적하고 있다.

이러한 변화는 문헌정보학 전공자에게도 큰 영향을 준다. 예전엔 분류, 색인, 메타데이터 중심의 구조적 접근이 중심이었다면, 이제는 이용자 행동 분석, 정보 이용 패턴 예측, 데이터 시각화 기획 등도 요구되는 역량이 되었다. 이 과정에서 문헌정보학이 가진 ‘정보 구조화’의 관점은 빅데이터 해석에서도 핵심 도구로 작용한다.

이번 글에서는 내가 참여했던 도서관 빅데이터 실습 프로젝트의 경험을 중심으로, 문헌정보학 전공자가 데이터를 다룰 때 어떤 시선으로 접근해야 하는지, 그리고 어떤 방식으로 정보 서비스를 개선할 수 있었는지를 구체적으로 정리해 보고자 한다.

 

실습 개요, 도서관 이용 로그, 그 안에 숨겨진 정보들

내가 실습에 참여한 곳은 지역 공공도서관이었다. 도서관 측에서는 우리 팀에게 지난 3년간의 도서 대출 기록, 검색 키워드 로그, 전자자료 접속 기록, 좌석 예약 내역 등을 제공해 주었다. 이 데이터는 모두 개인 식별이 불가능한 익명 형태였고, 총 약 20만 건에 달했다. 처음 데이터를 받았을 때는 엑셀 수천 줄이 전부였다. 하지만 문헌정보학 전공자로서 이 데이터를 보는 시각은 달랐다. 우리는 단순 통계를 넘어서, 다음과 같은 정보적 구조를 확인하고자 했다.

  • 특정 연령층의 도서 선호 주제
  • 계절/학기별로 대출량 변화 추이
  • 전자자료와 오프라인 자료의 이용 비율 차이
  • 평일/주말/방학 기간별 좌석 예약 흐름
  • 검색어 로그를 통한 ‘이용자가 찾는 정보’와 ‘실제 대출 자료’ 간의 괴리

이러한 패턴은 단순히 ‘많이 대출된 책’을 찾는 게 아니라, 이용자의 정보 필요와 행동 사이의 맥락을 해석하는 작업이었다. 여기서 문헌정보학이 강조하는 정보요구 분석, 주제 분석, 분류 체계의 유용성이 직접적으로 쓰였다.

 

문헌정보학 전공자의 빅데이터 실습기

 

분석 도구와 과정! 빅데이터를 문헌정보학적으로 해석하기

우리는 데이터를 Python의 Pandas, Seaborn 라이브러리 등을 활용해 전처리하고 시각화했다. 하지만 단순히 코딩 능력보다 중요한 것은, ‘어떤 기준으로 데이터를 나눌 것인가’, ‘어떤 변수 간의 관계를 분석할 것인가’를 정하는 사고력이었다. 문헌정보학에서 배운 정보분류 구조는 이 과정에서 큰 역할을 했다.

예를 들어, 도서 분류 코드를 기준으로 대출량을 분석하자, 청소년층은 ‘700(예술)’, 중장년층은 ‘300(사회과학)’ 분야의 대출이 많았다. 여기서 단순히 ‘예술’이 인기 있다는 결론이 아니라, 해당 연령층이 어떤 주제를 찾고 있는지, 그에 맞는 주제 큐레이션이 가능하다는 인사이트를 얻을 수 있었다.

또한 검색 키워드와 실제 대출 기록 간 불일치를 비교한 결과, 이용자들은 ‘취업’, ‘자기 계발’, ‘AI’ 같은 키워드를 많이 검색했지만, 정작 관련 도서는 부족했다. 이는 도서관의 컬렉션 구성이 실제 정보 요구를 반영하지 못하고 있다는 증거였다.

문헌정보학의 이론인 정보요구 분석, 탐색행위 이론, 주제망 설계 등은 바로 이러한 데이터 해석의 틀을 제공했다.

 

문헌정보학 전공자가 협업 현장에서 빛나는 순간

이 실습에서 특히 흥미로웠던 점은, 함께 참여한 통계학·컴퓨터공학 전공자들과의 협업이었다. 분석 툴에 대한 숙련도는 그들이 더 높았지만, ‘무엇을 왜 분석해야 하는가?’에 대한 문제의식은 문헌정보학 전공자인 내가 더 명확하게 설명할 수 있었다. 그들은 데이터 컬럼 이름에만 집중한 반면, 나는 대출 이력의 맥락, 이용자의 정보요구 흐름, 주제 구조 간의 관계를 함께 고민했다. 이때 깨달았다. 우리가 문헌정보학에서 배운 것은 단순 기술이 아니라, 정보의 흐름을 ‘사람 중심’으로 구조화하는 사고력이라는 것을. 이 능력이야말로 기술과 데이터를 넘는 진짜 경쟁력이다.

 

결과 적용과 시사점, 데이터를 통해 도서관을 바꾸다

데이터 분석 결과는 도서관 서비스 개선안으로 이어졌다. 우리가 제안한 것은 다음과 같았다.

  1. 검색 키워드 기반 자료 추가 구매 정책
    이용자가 많이 검색했지만 대출되지 않은 분야의 자료를 신규 구입 대상으로 삼았다.
  2. 연령/주제 기반 추천 도서 코너 구성
    분석된 이용자 선호 주제를 기반으로 오프라인 서가 구성을 재배치하고, 도서 추천 알고리즘을 제안했다.
  3. 좌석 이용 패턴 기반 예약 시스템 개선
    특정 시간대, 계절에 따른 좌석 수요를 기반으로 좌석 분산, 예약 방식, 시각별 조정안을 마련했다.
  4. 전자자료/오프라인 자료 이용 격차 보완
    전자자료 이용이 낮은 연령층을 대상으로 한 eBook 사용 교육 프로그램을 기획했다.

이러한 결과는 단지 데이터 분석을 잘했기 때문이 아니라, 문헌정보학의 이용자 중심 정보서비스 설계 원칙이 바탕에 있었기 때문에 가능했다. 데이터는 숫자지만, 해석은 전공자의 언어였다.

 

데이터 시대에도 문헌정보학의 본질은 ‘이용자’다

빅데이터는 단지 기술의 문제가 아니다. 그것은 인간의 행동을 해석하고, 그 안에 담긴 정보 요구를 이해하며, 이를 바탕으로 더 나은 정보 환경을 설계하는 문제다. 그리고 문헌정보학 전공자는 이 과정을 설계할 수 있는 사고 체계를 이미 갖추고 있다.

오늘날 도서관은 데이터를 축적한다. 하지만 데이터를 해석하고, 그것을 실제 정보서비스 개선으로 연결할 수 있는 사람은 드물다. 문헌정보학 전공자는 단순한 분석가가 아니라, 정보 흐름을 설계하는 전문가, 이용자의 필요를 실현하는 조력자, 데이터를 사람에게 연결해 주는 정보 큐레이터다.

데이터의 시대에도, 그 중심엔 언제나 사람과 정보가 있다. 그리고 그 둘을 연결하는 다리가 바로 문헌정보학이다.