문헌정보학

문헌정보학과 데이터 사이언스의 만남, 전공의 새로운 가능성

memo03300 2025. 7. 15. 17:51

정보학과 데이터 과학, 전혀 다른 듯 닮은 두 세계

불과 몇 년 전까지만 해도 “문헌정보학”과 “데이터 사이언스”는 서로 다른 분야처럼 보였다. 하나는 도서관과 정보 구조 중심의 전통 학문이고, 다른 하나는 통계학, 프로그래밍, 머신러닝 등을 다루는 최신 기술 분야로 여겨졌다. 하지만 지금은 상황이 완전히 달라졌다. 디지털 전환과 데이터 기반 사회로의 변화는 두 학문을 긴밀하게 연결하고 있으며, 그 접점에서 새로운 가능성이 만들어지고 있다.

문헌정보학은 오래전부터 정보의 분류, 조직, 저장, 검색이라는 문제를 다뤄왔다. 데이터 사이언스는 방대한 데이터를 분석해 의미를 도출하고, 예측하며, 자동화된 의사결정을 돕는 기술을 제공한다. 겉보기에는 매우 다르지만, 정보의 흐름을 구조화하고 분석한다는 점에서 본질은 매우 유사하다.

특히 최근에는 도서관, 학술정보기관, 기록관리기관, 아카이브 등 전통적인 문헌정보학 기반 조직에서도 데이터 분석 역량을 요구하는 경우가 많아졌고, 문헌정보학 전공자들이 데이터 사이언스 분야에 진출하거나 관련 기술을 융합하는 사례가 늘고 있다.

이 글에서는 문헌정보학과 데이터 사이언스의 공통점과 차이를 바탕으로, 문헌정보학 전공자가 데이터 사이언스를 어떻게 활용할 수 있는지, 그리고 실제 어떤 가능성이 열리고 있는지를 구체적으로 탐색해 본다.

 

문헌정보학과 데이터 사이언스

문헌정보학 공통 기반, 정보 구조와 데이터 흐름을 이해하는 사고력

문헌정보학과 데이터 사이언스는 서로 다른 언어를 사용하지만, ‘정보를 구조화하고 활용한다’는 목적은 동일하다.

문헌정보학에서는 정보의 주제 분석, 분류, 색인, 메타데이터 설계 등을 통해 사용자가 원하는 정보를 더 빠르게 찾을 수 있도록 돕는다.

반면, 데이터 사이언스는 정형·비정형 데이터를 수집하고 가공하여 유의미한 통계 결과나 예측 모델을 생성한다. 이 두 분야는 다음과 같은 공통 기반을 공유한다.

  • 정보 구조 설계 능력 : 문헌정보학 전공자는 MARC, KORMARC, Dublin Core 같은 메타데이터 스키마에 익숙하며, 이와 유사한 방식으로 JSON, XML, CSV 같은 데이터 포맷을 이해하고 다룰 수 있다.
  • 주제 분류와 태깅 경험 : 문헌정보학에서 학습하는 주제 분석, 주제어 선정, 색인 작성 능력은 데이터 태깅, 피처 엔지니어링 과정과 직결된다.
  • 검색 시스템에 대한 이해 : OPAC, 디지털 라이브러리, 리포지터리 구축에서 사용된 검색 설계 기술은 데이터 검색, SQL 쿼리, 정보 리트리벌의 근간이 된다.

이처럼 문헌정보학은 기술 자체보다는 ‘정보에 대한 사고 구조’를 다루는 학문이며, 이 점이 오히려 다양한 데이터 분석 기술과 쉽게 융합될 수 있는 기반이 된다. 문헌정보학 전공자는 이미 정보의 본질을 꿰뚫는 사고 체계를 갖고 있다는 점에서, 기술만 보완한다면 데이터 사이언스 영역에서도 매우 강한 경쟁력을 가질 수 있다.

 

실제 사례! 데이터 사이언스를 접목한 문헌정보학 프로젝트들

문헌정보학 기반의 데이터 사이언스 융합 사례는 이미 다양하게 진행되고 있다. 내가 직접 보고 경험한 몇 가지 사례는 다음과 같다.

1. 학술정보 이용 분석 프로젝트

대학 도서관에서 전자저널 이용 로그와 이용자 유형 데이터를 분석해, 학과별 논문 열람 패턴을 시각화한 프로젝트가 있었다. 이때 문헌정보학 전공자가 주제어 구조와 학술지 분류를 담당하고, 데이터 사이언스 팀이 Python을 활용해 분석 및 시각화를 수행했다.

나는 이 프로젝트에서 메타데이터 전처리, 주제군 그룹핑 작업을 맡았고, 그 과정에서 자연스럽게 Pandas, Matplotlib 같은 툴을 접하게 되었다. 이를 통해 데이터 분석이 단순히 프로그래밍이 아니라, 정보 구조를 해석하는 시각과 함께 갈 때 훨씬 의미 있는 결과를 낼 수 있다는 걸 배웠다.

2. 공공데이터 큐레이션 플랫폼 구축

지방자치단체에서 제공하는 방대한 공공데이터셋을 시민 친화적으로 재구성하는 큐레이션 플랫폼을 구축하는 프로젝트에서는, 데이터 분석가가 기술적 처리를, 문헌정보학 전공자가 메타데이터 설계와 주제별 메뉴 구조를 설계했다. 이 협업은 정보 조직과 데이터 분석이 얼마나 자연스럽게 융합될 수 있는지를 보여주는 대표 사례였다.

3. 도서관 장서 최적화 모델 개발

또 다른 사례로, 중형 공공도서관에서 장서 대출 통계, 지역별 이용자 성향, 추천 도서 목록을 분석해 장서 구성을 최적화하는 프로젝트에 문헌정보학 전공자와 데이터 분석가가 함께 참여했다. 여기서 전공자의 주된 역할은 ‘대출률’ 수치가 아니라, 그것이 어떤 주제군에 속하는지를 분류하고 해석하는 작업이었다. 이는 데이터 사이언스가 기술, 문헌정보학이 해석이라는 역할을 분담하며 함께 작동한 예시였다.

 

문헌정보학 전공자가 데이터 사이언스를 배우면 가능한 일들

문헌정보학 전공자는 이미 ‘정보를 해석하고 구조화하는 사고 체계’를 갖추고 있다. 여기에 데이터 사이언스 기술을 접목하면 다음과 같은 분야에 도전할 수 있다.

1. 도서관 데이터 분석가

이용자 데이터, 대출 이력, 열람 통계 등을 분석해 서가 재배치, 추천 시스템, 장서 확충 계획 수립 등에 활용 가능하다. 문헌정보학 전공자는 이용자 정보행태 이론과 정보 검색 패턴을 이해하고 있기 때문에, 단순 수치를 넘어 이용자 중심 분석이 가능하다.

2. 정보 큐레이터 + 데이터 시각화 전문가

데이터를 단순히 숫자로 보여주는 것이 아니라, 이야기 구조로 재구성해 주는 능력이 중요하다. 특히 공공정보 시각화, 교육용 콘텐츠 큐레이션, 문화 데이터 해석 등에서 문헌정보학적 시선과 시각화 기술이 만날 때 매우 큰 시너지가 난다.

3. 메타데이터 설계자 + 데이터 표준화 컨설턴트

기관마다 다른 정보 구조를 표준화하고 통합할 수 있는 데이터 스키마 설계자 역할도 가능하다. 특히 정부, 공공기관, 대학도서관, 기록물관리기관에서는 표준 메타데이터 개발 및 매핑 작업이 중요하며, 이는 문헌정보학 전공자의 강점이다.

4. AI 학습용 데이터셋 구성자

자연어 처리(NLP) 기반 AI 모델을 학습시키기 위한 데이터셋을 설계하고, 주제별 태깅, 콘텐츠 분류, 의미 단위 조각 설계 등을 문헌정보학 기반으로 구현할 수 있다. 이는 점점 많은 기업에서 문헌정보학 전공자에게 기대하는 실무 역량 중 하나다.

 

문헌정보학의 사고력은 데이터 시대의 핵심 자산이다

데이터 사이언스는 미래의 핵심 역량이며, 수많은 분야에서 필수 기술로 떠오르고 있다. 그러나 이 기술은 그 자체로 완결되지 않는다. 데이터를 수집하고 분석하는 것만으로는 충분하지 않다. 그 데이터가 무엇을 의미하며, 어떻게 구조화되어야 하며, 어떤 흐름 속에서 해석되어야 하는지를 판단하는 사람이 필요하다.

그 역할을 할 수 있는 사람이 바로 문헌정보학 전공자다. 우리는 정보의 본질을 이해하는 학문을 공부했다. 이제 그 기반 위에 기술을 더하면, 정보의 가치를 설계하는 실전형 전문가로 성장할 수 있다.

기술은 빠르게 변한다. 하지만 정보를 바라보는 시각과 해석하는 사고력은 단단하게 축적되는 자산이다. 문헌정보학 전공자가 데이터 사이언스를 만났을 때, 전공은 도태되지 않는다. 오히려 시대가 원하는 핵심 직무로 확장될 수 있다. 그리고 그 흐름을 준비한 당신은, 정보 시대의 중심으로 나아가게 될 것이다.