기록은 더 이상 종이 위에만 존재하지 않는다
과거의 기록은 문서함과 책장 속에 존재했지만, 오늘날의 정보는 웹에 존재한다. 뉴스 기사, 공공기관 알림, 정부 보도자료, SNS 게시물, 블로그 포스트, 유튜브 영상 등 우리는 웹이라는 플랫폼에 기억을 저장하고 있다.
하지만 이 정보들은 끊임없이 생성되고 사라지며, 대부분은 일정 시간이 지나면 원본이 삭제되거나 변경된다. 특히 공공성과 사회적 가치가 있는 정보조차도 서버 종료, 도메인 폐쇄, 운영 정책 변경 등의 이유로 쉽게 소멸된다.
이러한 정보의 소실을 막기 위한 것이 바로 웹 아카이빙(Web Archiving) 이다. 웹 아카이빙은 단순한 저장이 아니라, 디지털 기록물을 목적성 있게 수집하고, 분류하고, 보존하는 정보 관리의 한 방식이다.
그리고 이 작업에는 문헌정보학이 가진 정보 조직, 메타데이터 설계, 분류 및 색인 기술이 핵심 역할을 한다.
나는 문헌정보학을 전공하면서 웹 아카이빙이라는 개념을 접했고, 이후 디지털 도서관 실습에서 직접 웹 콘텐츠를 수집하고 구조화하는 프로젝트에 참여하면서 이 분야의 필요성과 잠재력을 체감했다.
이 글에서는 웹 아카이빙의 기본 개념, 문헌정보학적 기반 지식, 실제 사례와 실무 경험을 중심으로 정리해 보고자 한다.

웹 아카이빙이란 무엇인가? 문헌정보학적 정의
웹 아카이빙(Web Archiving)은 웹 상의 정보를 일정 기준에 따라 자동 혹은 수동으로 수집하고, 메타데이터를 부여하며, 장기적으로 보존하는 일련의 정보 관리 행위를 의미한다. 일반적으로는 웹 크롤러(Web Crawler)를 통해 수집되지만, 단순 수집으로 끝나는 것이 아니라 데이터의 원본성, 맥락성, 탐색 가능성까지 고려한 정보 설계 작업이 병행되어야 한다.
문헌정보학에서는 ‘정보의 맥락을 살리되, 구조화된 탐색이 가능하도록 설계하는 것’을 중요하게 여긴다. 웹 콘텐츠는 그 특성상 비정형이고, 동적이며, 링크 기반으로 연결돼 있기 때문에 수집 기준 설정, 정보 구조정의, 버전 관리, 메타데이터 설계 등 다차원적인 설계가 필요하다. 이러한 업무는 문헌정보학의 이론과 실무가 가장 잘 적용될 수 있는 분야 중 하나다.
예를 들어, 특정 사회 이슈에 대한 시민 단체의 입장문, 영상, 뉴스 기사, 트위터 스레드를 한데 모아 하나의 주제 기반 아카이브로 구축하려면, 그 각각의 정보 단위를 어떻게 분류하고 연결하며 맥락화할 것인가에 대한 정보 조직 능력이 요구된다. 문헌정보학에서 배우는 분류 체계(KDC, DDC 등), 주제어 부여, 색인 전략, 메타데이터 필드 설계는 웹 아카이빙의 구조적 기반이 된다.
웹 아카이빙 실무 흐름과 문헌정보학의 적용 지점
웹 아카이빙의 실무 과정은 크게 ① 수집 대상 선정 → ② 수집 방식 결정 → ③ 메타데이터 생성 → ④ 보존 포맷 변환 → ⑤ 검색 시스템 구축의 순으로 이뤄진다. 이 모든 과정에서 문헌정보학 전공자가 핵심적인 역할을 할 수 있다.
먼저 수집 대상 선정 단계에서는 정보의 사회적 가치, 시의성, 공공성, 이용 가능성을 평가하게 되며, 이는 문헌정보학에서 익힌 정보 선별 기준 및 장서 평가 기준과 밀접하게 연관된다. 나는 웹 아카이빙 실습에서 특정 지역의 코로나19 대응 자료(지자체 공지, 지역 언론 기사, 주민 커뮤니티 게시물 등)를 선별할 때, 문헌정보학의 '정보 수요 기반 접근법'을 응용해 잠재적 이용자의 정보 요구를 예측했다.
두 번째로 수집 방식에서는 웹 크롤러 설정, 링크 깊이 조정, 주기 설정 등의 기술적 판단이 필요하지만, 어떤 콘텐츠를 중심으로 어떻게 연결할지에 대한 정보 구조 설계는 전공자의 분석력이 개입될 수 있는 부분이다.
셋째로 중요한 메타데이터 생성 단계에서는 Dublin Core, MODS, METS 등 국제 표준 메타데이터 스키마를 활용하며, 전공자는 이를 바탕으로 문서 유형별 필수 메타 필드, 검색용 색인어, 키워드 구조, 작성일/출처/저자 등의 기술 요소를 체계화한다.
마지막으로 보존 포맷 변환과 검색 시스템 설계 단계에서는, 웹사이트를 WARC(Web ARChive) 포맷으로 저장하고 이를 기반으로 탐색 가능한 아카이브를 구축한다. 이때 색인 체계, 탐색 인터페이스, 사용자 친화성 설계는 문헌정보학에서 강조하는 ‘이용자 중심 정보 서비스’의 철학이 반영된다.
실제 사례! 국내외 웹 아카이빙 프로젝트와 문헌정보학 적용
가장 대표적인 웹 아카이빙 사례는 미국의 ‘인터넷 아카이브(Internet Archive)’와 그 안의 Wayback Machine이다. 이는 1996년부터 현재까지 웹사이트의 스냅샷을 주기적으로 수집하여 아카이브화한 것으로, 디지털 시대의 공공 기록 보존을 실현한 대표적인 모델이다.
국내에서는 국립중앙도서관의 OASIS(Open Access Sources Integrated Search)가 웹 아카이빙 대표 사례다. 이 시스템은 정부 기관, 학회, 공공기관, 민간 단체의 웹사이트 중 공공성이 높은 정보 콘텐츠를 정기적으로 수집하고, 이를 검색 가능한 데이터베이스로 구축하고 있다.
문헌정보학 전공자는 여기서 아카이빙 주제 선정, 메타데이터 필드 설정, 색인 전략 설계, 사용자 탐색 지원 시스템 개발 등에 실제로 투입된다.
내가 참여했던 프로젝트는 지방자치단체의 지역 아카이브 구축 사업이었다. 여기에서는 지역 사회의 변화 과정을 보여주는 각종 웹사이트(언론사, 주민 커뮤니티, 자치구 SNS 등)를 주제별로 아카이빙하고, 이를 주제어 중심으로 분류하여 ‘도시 변화 아카이브’로 설계하는 작업이었다. 내가 맡은 역할은 웹 콘텐츠의 주제어 할당, 색인어 구조 설계, 크롤링 대상 콘텐츠 구조 분석 등으로, 문헌정보학의 정보 조직과 색인 기술이 그대로 적용되었다.
디지털 시대의 기억을 설계하는 문헌정보학 전공자
웹 아카이빙은 단순한 데이터 수집이 아니다. 그것은 디지털 시대의 기억을 보존하고, 미래 사회가 과거를 이해할 수 있도록 구조화하는 고도의 정보 설계 작업이다. 그리고 이 작업의 중심에는 문헌정보학 전공자의 전문성이 깊숙이 개입될 수 있다.
문헌정보학은 더 이상 도서관 안의 분류표나 카드 색인을 다루는 학문이 아니다. 웹 기반 정보가 무한히 확장되는 시대에, 정보를 구조화하고, 의미를 부여하고, 탐색 가능하도록 만드는 역할을 수행하는 디지털 정보 설계자의 기반 학문이다. 웹 콘텐츠는 사라지지만, 잘 설계된 웹 아카이빙 시스템은 그것을 시간 속에 보존한다. 그리고 바로 그 설계를, 문헌정보학 전공자가 담당할 수 있다. 우리는 디지털 시대의 정보 디자이너이며, 웹이라는 거대한 흐름 속에서 기억을 지키는 전문가로 성장할 수 있다.
'문헌정보학' 카테고리의 다른 글
| 문헌정보학 전공자의 대학 생활! 전공자로 살아남기 (3) | 2025.07.31 |
|---|---|
| 디지털 시대, 개인 기록을 문헌정보학 관점에서 정리하는 법 (2) | 2025.07.30 |
| 공공기관 기록물 관리, 문헌정보학이 어떻게 쓰이는가? (1) | 2025.07.27 |
| 전자기록물 보존 실무자의 하루! 문헌정보학 전공자의 시각 (2) | 2025.07.26 |
| 기록관리학과 문헌정보학의 차이점과 융합 가능성 (0) | 2025.07.25 |