(시론)한국어 논문의 디지털화
2022-03-04 06:00:00 2022-03-04 06:00:00
유력한 두 후보의 정책과 공약이 나날이 닮아간다. 아무렇게나 선심성으로 던지는 실현성 없는 텅빈 약속이기 때문이다. 역대 대선에서 과학기술정책은 항상 그런 분야였다. 두 거대 정당의 과학기술정책은 언제나 비슷비슷한 화두로 채워진다. 이번 대선에서 두 캠프는 모두 ‘디지털’이라는 화두를 들고 나왔다. 그 내용이 무엇인지와 상관 없이, 과학기술과 첨단산업 분야에서 유행하는 단어는 모조리 주워 챙기는 정책 덕분에, 한국의 과학기술정책은 지난 수십년 동안 망가져 왔다. 국민총소득 대비 가장 많은 연구개발비를 사용하면서도, 그 연구개발로 인한 효율성이 바닥인 이유는, 바로 이렇게 마구 던져진 정책이, 이기적이고 현장에 무지한 관료주의로 다시 한번 망가지기 때문이다. 
 
<눈 떠보니 선진국>이라는 책에서 박태웅 의장은 재미있는 사례를 소개한다. 창조경제와 4차산업혁명이라는 화두 속에서 각 지방정부와 공무원들이 실천한 사업 중 하나가 3D프린터를 도입하는 것이었는데, 한국 3D프린팅 시장의 성장세는 대부분 정부 관련 사업 지출 때문이었다는 것이다. 게다가 이렇게 엄청난 자금이 투입된 3D프린터는 아직 제대로 민간에서 상용화된 사례조차 없다. 관주도의 과학기술혁신사업이라는게 대부분 이런 식이다. 이것 만이 아니다. 데이터 기반 사회를 내세우는 정부는 아직도 고위 공직자 재산 내역을 꼬박꼬박 PDF로 공개한다. 그냥 엑셀파일로 달라는 기자의 말에, 담당 공무원은 엑셀로 공개해야 하는 법률이 없다고 대답했다.
 
한국의 정부기관 인증방식은 여전히 불편하고 폐쇄적이다. 박태웅 의장은 ‘경로의존성’이라는 개념을 소개하면서 왼쪽으로 가는 영국 차와 일본의 인장을 예로 든다. 오른손잡이인 마부가 채찍으로 행인을 때릴 우려 때문에 왼쪽으로 다니던 마차 운행을 따라, 영국은 자동차도 자연스럽게 왼쪽으로 다니게 되었고, 지금 엄청난 비용을 치르고 있다. 일본은 인장이라는 결제 제도를 바꾸지 못해서, 디지털 시대에 인장 찍는 기계를 만드는 코미디 같은 상황에 처했다. 웃을 일이 아니다. 나는 한국의 IT 국제화를 가로막은 공인인증서제도가, 영국이나 일본의 사례와 비슷한 경로의존성을 갖게 될 것이라고 생각한다.
 
한국사회를 지배하고 있는 복지부동의 관료주의는, 지식인사회에도 스며들었다. 가장 진보적이어야 할 한국의 지식인사회는 강단의 보수꼰대로 전락했다. 학술활동은 그저 생존을 위한 도구로 전락한지 오래고, 그 지식인의 수장이라는 자들은 위기라는 소리만 늘어놓으며 국가에게 자신들을 지원하라고 읍소한다. 게다가 학문적으로 보잘것 없는 교수들은 정치권에 어슬렁거리며 권력을 얻어 뱃지를 달고, 아무런 효용도 없을 각종 정책에 국민세금을 쏟아붓는다. 그렇게 한국은 엄청난 연구개발비를 보유하고도, 제대로 자랑할 학문적 성과가 없는 국가로 추락했다. 한국에서 교수주머니는 구멍 뚫린 독이다.
 
한국어로 된 논문을 읽어오면서 궁금한 점이 있었다. 한국 학자들이 도대체 왜 한국어 논문이 아니라 외국 논문만 인용할까라는 궁금증이 그 하나였고, 각종 페이월로 유료화되어 있는 불합리한 논문유통 시스템이 도대체 어떻게 수십년 동안이나 유지되고 있는지가 다른 하나였다. 한국어로 된 논문을 검색하려면 서로 다른 여러 웹사이트를 돌아다녀야 한다. 영어로 된 모든 논문이 구글스칼라 하나로 대부분 검색되는 것과는 천지차이다. 어찌어찌 논문을 찾아도, 대부분의 논문이 유료라 읽을 수 없다. 최근 들어 오픈액세스 덕분에 꽤 많은 논문을 무료로 다운받을 수 있지만, 여전히 유료로만 읽을 수 있는 논문이 더 많다. 몇몇 학회들은 자신들의 논문을 학회 웹사이트를 통해 무료로 제공하지만, 이런 정보는 국가학술정보 포탈에서 검색조차 되지 않는다.  
 
논문을 찾아도 문제다. 논문은 PDF로 제공되기 때문에, 기계가 읽을 수 있는 형태로 변형하는게 매우 어렵다. 그나마 최근 논문은 나은 편이지만, 조금만 오래된 논문들은 아예 스캔을 뜬 형태라 글자인식조차 되지 않는 경우가 대부분이다. 이런 상황에서 한국어 논문을 이용해 소위 ‘디지털 인문학’을 한다는건 불가능하다. 모든 정보가 디지털 데이터가 아니라 기계가 읽을 수 없는 형태로 꽁꽁 숨겨져 있기 때문이다. 마치 내가 발표한 논문을 절대로 찾아 읽거나 인용할 생각은 하지도 말라는 것처럼, 한국어 논문은 폐쇄적으로 유통된다.
 
더 재미있는건 조선왕조실록은 디지털화시켜놓았으면서, 지난 반세기 동안 쌓인 한국어 논문은 디지털화할 생각조차 없다는 것이다. 디지털인문학이라는 화두는 20년 전부터 등장했는데, 이들이 말하는 디지털인문학이란, 인문학 연구를 위한 정보의 디지털화라기보다, 인문학과 문화산업을 연결하는 일종의 산업이다. 그런 맥락에서 인문컨텐츠라는 이름으로 정리되는 건 조선시대의 문헌들 뿐이다.
 
한국어 논문은 모두 디지털화된 형태의 문서로 공개될 필요가 있다. 그다지 어려운 일이 아니다. 이 작업이 완성되면, 우리는 한국의 학문 수준이 어느 정도인지 가늠하게 될 것이고, 인문학 연구가 나아갈 길을 좀 더 명확하게 알게될 것이다. 그보다 더 중요한 것은, 한국어로 학문을 하는 이들이 자랑스럽게 자신의 언어로 된 학문 성과들을 공유하고 비판하고, 이를 통해 좀 더 건강한 학문생태계가 만들어질 것이라는 점이다. 디지털 대전환을 말하기 전에, 이런 기본적인 일들부터 실현되는 사회를 보고 싶다. 
 
김우재 초파리 유전학자(heterosis.kim@gmail.com)
 
이 기사는 뉴스토마토 보도준칙 및 윤리강령에 따라 김기성 편집국장이 최종 확인·수정했습니다.

ⓒ 맛있는 뉴스토마토, 무단 전재 - 재배포 금지

지난 뉴스레터 보기 구독하기
관련기사