정보의 가공 및 개인화 - 논문 작성을 중심으로

시스템 잡설  |   2013. 1. 18. 22:16

마트폰이 보급되면서 사용자는 인터넷에서 다양한 정보를 얻게 된다. 블로그, 뉴스 등 인터넷의 쏟아지는 정보 안에서 나에게 필요한 정보를 찾는 것은 무척이나 쉬우면서 어려운 작업이 되었다. 인터넷이 열심히 대중화가 되는 시절에는 북마크(bookmark; 즐겨찾기)로 해당 URL를 저장하는 것만으로도 상당히 잘 관리한다고 생각했지만 해당 사이트가 페쇄가 되거나 주소의 지속성(permanence)이 보장되지 않기 때문에 사이트를 관리하던 방법에서 이제는 사용자가 관심있는 내용에 집중하게 되었다. 따라서 자신이 관심있는 내용을 기록해두거나 저장하여 나중에 읽기를 바라는 마음을 반영하듯 많은 서비스들이 제공되었다. 



정보의 수집


자신이 원하는 페이지를 즐겨찾기(북마크)하는 것은 가장 기본적인 방법이다. 그러나 쌓여가기만 하고 다시 찾기 힘든 정보는 결국 다시 찾아야 하는 정보가 되기 때문에 정보와 개인 컨턴츠를 잘 관리할 수 있는 방법을 찾고 싶은 것이다. 그 중 대표적인 것이 RSS 가 있다. 다양한 웹사이트와 블로그 등에서 제공해주는 내용을 구독하여 해당 사이트에서 나오는 내용을 잡지 구독하듯 찾는 것이다. 메일링 리스트도 형태는 다르지만 자신이 필요한 정보를 얻기 위한 방법이다. 메일링 리스트는 RSS와 비슷하게 제공해주는 정보를 받는 반면, 구글 알림(Google Alerts) 서비스와 같이 검색엔진에서 주기적으로 검색하는 키워드의 결과를 메일로 받아 볼 수 있는 방법이 있다. 그러나 필요에 의해 웹 검색을 하다가 찾은 정보 등은 어떻게 관리할 수 있을까? 가장 기본적으로 브라우저의 즐겨찾기를 이용할 수 있지만 나중에 관리하기 어렵고 체계적으로 관리하기 어렵다. 또한 스마트폰이나 타블렛 등 다양한 기기를 사용할 때 사용 기기에 관계없이 자신이 필요한 정보를 기록하고 관리하는 방법을 누군가 생각했을 것이다. 


PDA 전성기 시절 자신이 원하는 신문 페이지, 웹사이트를 미리 등록해서 해당 페이지를 저장해서 오프라인에서도 볼 수 있도록 만들어주어 이를 PDA 기기에 넣어주던 서비스가 있었다. 출퇴근 같은 시간에 인터넷이 연결되지 않아도 볼 수 있고 다 본 정보는 지워버리거나 주기적으로 업데이트 할 수 있도록 해주었다.  항상 온라인 같은 요즘 세상에서는 필요가 없어진 서비스이지만 이와 비슷한 서비스로 사용자가 필요한 정보라고 생각이 된다면 저장해두었다가 이후 시간날때 읽을 수 있도록 해주는 서비스가 있다. 가장 대표적인 서비스가 Read it Later (현재 Pocket) 과 Instapaper 서비스로 초반에는 어떤 서비스가 좋다 여러가지 의견이 있지만 자신의 취향에 맞게 선택하고 사용해도 문제가 없을 정도로 비슷하다. 두 서비스 이외에도 많은 서비스가 있으나 정보 수집 기능에 초점을 맞춰서 Pocket 을 중심으로 설명한다. 



선 자신이 사용하는 스마트폰 등 정보를 찾으려는 도구에서 지원하는지 확인한다. 안드로이드, iOS 뿐만 아니라 윈도우, 리눅스 등 관계없어 웹브라우저에 지원을 하는지 확인하면 좋다. 본인이 정보를 저장하고 싶은 지점에 해당 서비스가 지원을 해주는지 확인해보면 된다. Pocket 의 경우 안드로이드, iOS, 그리고 웹브라우저 중 구글 크롬의 경우에는 별도의 추가 기능을 제공해주어 편하게 사용 가능하다. 그러나 인터넷 익스플러러도 가능하지만 편리성이 많이 떨어진다. 자신이 주로 사용하는 브라우저에서의 편리성 등을 고려해서 서비스를 선택하는 것도 중요하다. 


이런 Read Later 류의 서비스는 세가지 기능을 중심으로 제공한다. 


1. 북마크 기능: 원하는 정보의 위치를 저장하고 정보의 원래 위치를 관리한다. 

2. 읽기 기능: 오프라인에서도 읽을 수 있도록 해당 페이지의 정보 내용만을 저장하여 보여준다. 

3. 분류 기능: 주제나 자신의 목적에 따라서 분류할 수 있도록 도와준다. 


안드로이드 및 iOS 앱은 정보 위치를 저장할 수 있는 기능도 제공하지만 동시에 저장된 내용을 읽을 수 있는 리더 역할도 한다. 오프라인에서 읽을 수 있도록 저장할 때 본문 내용을 중심으로 주변 메뉴나 플래쉬 광고 등 불필요한 요소가 있다면 제거하고 본문 내용을 중심으로 보여줄 수 있도록 얼마나 잘 가공하는가도 이런 Read Later 서비스에서 살펴봐야 할 내용이다. (국내 포탈에서 제공하는 블로그 중에는 JavaScript를 사용할 수 없게 하여 이런 저장 기능이 제대로 이루어지지 않는 경우도 많다. 이런 경우에는 해당 주소만 저장하게 된다.) 안드로이드는 운영체제 차원에서 공유 기능을 제공하여 거의 모든 앱에서 내용을 보다가 원하면 공유기능으로 Pocket 으로 저장을 지원한다. iOS 의 경우에는 해당 앱에서 이런 Read Later 기능을 지원하는지 자신이 주로 보는 RSS 리더, 신문 앱, 브라우저 등 자신이 사용하는 앱에서 이런 기능을 지원하는지 확인해 볼 필요가 있다. 



저장을 할 때 분류 기능을 위해서 태그(tag; 주제어)를 붙일 수 있다. 태그를 사용하는 방법은 사용자마다 취향에 맞게 사용할 수 있는데 계속 사용하면서 느낀 부분은 블로그의 주제어처럼 입력하면 나중에 더 관리하기 힘들어진다는 점이다. Read Later 서비스를 사용하는 이유는 정말 단순히 읽기 위한 것도 있지만 읽고 더이상 필요하지 않다면 페기하는 것도 하나의 이유이다. 따라서 주제어는 가능하다면 해당 정보의 주제가 아니라 '내가 무엇을 할 것인지 목적'를 쓰기를 권한다. 예를 들어 그냥 읽기만 할 목적이라면 read, 논문에 넣기 위한 목적이라면 paper, 단순 정보라면 그냥 info 등으로 분류하는 방법이다. 물론 자신의 필요에 따라 어떤 태그를 써도 상관은 없다. 



논문 작성을 위해 자신의 주제에 맞는 선행 논문을 찾는 것이 필요하다. 이미 진행된 연구인지, 그리고 연구의 흐름이 어떤지 알기 위해서 그리고 최종적으로 논문을 구성하는 참조문헌(reference)를 넣기 위해서도 중요하다. 예전에는 논문을 찾기 위해서 전문 검색엔진이 있었고 혹자는 특정 검색엔진이 더 효과적이다라고 주장하지만 개인적으로 Google Scholar (구글 학술검색) 로 일차적인 검색은 충분하다고 본다. 문제는 검색을 해도 해당 논문의 원문을 읽을 수 없는 경우가 많다. 학교, 기관 등에 해당 논문에 대한 라이센스를 구매한 경우, 해당 기관 안의 네트워크를 이용할 때 사용가능하지만 일반적으로 불가능하다. 이런 경우에도 Pocket 서비스를 이용하면 편리하다. 


§ 활용 1: 구글 알림 서비스로 메일이 온 내용 중 관심이 가는 내용이 있는데 해당 내용은 블로그나 웹사이트에 소개된 글일 경우가 있다. 그럼 article 이란 태그를 붙어 놓고 나중에 해당 기사과 관련된 논문을 찾도록 저장을 한다. 오프라인으로 저장된 내용을 시간될 때 읽어보고 필요하다고 생각하면 남겨두고 필요없는 내용이라고 생각하면 읽은 것으로 표시해 지운다. (정확히는 Archive)  


§ 활용 2: 누군가 읽어보라고 보내준, 혹은 페이스북에서 본 내용이 논문 원문 페이지로 링크가 되어 있다면 해당 페이지로 들어간다. 원문을 읽을 수 있는 라이센스가 없는 네트워크를 이용하면 해당 PDF 파일을 다운받아볼 수 없다. 이런 경우 해당 페이지를 Pocket 에 저장하며 paper 란 태그를 붙인다. 이렇게 저장해 놓고 나중에 라이센스가 있는 기관 네트워크(혹은 Proxy / VPN 등)로 접속해 paper 태그로 모인 리스트에 들어가서 해당 논문을 저장한다. 


§ 활용 3: 특정한 주제를 가지고 글을 쓸려고 하는데 관련 내용이나 배경 지식을 모으기 위해서 blog 라는 태그를 붙어 저장한다음에 해당 태그의 페이지를 모아서 필요한 정보를 한번에 살펴 본다. 만약 블로그에 보안이란 주제로 글을 쓸려고 한다면 blog.security 와 같이 태그를 붙어 정리하는 것도 편리하다. 


따라서 별도의 태그를 저장하지 않아도 상관은 없지만 만약 사용한다면 목적.주제 로 분류해서 태그를 생성하면 더욱 편리할 수 있다. 왜냐하면 Read Later 서비스의 목적은 그 자체이기 보다는 이후 자신의 정보를 가공하는 필요성이 더 강하기 때문이다. 


동 작업을 할 때 예를 들어 다수 공동 작업자들이 정보를 모을 때 여러가지 방법이 있을 수 있지만 가장 흔한 방법은 게시판 형태를 이용하는 방법, 소셜네트워크를 이용하는 방법 등 다양하게 존재할 것이다. 그러나 정보가 모인 다음의 관리 측면에서 보았을 때 그리고 정보를 수집하는 사람들의 편리성에서 살펴보았을 때 bit.ly 서비스를 사용하는 방법이 있다. 각자가 Pocket 서비스를 각자 잘 사용하고 해당 수집된 정보를 모아서 게시판이나 커뮤니티에 올리는 방법이 있지만 URL 단축 서비스에 공동 계정을 하나 만들고 해당 계정 ID API Key 를 공유해서 사용하게 하면 여러 사람이 저장하는 URL 들이 bit.ly 의 한 계정에 쌓이기 된다. 이런 방법으로 자신이 앱을 개발할 때 자신의 API key 를 입력해 놓으면 비밀번호 노출없이도 자신의 계정에 정보가 저장될 수 있도록 할 수 있다. 



포켓은 읽고 관리하는 목적이 강하기에 쌓아두는 것이 아니라 빨리 버리기 가공해야하는 측면이라면 계속 저장을 해두고 간직하며 보고싶은 글이나 사진 등은 포켓의 성격과 잘 맞지 않는다. 이런 경우 에버노트나 캐치노트를 이용하면 좋을 것이다. 특히 에버노트를 이용할 때 포맷과 형태, 구성 등이 처음 저장될 때 상태에 영향을 미친다. 이런 경우 자신이 원하지 않는 쓸데없는 내용들이 많이 들어가는 경우가 많은데 Clearly 기능을 이용하면 깔끔하게 본문 내용을 에버노트에 저장할 수 있다. 캐츠노트(Catch Note)는 텍스트위주와 간단한 사진 위주로 저장하면 좋고 무엇보다 스마트 기기에서 오프라인 저장을 지원한다. (※ 2013년 8월 30일 서비스 종료) 그러나 이렇게 간직하고 싶은 글도 스마트폰 기기에서 저장하면 글자체, 크기, 포맷 등이 일정하지 않을 가능성이 높기 때문에 이또한 포켓에서 evernote 와 같은 태그를 붙인 이후 나중에 컴퓨터 환경에서 일괄적으로 정리하는 것도 한가지 방법이 될 수 있다. 



Clearly 를 이용하면 본문 내용만을 추출해서 자신이 원하는 글자, 포맷의 형태로 Evernote 에 저장할 수 있다. 




정보의 가공 


보의 수집은 논문 작성을 떠나 일반적으로 유용하게 사용될 수 있기 때문에 일반적인 상황과 방법에 대해서 설명했지만 이후는 논문 작성을 중심으로 살펴보려 한다. 우선 다양한 검색 도구와 툴을 이용해서 관심있는 주제를 모으는 작업은 우선 Read Later 서비스를 이용해 잘 관리할 수 있게 되었다. 주로 논문에 관련된 정보를 얻는 방법은... 


① 직접 검색(일반검색 & 학술검색) → Pocket 서비스에 저장 

② 구글 알림 이메일 → 해당 페이지 방문 → Pocket 서비스에 저장 (with article 태그) 

③ 다양한 경로로 관심 논문 발견 → 논문 페이지 → Pocket 서비스에 저장 (with paper 태그) 


② 의 경우에는 이후 기사 내용의 논문 페이지 검색 (저자와 내용으로 주로 일반 검색) → 논문 페이지 → Pocket 서비스에 저장 (with paper 태그) 



이렇게 해서 Pocket 서비스에 paper 태그로 저장된 리스트만 모아서 라이센스 접속 가능한 네트워크에서 해당 PDF 를 저장하거나 별도의 라이센스가 필요하다면 request 태그를 붙어 해당 논문 획득 가능한 기관을 알아본다. 선행 연구를 위한 논문들을 수집한 후에는 이 논문들을 관리해줄 도구를 이용하면 더욱 편리하다. 다양한 도구들이 있고 그 기능에 따라 선호도가 다르지만 지금까지 결론적으로 이런 논문 참고문헌 관리 도구에 따라서 논문의 질이 떨어지는 일은 없기 때문에 자신에게 적당한 도구를 선택하면 될 것이다. 예전에는 EndNote 를 사용했는데 툴 자체가 무겁기도 하고 여러가지 개인적 취향과 맞지 않아서 지금은 Mendeley 를 사용하고 있다. 기본적인 기능은 동일하기 때문에 다음의 기능을 살피면서 자신에게 맞는 것을 선택하면 좋을 것 같다. 

Comparison of reference management software by wikipedia


ⓐ 참고문헌 관리 편리성: 논문에 따른 분류, 주제에 따른 분류, 관리 시작한 날짜, 초록 관리 등이 편리하게 제공되는지...

ⓑ 파일 및 데이터 관리: PDF 파일 관리 용이성 및 웹 상에서도 편리하게 사용할 수 있는지...

ⓒ 스타일 관리: 투고하려는 저널의 스타일을 지원해주는지... 


http://csl.mendeley.com/ 을 통해서 이미 만들어진 스타일이나 원하는 세부적인 스타일을 조정할 수 있다.


이외 여러가지 기능들로 유혹하는 소프트웨어, 서비스도 많지만 사실 상 기본적인 기능만 충실하면 그 외 기능은 그렇게 불편하지 않다는 것이 개인적인 생각이다. PDF를 모두 받은 상태에서 주로 다운로드 폴더에 아무 생각없이 받아 놓고 Mendeley 를 실행하면 다운로드 폴더를 Watched Folders로 지정하면 해당 폴더의 PDF 파일의 논문 내용을 읽어 관리하기 시작한다. 그리고 원한다면 PDF 파일을 관리하는 별도의 폴더를 지정할 수 있고 해당 폴더에 저장할 때 어떤 형태로 파일이름을 저장할 지에 따라서 이름변경을 해서 관리해준다. 예전에는 논문을 받아서 해당 PDF 열고 제목을 카피하고 저널 이름 넣고 해서 파일 이름을 관리했던 추억이 있지만 그런 추억도 이젠 불필요한 시대인 것이다.   



Watched Folders에 저장된 PDF 파일은 설정에 따라서 파일 이름을 변경해준다. 


 


논문의 시작 


논문의 작성 기법, 요령 그런 것은 각자에게 달린 것이기에 논문이 연구 내용이나 어떤 형식을 소개하는 것은 별로 도움이 되지 않을 것이다. 다만 다양한 연구를 하는데 있어 일반적으로 알아두면 도움이 되는 도구나 서비스를 알아둔다면 특별히 시행착오를 하지 않을 수 있기 때문에 몇가지 소개한다. 


구글 알림(Google Alerts): 앞에서도 소개했지만 구글 알림은 아주 유용한 도구이다. 평소에는 일반적인 검색어를 통해 주기적으로 검색 내용을 얻을 수 있지만 연구 주제가 결정되고 관련 논문들을 모아 읽고 연구하다 보면 방법이나 이론에 있어서 좀 더 세부적인 검색어나 나오는 것을 알 수 있다. 이때 이런 세부적인 관련 검색어를 넣어 등록해놓으면 유용하다. 예를 들어서 유전자 치료에 관심이 있어서 평소에 gene+therapy 를 등록해 두고 연구 시작이 되었을 때 diabetes type 1 이란 주제와 함께 pancreas 가 연구의 대상이 되면 좋겠다는 느낌이 든다면 검색어로 gene+therapy+diabetes+type+pancreas 등과 같이 좀 더 세부적인 주제어로 확장 가능해진다. 


구글 학술검색(Google Scholar): 구글 학술검색은 점점 진화하는 모습을 보여주는 꽤 괜찮아지는 서비스이다. 현재는 자신의 논문을 등록해놓고 citation (인용)되는 변화나 관련 논문 등과의 근접도를 알려주는 서비스로 만족스럽다. 학술검색 안에도 Alerts 서비스가 있다. 



협업 도구: 혼자서 논문 작업을 할 가능성은 극히 떨어지기 때문에 협업 작업을 할 때 적절한 도구를 사용하는 것이 좋다. 논문의 작성에서 처음부터 본문, 제목, 소제목 등의 포맷을 맞춰가면서 작성하는 것보다는 일반적 텍스트로 내용만 만든다음 이후 포맷을 정리하는 것이 효과적이다. 그래서 구글 문서(현재는 구글 드라이브)에 있는 문서 작업으로도 충분히 가능하다. 또한 이때 자신의 협업자를 지정할 수 있기 때문에 이메일로 중간 수정본을 왔다갔다 하는 것보다 협업자와 온라인에서 작업하는 것이 더욱 효과적이다. 이전에는 조금 진보한 형태라는 믿음으로 wiki 를 이용해서 공동작업을 했지만 wiki 보다는 구글 문서도구가 보안 문제만 고려해도 더 나은 선택이라 생각된다. 



설문 조사 방법: 모든 분야에서 필요한 것은 아니지만 사회과학 분야에서는 설문 조사 방법이 많이 사용된다. 이때 기존에는 프린트된 설문지를 많이 사용하거나 조금 프로그래밍 잘하는 사람의 도움으로 온라인 페이지를 만들었지만 이제는 그런 수고를 할 필요가 없다. 구글 문서 안에 있는 Form 을 이용하면 간편하게 설문 조사 페이지를 만들 수 있고 결과는 스프레드쉬트로 저장된다. 별로도 관리되거나 원한다면 스프레드쉬트로 저장할 수 있다. (2013년 2월 5일 새로운 기능이 추가된 Form 으로 다양한 기능들이 추가되어 더 직관적으로 사용가능해졌다.) 



그래프, 도표 작성: 역시 구글 문서 안에서 데이터를 작성하여 관련된 도표 및 그래프를 그리는데도 유용하게 사용될 수 있다. 물론 분야에 따라서 전문적인 소프트웨어를 사용해야하기도 하지만 간단한 경우에는 꽤 다양한 형태를 지원한다. 




마무리하며... 


논문 작성에 초점을 맞추었지만 사실 자신에게 필요한 정보를 가공하는 방법과 흐름을 찾는 것은 정보의 홍수에서 자신에게 적절한 정보를 찾는 가장 현명한 요소일 것이다. 논문뿐만 아니라 글을 쓰는데 필요한 재료와 배경 지식을 모으는 방법도 이와 다르지 않을 것이다. 


터넷에 흩어져 있는 정보를 하나로 모을 수 있는 허브를 잘 이용하고 관리하는 것이 정보의 가공에 있어 가장 중요한 부분이다. 정보를 모으는 매 순간 판단을 하면서 필요 유무를 선택하기 보다는 일단 모아보고 이후 관련된 내용을 한번에 살펴보는 습관을 통해서 단편적 지식들 안에서 찾지 못했던 새로운 사실도 접할 수 있게 될 것이다. 흔히 많은 기능들을 모두 확인하고 완성도를 이야기하지만 기본적인 기능만 잘 활용해도 거의 모든 작업을 수월하게 할 수 있다. 다만 그 과정에서 반복적이고 본 작업에 시간이 뺏기는 일들을 손쉽게 해주는 도구의 기능들을 익혀 이를 통해 효율을 높일 수 있다는 점에서 소소한 기능을 논문 작업이라는 예를 통해서 살펴보았다. 이 안에서 자신의 일상에 도움이 되는 방법을 응용해 정보의 개인화에 도움이 되었으면 한다.