컨텍스트를 생각한다 - 모바일 UI 를 바라보다.

시스템 잡설  |   2013. 8. 16. 04:03

번 새로운 판수 (version) 의 모바일 운영체제가 발표될 때마다 많은 사용자들은 주목하게 된다. 어떤 모습으로 어떻게 변했는지 관심을 가지고 새로운 기능과 추가된 내용, 제거된 내용 등을 위주로 사용자이 사용하는데 어떤 변화가 가능하겠다는 내용을 중심으로 모든 관심이 주목되게 된다. iOS 의 새로운 iOS 7 이 발표되고 아직 정식 배포는 이루어지지 않지만 많은 사람들은 이미 다양한 변화에 적응해 가고 있는 중이다. 안드로이드도 비슷하다. 큰 변화가 이루어지지 않는 것처럼 보이지만 초기 안드로이드와 비교하면 현재의 안드로이드인 Jelly Bean 4.3 도 다양한 변화를 보였고 특히 안드로이드는 iOS 와는 조금 다르게 기본적인 운영체제의 변화와 함께 기본 앱에 해당하는 Gmail, Calendar, Play Music  와 같은 구글 서비스를 사용하는 앱들의 전체적인 이미지를 비슷하게 변경하여 앱의 화면 구성, 기능을 변경하여 전체 운영체제의 일관적인 구성을 유지하도록 한다. 예를 들어 최근에 사용할 수 있는 Gmail, Play Music 등과 같은 구글의 앱들을 보면 좁지 않은 상단의 바 (bar) 와 메뉴 역할을 하는 영역이 슬라이드 형태로 보였다가 감출 수 있도록 구성된다. 이처럼 전체적인 구성의 이미지를 비슷하게 하면 전반적인 앱들의 구성도 이를 따르게 된다. 결국 아주 간단한 화면 구성에 대한 적절한 가이드라인이 존재하면 앱은 특별히 자신의 색체를 강조하고 싶지 않는다면 운영체제에 어울리는 화면 구성을 따르게 된다. 


Gmail 앱의 화면 구성


Google Play Music 앱 ─ Gmail 앱과 비교하여 화면 구성과 기능 실행을 위한 유사성을 볼 수 있다.


이런 화면 구성, 구성 요소의 배치가 왜 중요한 것인가? 단순히 iOS 7 이 예전까지는 지원하지 않던 알림창 (Notification bar) 에서 WiFi 를 포함한 스위치 ON/off 를 지원한다고 무엇이 달라지는지 생각해 봐야 할 것이다. 안드로이드에는 다양한 형태로 지원하고 심지어 원한다면 자신의 앱을 알림창에 올려 편리하게 제어할 수 있도록 허용까지 하고 있는 반면 iOS 7 의 변화는 제한적이지만 환영할 내용일 것이다. 가장 큰 변화는 바로 어떤 한 목적을 이루기 위해, 예를 들어 무선랜을 ON 하기 위해서 예전에 그 많은 아이콘 중 설정 아이콘을 누르고 무선랜 항목에 가서 ON 해야 하는 과정이 이제는 어떤 화면에서도 바로 알림창으로 넘어가 바로 스위치 ON 할 수 있다는 변화일 것이다. 결국 사용자가 어떤 목적을 이루기 위해 모바일 기기가 얼마나 편리한 과정을 제공하는가는 상당히 중요한 문제이다. 만약 아주 간단한 설정을 하기 위해 접근하는 방법이나 복잡한 과정을 거치는 과정은 꽤 귀찮은 내용이다. 



따라서 자신의 입맛에 맞도록 설정을 잘하고 잘 사용하기 위해서는 어떤 설정과 기능이 어디에 있다란 화면 구성의 일관성과 모바일 기기 (현재는 터치 (touch) 에 제한해서 생각한다면...) 에서 가능한 사용자 인터페이스 (UI) 의 일반적인 손짓 작동 (gesture)에 연결되는 범용적 기능 (comprehensive features) 를 생각해볼 필요가 있다. 현재 생각할 수 있는 UI 는 단일점 터치 (single touch), 연속 터치 (double touch), 직진 방향성을 가지는 쓸어내기 (swipe with direction ─ upward, downward, left to right, right to left), 길게 누르기 (long press), 두개 이상의 점을 인식할 수 있는 상황에서는 이점 (two fingers) 터치, 이점 쓸어내기, 그리고 조금 확장하여 시계 방향(clockwise), 반시계방향(counterclockwise) 의 회전 쓸어내기 (rotate swipe) 를 생각할 수 있다. 이처럼 다양한 방식의 제스쳐를 통해 빠른게 기능을 실행할 수 있다. 


Gesture 를 적절하게 사용하면 메뉴없이도 바로 원하는 설정을 맞출 수 있다.


엇을 위해 이렇게 하는 것인가? 


어떤 화면 구성이 더 좋고 어떤 작동을 통해 얼마나 효율적으로 사용할 수 있는지 잠깐만 정리해봐도 느낄 수 있는 두가지 느낌이 있다. 하나는 이처럼 다양하고 체계적인 사용자 인터페이스 (UI) 가 가능하구나 란 느낌 반대의 느낌은 도대체 뭐이리 많은 것들을 해야하나 하는 느낌이다. 모바일 기기에 익숙한 사람이야 이런 다양한 접근성과 다양한 앱을 통해 여러가지 자신들이 원하는 일을 모바일 기기로 할 수 있다는 것만으로도 충분히 매력적이지만 조금만 생각해보면 이미 사용자들은 무엇인가를 하기 위해 모바일 기기를 켜고, 관련 앱을 실행시키고, 만약 실행시키는데 적절한 설정이 되지 않으면 다시 설정으로 가서 조절하고 그 이후에서야 자신이 목적하는 기능을 수행할 수 있게 되는 것이다. 이 과정이 아주 간단하고 신속하게 습관적으로 이루어지면 별 불편은 없지만 이렇게까지 열심히 사용법까지 배워가면서 써야 하는 것인가 하는 다소 회의적인 생각을 하는 순간, 인간을 위해 모바일 기기가 존재하는지, 모바일 기기를 위해 인간이 설정을 해주고 실행해주는 것인지 하는 생각도 할 수 있다고 생각한다. 



결국 모바일 기기는 인간이 모바일 기기가 없던 세상에서도 충분히 수행하던 인간의 활동을 좀더 체계적이고 구체적으로 도움을 주기 위한 기기가 되어야 할 것이다. 단순히 놀이기구가 아닌 이상 전화기가 되는데 그 외 추가적으로 몇가지 더 할 수 있는 기기 정도로 끝나기엔 모바일 기기들은 너무 발달하고 있다. 


바일 운영체제을 바라보는 시선


개인적으로 애플의 iOS 는 깔끔하고 처음 모바일 기기를 사용하는 입장에서 참 매력적이라 생각한다. 모바일 기기는 단순히 컴퓨터의 기능이 통신 기능 (전화, 무선랜) 과 연결된 기기정도로 가치 절하 될 이유는 없다고 생각한다. 모바일 기기가 가지는 가장 큰 장점은 §즉시성 연계성 이라고 본다. 내가 찾고 싶은 정보를 기억하거나 메모해 두었다가 인터넷이 가능한 컴퓨터 앞에서 확인할 필요도 없고 어디를 찾아가기 위해 미리 지도를 확인하지 않아도 된다. 또한 예전에는 별개의 내용으로 기록되던 주소록의 친구들이 소셜 미디어의 글과 연결이 될 수 있고, 위치 정보 서비스를 통해서 상대방이 무엇을 하는지 어떤 생각을 하는지 볼 수 있다. 더욱 중요한 것은 이런 별개처럼 보이는 기록들이 '정보 (information)' 이 될 수 있다는 점이다. 



이와 함께 애플이 제시한 새로운 미디어 시장의 가능성도 무시할 수 없을 것이다. 다양한 음원, 영화, 심지어 개인 방송까지도 가능하게 하고 이를 위한 새로운 자신만의 새로운 플랫폼을 만들었다는 것도 주목할 변화일 것이다. 즉, 모바일 기기가 하나의 즐길거리와 충분한 매력덩어리로 만들 수 있던 가장 큰 요인은 온라인이 가능한 기기가 가지는 무한한 컨텐츠 (contents) 의 활용이 아닐까 싶다. 예전에는 저장해 놓은 컨텐츠만이 즐길 수 있었던 반면 이제는 통신으로 연결된 온라인의 가능성은 그 작은 기기가 실질적으로 저장공간은 무한처럼 만들어 주었다. 그리고 주목할 필요가 있는 새로운 변화는 바로 예전에는 생각도 할 수 없던 다양한 미디어의 풀뿌리 같은 생산자들이다. 즉, 예전에는 소수의 컨텐츠 제작자들이 공급하던 상황에서 팟캐스트 (Podcast) 와 같이 개인도 컨텐츠의 생산자가 될 수 있다는 점이다. 


략적 방향에 대한 다른 생각


모바일 운영체체의 양대 산맥인 iOS 와 안드로이드는 사실 경재을 통한 발전을 해왔다고 하기에는 그 철학과 성격이 너무 다르다는 생각이 든다. 예전에 정리한 글을 다시 살펴보아도, 


§ 아이폰 4 출시를 앞두고 안드로이드폰을 선택한 이유

§ 왜 안드로이드폰을 사용하는가? (UI 측면에서 바라보기)


거의 2년이 넘어가는 내용이지만 여전히 iOS 가 바뀌었으면 하는 내용들도 여전히 적용안된 것들이 대부분이고 지금 살펴보면 알림창과 스위치 ON/off 정도 적용된 것을 알 수 있다. 여전히 위젯 (wideget) 기능은 기대하기 힘들고, 데이터와 앱의 분리 그리고 이를 통한 상호운영성 (interoperability), 바로가기, 공유기능 (제한적이지만 일부 iOS 에서도 가능하긴 하지만...) 은 여전히 구현되지 않고 있다. 반면 안드로이드가 가지는 특징은 점점 강화되고 초기에 보이던 많은 불편도 해소되거나 필요하다면 과감하게 사라지는 것도 볼 수 있다. 이런 측면에서 보았을 때 안드로이드와 iOS 가 모바일 시장에서의 경쟁자라는 사실은 맞지만 소프트웨어 혹은 시스템 개발 측면에서 경쟁적 발전을 이루는 상대였다고 이야기하는 것은 조금 어색하다. 


용자 인터페이스란 무엇일까? 


자주 사용하고 별 거부감없이 사용하지만 정확한 의미에 대해서 생각해보지 못한 개념이 있다. 바로 사용자 인터페이스 (UI) 란 것이다. 과학에서 인터페이스 (interface) 란 두개의 서로 다른 대상이 만나서 서로 섞이지 않는 상태에서 만들어지는 경계층을 뜻한다. 예를 들어 컴퓨터를 생각해보면 컴퓨터와 인간은 서로 다른 존재이기 때문에 인터페이스란 말을 쓰는 것도 맞을 것이다. 즉, 인간의 언어와 인간의 행동, 감정이 컴퓨터에게 이해되지 않기 때문에 인간이 컴퓨터에게 적절한 작업을 수행하도록 하기 위해서 컴퓨터가 이해할 수 있는 방식을 개발하고 이를 적용했을 것이다. 확장하면, 현재의 모바일 기기와 인간에 있어 사용자 인터페이스 (user interface)란 용어를 쓰는 이유도 모바일 기기를 사용하는 사용자 (user) 와 사용하는 대상 (device; machine) 이 전혀 다른 존재이기 때문에 경계면이 생기고 사용자의 목적을 수행하기 위해 대상 기기가 알아들을 수 있는 형태의 행동을 하게 되는 것이다. 그런 형태는 앞서 언급한 터치를 포함한 다양한 내용이 될 수 있을 것이다. 



인간과 인간 사이에는 특별히 인터페이스란 말을 사용하지 않는다. 인간과 인간은 이질적 존재가 아니기 때문이다. 따라서 이 경우에는 아무리 수많은 도구 (전화기, 편지 ... 번역하는 과정 등) 를 통해 전달할 때도 인터페이스란 말은 사용하지 않는다. 아마도 인간이 다른 인간과 이야기하기 위해 전화를 들고 다이얼을 누르는 과정에 대해서는 인터페이스란 말을 사용해도 적절하지만 결국 어떤 도구를 이용하여 다른 인간과 이야기하는 과정은 인터페이스라고 부르지 않는다. 여기에서 사고실험을 하나 해본다. 기술이 아주 발달해서 인간의 모습을 한 로봇 (인간형 로봇; humanoid) 을 만들었을 때 이 로봇과 이야기하는 것은 인터페이스 (interface) 라고 불러야 할까? 아니면 인간사이에 이야기하듯, 이야기하다 (say, speak) 혹은 연락하다 소통하다 (communicate) 와 같은 용어를 사용할 것인가?



이 사고 실험을 통해서 찾고 싶은 가상적인 해답 (pseudo solution) 은 두가지이다. 먼저 질문했던 것처럼 이런 형태의 ① 인간형 로봇에게 인터페이스 한다고 표현하는 것이 적절한 것인가? ② 인간의 어떤 능력, 요소를 인간형 로봇이 가지고 있다면 인간과 마찬가지로 소통한다라고 표현해도 어색하지 않게 되는가? 이다.  즉, 인간의 표정을 아는 능력을 가지고 있다면, 인간의 언어가 가지는 뉘앙스를 알아낸다면, 인간의 감정을 읽어낸다면, 인간에게 선의의 거짓말을 할 수 있다면... 등과 같이 인간의 어떤 특징들을 가진다면 인간과 동일하게 대해도 괜찮을까 하는 질문이다. 


전히 안드로이드를 버릴 마음은 없는가? 


인터페이스 이야기는 조금 여운을 남기고 줄이고 다시 현실적 질문으로 넘어오자. iOS 7 이 더 이뻐졌다 이제 알람창에 스위치 기능도 좋아졌다면서 나에게 아이폰을 왜 쓰지 않냐고 물어보는 사람이 있었다. 여전히 근본적인 문제 (파일 시스템 접근 불가, 공유기능, 바로가기 기능 등) 도 해결되지 않아 사용하고 싶지 않다고 이야기할 수 있지만 조금은 다른 시선으로 여전히 아이폰을 쓰고 싶지 않은 이유에 대해서 "간접적으로" 이야기하려고 한다. 그 이야기의 중심이 되는 첫번째 키워드는 바로 '인터페이스' 이고 두번째 키워드는 '컨텐츠'이다.  


애플이 아이폰을 통해 적극적으로 보이는 영역이 컨텐츠 (contents) 영역이라는 점에 대해서 부정하는 사람은 그리 많지 않을 것이다. 사실 개인적으로 애플이 보여주는 iTunes 라는 놀라운 플랫폼은 참 대단하다 생각한다. 모바일 기기 중심으로 어떻게 다양한 컨텐츠를 즐길 수 있는 새로운 스테이션 (station) 을 만들었다는 점, 그리고 원할한 공급과 생산을 위한 시장을 만들었다는 점은 높게 평가한다. 그러나 컨텐츠를 즐기는 기기가 한정되는 것은 사업적 전략이 뛰어나다고 평가해야할지 아니면 사용자들의 다양한 플랫폼 욕구 (다양한 플랫폼에서 컨텐츠를 즐기고 싶은...) 를 제한하는 것이라 해야할지 잘 모르겠다. 예를 들어 Podcast 는 애플 기기에서만 가능한 플랫폼이 아니다. (심지어 요즘은 팟캐스트를 iTunes 와 팟빵만 가능하다고 생각하는 사용자들도 많다는 것은 더욱 더 놀라운 사실이다.) Podcast 는 §RSS 기술을 기반으로 해서 미디어 파일을 배포하는 표준 XML 기술을 기반으로 한 것이다. 따라서 iTunes 에 등록된 주소들은 애플만의 표준은 아니다. 내부적으로 모든 팟캐스트는 XML 주소를 가지고 있고 이 XML 주소를 통해 일반적인 RSS 리더에서도 가능하다. 사실 이런 내용을 알고 있다고 해도 애플 iTunes 에 등록된 팟캐스트의 주소(XML 주소)를 알아내는 것은 그리 쉬운 일이 아니다.



결국 표준을 따르고 표준 기술의 가장 많은 혜택을 보고 있지만 이에 익숙하지 않은 사용자들을 위해(?) 애플의 iTunes 나 팟빵 과 같은 서비스는 독자적인 플랫폼을 만들어 사용자들이 RSS 에 대해 몰라도 클릭 몇번으로 사용가능하도록 제공해 준다. 결국 사용자들이 만드는 컨텐츠의 양이나 질도 중요하지만 이를 어떻게 관리하고 사용자들이 어려움없이 접근할 수 있도록 플랫폼을 만들어 주는 것도 중요하다. 애플은 이에 대해 잘 인식하고 있던 것이라고 본다. 그런데 사용자는 모바일 기기를 컨텐츠를 즐기기 위해 존재하는가 의문을 제기하고 싶다. 우리 삶에 모바일 기기가 이렇게 보편화 되었다면 모바일 기기가 존재하지 않았던 시대와 비교해서 좀 더 다른 형태의 혜택을 얻고 싶은 것도 당연한 욕심이 되지 않을까 싶다.  


어느정도 컨텐츠에 대한 사용도나 활용도가 높은 사람들에게 iTunes 와 같은 플랫폼은 구속되는 느낌이다. (개인적 느낌이기도 하고...) 그래서 원하는 컨텐츠를 활용하고 오프라인 컨텐츠를 잘 활용하면 컨텐츠에 대한 갈망도 그리 생기지 않는다. 그보다 나를 좀더 이해하는 모바일 기기를 생각하게 된다. 


텐츠에서 텍스트 (Content to Context


매일 아침 일어나 검색한다. "오늘 서울의 날씨는?" 인터넷에 연결된 모바일 기기는 오늘 서울의 날씨를 알려준다. 보스턴에 있는 지인에게 전화하려는데 지금 보스턴 시간은 어떻게 될까? "what time is it now in Boston?" 검색하면 모바일 기기는 알려준다.  



여기에서 잠깐 검색 엔진이 가지는 플랫폼의 중요성을 다시 한번 강조하고 싶다. 이전 블로그 내용 ─ §검색엔진의 진화 - 플랫폼을 통한 인식의 진화 ─ 을 통해서 단순히 키워드 내용에 해당하는 웹사이트 링크만으로 보여주는 형태의 검색 엔진이 아니라 사용자가 직접적으로 알고 싶어하는 내용을 바로 보여주는 것이 중요하다고 강조했다. 예를 들어 Steve Jobs 를 검색하면 Steve Jobs 를 포함하는 수많은 페이지들의 링크를 중요도에 따라 보여주는 것도 중요하지만, 그보다 내가 찾고 싶어하는 인물에 대한 요약과 관련 내용을 검색 엔진 고유의 형태로 보여주는 것이다. 즉, 사용자가 특별히 일반적인 내용을 알고 싶을 때는 일반적인 내용을 보여주어 사용자의 일차적인 욕구, 상당히 유추가능한 내용을 먼저 보여주는 것이 필요하다는 것이다. 마찬가지로 what time is it now in Boston? 이라고 검색하는 것은 세계 시간을 보여주거나 보스턴 지역 뉴스 페이지에 들어가고 싶은 것이 아니라 정말 '지금 몇시인지' 만을 알고 싶은 것이다. 


이처럼 사용자가 원하는 정보를 알려주는 것이 검색엔진의 일차적인 기능이지만, 이와 함께 사용자가 삽질할 가능성을 줄여주는 것도 중요한 부분이다. 사용자가 어떤 정보를 원하는 구체화의 정도에 따라 검색엔진도 이를 더욱 더 구체적으로 보여주는 것이다. 



다시 아침마다 날씨를 물어보는 사용자로 넘어오자. 아침에 일어나 모바일 기기에 검색을 한다. 그런데 이 사람의 검색 기록을 분석하게 된다면 모바일 기기는 이 사용자가 조금은 불쌍할지도 모른다. 그래서 연민의 마음으로 사용자가 물어보지도 않았는데 오늘의 날씨를 미리 알려준다. 즉, 사용자가 물어보기도 전에 날씨 정보를 알려주는 것이다. 


컨텍스트 (context) 는 우리말로 '문맥'이라고 표현되지만 적절하게 표현하기 힘들기 때문에 그대로 컨텍스트라 하고 그 의미에 접근하는 것이 더 좋을 것 같다. 컨텐츠 (content) 는 내용이란 말이기도 하지만 단순히 대상 (items) 들이 열거되어 목록이 있는 상태도 컨텐츠라고 부를 수 있다. 그런데 여기에 인간의 선택이나 행동의 양식이 결합될 때 컨텍스트 (context) 라 설명해보려 한다. 즉, 다양한 장르의 음악이 있을 때 사용자가 특별히 재즈 장르를 좋아하는 사람이라 재즈에 대한 검색이 많고, 예전 구매한 컨텐츠 내용이 재즈에 집중되면 모바일 기기는 다양한 목록이 있어도 결국 사용자는 재즈로 접근할 것이라 추측할 수 있을 것이다. 이처럼 사용자의 기호 혹은 행동 양식을 파악할 수 있다면 사용자가 선호하는 가공된 형태의 정보를 제공하는 것을 생각할 수 있다. 



즉, 일반적 정보 (컨텐츠를 포함하여) 를 그대로 보여주는 것이 아니라 사용자가 더 선호하고 더 필요할 것이라고 판단될 수 있는 내용을 통해 사용자에게 보다 적극적으로 정보를 제공해주는 것으로 사용자의 다음 행동 양식에 더 도움이 되게 해주는 것을 컨텍스트 (context) 라고 설명한다. 이런 컨텍스트를 효율적으로 하기 위해서는 인간이 일반적으로 취하는 행동 패턴에 대해서 고민해 볼 필요가 있다. 만약 새로운 여행지에 도착하면 가장 먼저 필요한 정보는 해당 국가의 환율 정보, 그 주변에서 갈 수 있는 유명한 장소, 맛있는 식당 등 지역 정보가 필요할 것이다. 따라서 모바일 기기가 판단하여 사용자의 위치를 통해 주변에서 필요한 정보를 보여주는 것이다. 만약 사용자 계정에 내 집과 내 사무실이 어디에 있다고 입력해 두었다면, 잘 모르는 장소에 가게 되어도 현재 위치에서 집까지 가는 방법을 알려줄 수 있다. 오후 퇴근 시간에 위치한 장소를 파악하고 현재 위치에서 집으로 가는 경로를 안내해주거나, 때로는 아침에 집이 아닌 새로운 곳에 있을 때 현재 위치에서 (아침이니...) 사무실로 가는 경로를 알려줄 수 있을 것이다. 



이처럼 일반적인 행동 양식 (예상 가능한) 과 사용자의 검색 기록 혹은 저장한 정보에 따른 선호도 등은 사용자가 더 필요할 내용의 정보를 제공하는데 도움이 되고 이렇게 적절한 곳에서 적절한 정보를 제공해주거나 사용자의 생활 양식에 맞게 유추하여 필요한 내용을 제공해주는 것은 모바일 기기가 가지는 즉시성과 연계성을 적극 활용할 수 있는 부분이 될 수 있다. 그리고 이런 내용으로 구현된 기능이 바로 구글 나우 (Google Now) 이다. 구글 나우의 일반적인 기능의 철학은 일반적 컨텐츠를 제공해주는 모바일 기기에서 인간의 행동 양식을 이해하는 컨텍스트를 제공하는 기기로 변신하자이다. 


인터페이스에서 터액션 (interface to interaction


앞서 설명했지만 다양한 앱과 모바일 기기의 발전은 인간을 편리하게 해주었지만 한편으로 그 편리를 잘 사용하기 위해서는 모바일 기기를 잘 이해하고 적절하게 설정하지 않으면 안된다. 앱의 기능이 다양하게 발전하면  다양한 활용법이 가능해지고 때로는 상상도 하지 못하는 결과도 만들 때가 있다. 예를 들어 자신의 아이폰을 훔친 도둑이 촬영한 사진들을 자동으로 온라인 클라우드에 동기화하는 기능을 모르고 찍었다가 도둑의 모습과 삶을 찍은 사진들이 피해자의 클라우드 계정에 올라와 이 사진들을 블로그에 올린 사건도 있었다. 이처럼 모바일 기기는 그 활용도만큼 섬세하게 관심을 가지지 않으면 어느새 사용자가 원하지 않는 기능을 몰래 수행하는 경우도 적지 않다.  


이 대부분은 결국 사용자가 섬세하게 관심을 가지지 않은 이유도 있지만 다른 한편으로 우리가 쓰는 앱들은 사용자들이 별 신경쓰지 않아도 적당하게 쓸 수 있을만큼 똑똑하지 않다는 것이다. 따라서 인터페이스는 사용자들이 인간과 다른 이질적 앱과 소통하기 위해서 이것저것 다 설정해줘야 하지만 그냥 인간이 원하는 목적을 이해하고 이를 수행하는데 필요한 적절한 환경을 제공해준다면 얼마나 좋을까? 앞서 예를 든 사고 실험처럼 인간과 충분히 소통할 수 있는 로봇을 만든다면 참 좋을 것 같다. 내 마음을 이해해주니 늦잠자고 빨래 던져 놓아도 알아서 빨래 대신 해주고, "디스플레이 산업에서 액정 크기 별 시장 분포에 대한 보고서를 써야하는데..." 하며 간절함만 보여주어도 잠안자고 알아서 인터넷에서 필요한 통계자료 모아서 멋지게 데이터를 만들어 놓을지 모른다. 이는 섬세한 설정을 해줘야 인간이 필요한 작업을 겨우(?) 할 수 있는 상황과 전혀 다르다. 그리고 이런 환경을 단순히 인터페이스 (interface) 라고 부르기는 어려울 것 같다. 필연적으로 인간의 언어를 소리로 듣는 센서나 인간의 모습을 보는 시각 센서 등은 기계적 인터페이스 (mechanical interface) 라고 부를 수 있지만 로봇과 인간이 서로 이야기하고 인간이 원하는 작업을 적극적으로 도와준다는 의미에서 이는 인터액션 (interaction) 이라고 부르는 것이 더 좋을 것 같다. 



아직 인간형 로봇을 제대로 상상하기 힘들기 때문에 인터액션을 이상형으로 현재의 모바일 기기를 통해 할 수 있는 것들을 생각해보자. 가장 먼저 떠오르는 것은 음성 인식 (voice recognition) 기능이다. 현재의 음성 인식 기능은 초기에 비해 분명 발전되었다. 인식률도 높아지고 속도도 높아지고 소위 자연어 처리 (natural language processing) 가 학문적으로 발전하는 과정에서 인간의 언어구조를 파악하면 쉽게 가능할거라 믿었던 것과는 달리 오히려 가장 큰 걸림돌은 음성 자체의 다양한 변이 (variants) 였다. 아무튼 이제는 애플의 Siri 기술이나 안드로이드의 Voice Search 기능과 같이 어느정도 정규화된 패턴의 표현에 대해서는 괜찮은 기능이다. 음성 인식 (명령) 은 사실 모바일 기기를 조작하기 위해 인간의 시선과 손을 자유롭지 못하게 한다는 점을 해결할 수 있다. 아주 간단한 예로 음악을 듣고 있는데 지금 듣는 노래가 마음에 안 들어 다음 곡으로 넘기기 위해 바지 주머니 속에, 핸드백 속에 꼭꼭 숨어 있는 모바일 기기를 꺼내 화면을 켜고 앱을 실행하거나 음악 제어판에서 다음 곡으로 넘기는 단추를 터치한다는 것은 번거로운 작업이다. 이때 이어폰에 작은 단추가 있어서 두번 빠르게 누르면 다음 곡으로 넘길 수 있게 기능이 된다면 상당히 쿨~하게 동일한 작업을 수행할 수 있게 된다.  



마찬가지로 음성 명령 기능이 가지는 의미를 '단축시킬 수 있는 작업양식 (workflow)' 에서 찾고 싶다. 매일 아침 일어나 what time is it now in Boston? 이라고 제대로 떠지지도 않는 눈으로 터치하며 그 작디 작은 자판으로 입력하기 보다 간단하게 음성 명령으로 소리내어 읽으면 동일한 결과를 얻어낸다면 극적으로 줄어드는 작업양식의 장점을 생각할 수 있을 것이다. 음성 명령이 제대로 확산되지 못하는 의외의 이유는 사실 공공 장소에서 마이크에 대고 명령 내리는 모습은 사용자가 주변 사람들에게 '내가 여기 있고 나는 음성 명령을 이용하고 있소...'라는 광고 효과를 가진다는 점이 더 크다고 본다. 그러나 혼자 있거나 음성 명령을 사용해도 별로 부끄러울 것 없는 환경이라면 뭐 어떻겠는가? 


터액션과 텍스트가 가지는 미묘함 


인터액션과 컨텍스트가 어떤 것이고 앞으로 어떻게 변화를 줄 것인지에 대해서 공상과학 소설 같은 이야기를 하는 것은 별로 도움이 안될때가 많다. 그보다 이미 우리의 작은 변화로 인터액션과 컨텍스트의 의미를 찾아가는 생활 속의 '의식적인 개념화'를 강조하고 싶다. 다시 말해 이것은 컨텐츠 지향이고 이것은 컨텍스트 지향이다 라고 구별해서 설명하거나 무엇이 더 좋다는 것을 이야기하는 것은 적절하지 않다. 예를 들어 단순히 컨텐츠에 불과하던 모바일 기기 작업 양식을 간단한 설정만으로 컨텍스트 행동 (contextual behavior) 로 바꿀 수 있는 가능성이 있다. 


링톤 (ringtone) 혹은 알람음 (notification) 음을 설정하는 것이다. 일반적으로 메일이 오거나 메세지가 올때 기본적으로 설정된 알람음은 하나이다. 그러나 각 앱이나 상황에 따라서 알람음이나 알람의 형태 (진동, 화면 켜기, LED 등) 를 변경할 수 있다. 예를 들어 자신의 메일 계정이 2개인데 많이 쓰고 업무에 필요한 메일 계정에 대해 알람음 A 를 설정했다면, 보조적 메일 계정에는 알람음 B, 메세지에 대해서는 "문자왔어~" 하는 알람음, 페이스북 알람, 트위터 알람 등 각 앱과 서비스에 따라 알람음을 설정해 두면 알람음에 따라서 내가 필요한 작업 알람음에 대해서만 바로 확인하면 된다. 그 외 불필요한 내용에 대해서는 화면을 켜서 확인하지 않아도 되는 것이다. 즉, 알람음에 따라서 사용자가 해야하는 작업 양식에 도움을 줄 수 있는 것이다. 



따라서 인터액션과 컨텍스트의 개념은 모바일 기기가 우리를 귀찮게 하는 하나의 체외 종양 (in vitro neoplasm) 이 아니라 우리의 행동 양식과 행동 패턴에 도움이 될 수 있는 정보와 알람을 적절하게 제공하는 체외 대뇌피질 (in vitro neocortex[각주:1]) 이 되기 위한 중요한 코드로 생각한다면 이런 방향으로 앱 개발과 디자인이 이루어질 수 있을 것이다. 


성 명령을 통해 생각하는 사용자 인터액션 


사용자 인터페이스 (UI) 에 적절하게 컨텍스트의 요소가 결합하여 인간이 원하는 작업을 더욱 더 수월하게 해주는 것, 그렇게 작업양식의 속도를 빠르게 해주고, 작업단계를 줄여주는 것을 사용자 인터액션 (UIa) 이라고 불러본다. 구글 글래스처럼 관심을 받고, 비판을 받는 제품(?)도 없다고 본다. 구글 글래스가 나왔을 때 새로운 인터페이스의 형태에 사람들은 관심을 가졌지만 정작 그 작업 영역과 사생활 문제 등이 거론되며 많은 Pros & Cons 가 생겼다. 개인적으로 구글 글래스를 통해 현재의 모바일 기기가 인간의 오감, 특히 시각과 촉감을 얼마나 퇴화시키는지 느끼게 해주었다. 거리를 걸으며 사람들의 시선은 모바일 기기에 집중되는데 앞으로 잘 걷고 있다. 대부분의 사용자는 자신이 이런 "멀티태스킹"에 별 문제가 없다고 믿는다. 그러나 이는 사실과 다르다. 때로는 장애물에 부딪치거나 모바일 화면을 보는 동안 걸음걸이는 상당히 어색해진다. 그런 의미에서 인간의 오감을 방해하는 기기는 결국 사라지는 것이 인간의 자연스러운 인터페이스, 궁극적으로 인터액션을 위한 길이라고 생각한다. 



그런 측면에서 음성 명령은 이런 멍청하게 모바일 기기에 빠져 시선을 잃어버리지 않고 원하는 작업을 수행할 수 있는 기술적 요소라고 생각한다. 


색 엔진에서 인간의 섬세함을 찾는다 


안드로이드 기기 젤리빈 (Jelly Bean 4.3) 이상에서는 검색을 위한 단축키를 제공한다. 홈 버튼을 다소 길게 누르고 있으면 구글 검색을 위한 버튼이 나오고 이 버튼을 누르면 통합적 형태의 검색 창이 나온다. 이때 검색창 오른쪽 끝에 놓인 마이크를 누르면 (마이크와 버튼 리모콘을 지원하는 이어폰의 경우 메인 버튼을 길게 누르면 바로 음성 검색이 실행된다.) 음성 검색이 실행된다. 음성 검색은 음성 명령을 포함하여 일반적 검색 엔진 키워드를 음성으로 입력할 수 있다 생각하면 된다. 


음성 검색에 다양한 예는 검색을 통해서 다양한 예를 볼 수 있다. 일반적인 내용에 대해서는 생략하고 앞서 설명한 컨텍스트 관련된 내용으로 살펴보려 한다. 꼭 이 부분은 음성 검색으로 하지 않아도 되지만 상황적 설정을 차를 타고 가면서 가까운 주유소를 찾는다고 가정하고 음성으로 검색한 것이다. 


먼저, "gas station around here" 라고 검색한다. 


그리고 "what is the nearest gas station" 이라고 검색해 보자. 


일반적으로 두가지는 주유소를 찾는다고 생각할 수 있다. 그런데 뜻밖에 두 검색 결과의 내용 (content) 는 거의 같지만 정보를 보여주는 형태는 다르다는 것을 알 수 있다. 인간의 인지력은 뛰어나면서 불필요한 것은 생략하는 위대한 힘을 가지고 있다. 따라서 두개의 검색어는 동일한 정보를 찾는다는 것을 알지만 사실 두개의 검색어는 조금 의미가 다르다는 것을 느낄 수 있다. "gas station around here" 는 비록 사용자가 주유소를 찾아 가고 싶다고 하더라도 검색어에 집중해서 살펴보면 주변에 주유소가 어디 있는지 단순 정보를 알고 싶어하는 내용이다. 그러나 두번째 검색어에서 the nearest 란 단어만으로 사용자의 다음 행동 양식을 강하게(?) 유추할 수 있는 것이다. 즉, 두번째는 첫번째에 비해서 목적지에 가야한다는 강한 의지를 좀더 보여준다. 그래서 첫번째 화면의 검색 결과는 지도와 함께 주유소의 위치, 정보 등을 구성하여 보여주지만 두번째는 바로 모바일 기기 안의 내비게이션 앱 (지도 앱)을 통해 길 안내를 실행할 수 있도록 구성되어 있고 목적지 하나가 가지는 터치할 수 있는 영역도 다소 크다.  그리고 첫번째는 두번째에 비해 다소 긴급성이 떨어지기도 하고 단순히 정보만 알고 싶을 수 있다는 느낌인지 상당에는 구글에서 제공하는 광고도 포함되어 있다. 반면 두번째는 구글 광고가 없다.  



이처럼 인간의 언어는 어떻게 물어보냐에 따라서 그 의도와 다음 행동 양식을 유추할 수 있는 단서들이 많이 존재한다. 이런 것을 유추하여 사용자가 다음에 할 수 있는 행동에 도움이 되는 정보와 앱, 기능을 제공한다면 이는 모바일 기기가 사용자와 상호작용 (interaction) 을 하면서 인간의 contextual behavior 를 보다 빠르고 실수 없이 수행할 수 있는 차이를 제공해준다. 


각을 마무리하며... 


가끔 샤워하다가 생각나는 아이디어를 메모하고 싶을 때가 있다. 그때마다 왜 이렇게 정보통신 기술이 발달했는데 화장실에 각 사용자 (가족 구성원 들마다) 을 인식하여 각 사용자 계정에 간단한 노트 정도 기록해줄 수 있는 홈 네트워크 시스템은 없는지 하는 생각을 할 때가 많다. 



많은 개발자들이 모바일 환경, 스마트폰 환경이 기회라고 생각하며 수없이 많은 앱들을 만들어 내고 그 안에서 기존에는 생각하지 못한 많은 기능들을 구현해 냈다. 그런데 정작 그런 기능들을 인간의 기본적인 활동에 필요한 내용이 아니라 그 기능을 수행하기 위해 인간이 필요한 역설적 결과를 만들기도 한다. 그래서 앱 개발자들은 기능이 화려하고, 화면이 예쁘면 성공할 것이라고 믿는 사람들도 많이 만나게 되었다. 그러나 그 중에서 앱이 가져야 하는 철학적 방향에 대해서 진지하게 고민하고 IT 기술이 어떤 방향으로 조금씩 변화하고 있는지에 대한 진지한 토론조차 보지 못했다.  그리고 개발자들의 순수한 철학적 고민보다는 경영자들의 시장 이익과 실리에 대한 추구로 인간의 새로운 두뇌가 되어주는 모바일 기기가 아닌 중독성과 사행성, 그리고 당장의 이익에 급급한 서비스와 앱을 제공해 왔다. 


개인적으로 관심을 가지는 진행하는 앱/데이터베이스가 있다. 지금까지는 단순히 컨텐츠로 머물 수 밖에 없었던 다양한 분야가 바로 모바일 기기의 특징과 컨텍스트로 전환될 수 있는 충분한 빈틈이라고 느껴진다. 예를 들어 단순히 정보로 남길 수 밖에 없는 유전체 정보, 질환 정보, 환자 정보 등과 같이 서로 연관성이 없는 부분에 대해 연결 고리를 만들어 주는 것도 앞서 인간 행동의 양식을 예상하는 새로운 분야가 될 수 있다는 것이다. 즉, 단순히 임상 의사 (clinical doctor) 들이 자신의 경험과 직관에 의해 결정을 내려야 했던 부분이 선택할 수 있는 치료법, 예전 치료 케이스 등을 통해 좀 더 구체적으로 도움을 받을 수 있는 것이다. 따라서 컨텍스트의 개념을 적극 도입하기 위해서는 두가지의 선결 조건을 생각하게 된다. ⓐ 충분히 의지할 만한 (reliable; 신뢰할 만한 이란 표현을 쓰긴 너무 불완전하기에...) 데이터베이스 그리고 그 데이터베이스를 통해 검색했을 때 ⓑ 잘 가공해서 보여줄 수 있는 모델을 가진 플랫폼이 필요하다. 



인터넷의 정보는 엄청나다. 그러나 정작 나에게 맞는 정보와 그 정보들이 내 생활 양식에 도움이 될 수 있는지 아니면 모바일 기기로 인해 방해가 될 수 있는지는 내가 모바일 기기를 어떻게 바라보냐에 따라서 크게 달라질 것이다. 이야기의 키워드를 인터페이스와 컨텐츠로 시작했지만 결국 두가지 키워드를 벗어나 인터액션과 컨텍스트를 향하기 위해서였다. 다시 강조하지만 이것이 컨텍스트다 이것은 아니다라는 구별로 무엇이 더 좋다는 것을 말하고 싶은 것이 아니다. 기술의 방향은 어떤 개념이든 결국 인간을 향해 있어야 한다. 인간이 필요하고 가려운 것을 긁어 줄 수 있는 것이 기술의 방향이어야 한다. 


간이 더 따뜻해지기 위해서이다. 



  1. 팜 UI 개발자인 Jeff Hawkins 가 언급한 brain neocortex 에서 참고했음. [본문으로]