Siri와 HAL9000

by Yun

영화 <2001: 스페이스 오딧세이>를 처음 접하게 된 때는, ‘디지털 미디어의 이해’ 혹은 그 비슷한 이름의 전공수업이었을 것이다. 그 당시에는 교수님이 영화의 초반 13분 가량(‘The Dawn of Man’ 파트‘아름답고 푸른 도나우강’이 흘러나오는 파트)을 보여주셨는데, 그때 본 이후로 ‘꼭 저건 봐야지’ 생각해서 제목을 메모장에 적어왔던 기억이 난다.
하여튼 그 이후로 그 긴 영화를 몇 번 반복해서 보았고, 약 일주일 전에 한번 더 보게 되었다. 사실, 애플이 아이폰4S를 발표한 이후 Siri에 각종 인문학에 등장하는 AI나 로봇의 오마쥬가 들어있다는 이야기를 듣고 한번 더 보아야겠다는 생각을 했는데, 그동안 바빠서 미루어 왔었다.

<2001: 스페이스 오딧세이>에서 단연 돋보이는 등장인물은 그 어떤 사람도 아닌 바로 HAL9000이다. ‘발견법적으로 프로그램된 연산 컴퓨터(Heuristically Programmed ALgorithmic computer)’ 9000시리즈는, 영화에서 목성으로 탐사를 떠나는 승무원들이 동면하는 동안 우주선 Discovery호를 통제하고 승무원의 안전을 책임지는 메인컴퓨터의 이름이다. HAL은 사람과 자연언어로 대화가 가능하며, 스스로 자신의 완벽함을 자랑한다. 우주선 내부 곳곳에 부착된 빨간색 발광 센서로 보여지는 HAL은 감정이 매마른듯한 억양의 차분한 남성 목소리를 갖고 있다. 영화에서 HAL은 운항 도중 고장을 일으켜 승무원을 모두 죽이려고 한다.

2011년 10월 4일, 애플은 ‘Let’s Talk iPhone’ 이벤트에서 자사의 최신 버전 스마트폰을 발표했고, 발표된 아이폰4S가 지금까지 발매된 기종들과 구별되는 가장 큰 특징은 Siri라고 이름지어진 ‘가상 비서(Virtual Assistant)’였다. Siri를 통해 사용자는 (비록 정확도에 대해 논란이 제기되고 있지만 그리고 이런 슬픈 상황도) 자연 언어에 가까운 방식으로 아이폰과 소통할 수 있게 되었다. 아직도 Beta딱지를 달고 있고, 공개 API가 없어 서드파티 앱에 대한 접근도 불가능하다는 점 등 제약사항이 많다. 하지만 음성만으로 전화를 걸거나 문자를 보내기, (어느정도)문맥을 이해하고 대답하는 기능을 갖춘 Siri는 분명 인간과 기계가 소통하는 방식이 크게 변화하고 있음을 보여준다.

그런데 내가 이야기하고 싶은 부분은 바로 Siri가 대답하는 방식이다. 단지 음성을 통해 명령하는 기능은 구글의 Voice Action For Android나 (정확도는 떨어지지만) Microsoft의 TellMe도 제공한다. 주목하고 싶은 부분은 정확도나 활용도 이야기가 아닌, 사용자가 말한 후 돌아오는 각각의 피드백이다. 링크된 영상을 보면 알겠지만, 구글의 Voice Action은 사용자가 말하면 기능을 바로 실행할 뿐 목소리로 응답을 하진 않는다. TellMe는 응답은 하지만 Siri와 비교하면 ‘대답’이라기보다는 그저 ‘확인차 다시 읽어주기’라고 할 수 있을 것 같다. 제한적이나마 사람의 자연언어를 이해하고 ‘대답’하는 기능이 상용화 된 것은 Siri가 처음이라고 할 수 있을 것이다.

Siri가 비록 여러가지 재밌는 대답들려주긴 하지만, 이러한 gimmick들은 어디까지나 의도된 요소일 뿐, 내가 느끼는 일반적인 Siri의 이미지는 도도하고 차갑다. 그리고 Siri는 감정을 갖고 있지 않다. 기계에 감정을 넣을 수 없는 기술적 한계와 더불어 Siri가 더욱 차갑게 느껴지는 이유는,

  1. 사용자가 간결하게 말해야 이해한다는 점.
  2. 지극히 기계적인 어투를 구사.
  3. 필요 이상의 말을 하지 않는 특징.
  4. ‘완전무결함’ (여기서 말하는 완전무결함은, 네트워크에 연결된 Siri를 말하는 것. 사용자가 원하는 모든 정보를 검색해 줄 수 있다, 즉 ‘나는 네가 묻는 것에 대하여 모든 대답을 갖고 있다’라는 인식을 말하는 것이지, 덜떨어지는 인식률에 대한 이야기가 아니다. 복잡한 수학 공식은 울프램 알파를 이용해서 답을 알려주고, 아무리 괴상한걸 물어도 ‘I don’t know what you mean by ‘blablabla’에서 끝나는게 아닌, Search the web 버튼이 있다.)

때문이라고 생각한다. 1번과 2번의 경우는 기술적 한계 때문이라고 할 수 있다. 사람과 사람이 이야기하는 것처럼 긴 문장과 횡설수설한 말을 이해하고 생동감있는 억양을 구사하려면 기술이 발전해야 가능할 것이다. 3번의 경우는, 사용자가 어떠한 조작도 하지 않았는데 Siri가 혼자 떠드는 것에 대해서는 기능적으로 심각하게 문제가 있다고 간주될 수 있기에 제쳐둘 수 밖에 없다.(아니, 오히려 무서울 수도 있겠다. 자려고 누웠는데 “Yun, are you in there?”라고 묻는다고 상상해봐라.) 4번 역시 ‘모른다’에서 끝나면 오히려 결함이라고 할 수 있기에, 웹 결과를 검색하겠냐고 대안을 제시해 주는 것은 적절한 기능이다.

내가 이 ‘Siri의 감정 결여와 차디찬 사무적인 이미지’에 주목하는 이유는 이것이 인간이 수십년간 내재화해온 ‘나쁜 기계’에 대한 이미지와 교차하기 때문이다. 이 글의 처음에 소개한 HAL9000처럼, 많은 작품에 등장하는 ‘나쁜 기계’에 대한 이미지는 차갑고 사무적이며 딱딱하다. 아마도 HAL9000이 현대 각종 장르에 등장하는 많은 악역 AI및 로봇의 시초격이기에 다들 이렇게 비슷한 캐릭터가 아닐까하고 생각한다.(‘나쁜 로봇’의 눈이나 센서가 대체로 빨간색인 것도 HAL9000의 센서가 빨간 렌즈인 것의 오마주인듯 하다.) 쉽게, 블레이드 러너에 등장하는 리플리컨트들, 공각기동대 극장판 <Gost in the Shell>에 등장하는 인형사(프로젝트 2501), 터미네이터, <Matrix>의 요원들, <I, Robot>에 등장하는 로봇들, <Wall-E>의 오토(오토는 HAL9000을 적나라하게 오마주하였다.) 게임 <Portal>의 글라도스 등의 예를 들 수 있다. (비록 <블레이드 러너>의 레이첼, <Ghost in the Shell>의 인형사나 <터미네이터> 2~4편에 등장하는 일부 로봇들, <I, Robot>의 ‘써니’ 글라도스가 감자도스가 됬을 때 등은 엄밀히 말하면 악역은 아니지만, 인류에게 위협적 존재라는 큰 개념으로 인용했다.) 방금 열거한 캐릭터들은 대체로 위에서 언급한 2~4번과 유사한 속성을 갖고 있다. (1번은 공상과학 장르에서 대체적으로 그리고 암묵적으로 극복해낸 기술 장벽으로 표현된다.)

반면에, 각종 영화에 등장하는 ‘착한 로봇’을 생각해보자. 일단 착한 로봇들은 감정을 갖고 있다. <Star Wars>시리즈에 등장하는 C3PO는 어찌보면 실패작 로봇처럼 바보같고 실수도 많이 한다. 애초에 스토리에서 어린 아나킨이 할아버지를 위해 만든 로봇이라 그런지, 과도하게 친절하고 매우 말이 많다. 어리숙하고 썰렁한 농담을 하는 것이 마치 어린 동생의 이미지이다. R2D2는 C3PO에 비해 도도한 이미지에 똘똘하고 (잠긴 문의 암호를 해제하는 등)전문적인것처럼 보이지만, 그래도 그 삐빅소리로 애교를 떠는 등 애완용 고양이같이 귀여운 구석이 있다. 다시 영화 <Wall-E>에서는 가끔 멍청하지만 귀여운 로봇이 주인공으로 등장한다. 영화 <No.5 파괴작전 (Short Circuit)> 주인공인 Johnny Five도 실수하는 모습을 가지고 인간에게 친절한 로봇이다.

이렇게 수십년간 많은 작품을 통해서 사람들은 ‘좋은 로봇’과 ‘나쁜 로봇’의 전형적인 클리셰 혹은 오마주에 노출되어왔고, 이러한 누적은 고정관념을 만들어 왔다. 그리고 감정이 없는, 혹은 감정 유사한 것을 표현하지 못하는 Siri는 확실히 ‘좋은 로봇’의 전형이라고 느껴지지 않는다. 그렇다고 해서 애플이 Siri를 각 단말기에 심어서 나중에 Skynet아니, iNet같은 것으로 ‘심판의 날’을 야기시킬 것이라는 이야기가 아니다.

Siri는 최초로 상용화된 언어로 상호 소통하는 유사AI 시스템인데 여기서 최초라는 점이 중요하다. 사람들은 미래의 동종 제품군(미래에 출시될 Siri와 유사한 기능. 예를 들어 Voice InterAction for Android라던지)에 대해서 Siri의 경험과 비교할 것이고, 동종 제품을 개발하는 업체들도 Siri의 경험을 초석으로 삼을 것이다. 결국 Siri는 ‘사람과 기계가 언어로 대화하는 것에 대한 첫 대중적인 경험’을 소개한 것인데, 위에서 이야기했던 여러가지 이유로 이 경험이 ‘착한 로봇’보다는 ‘나쁜 로봇’의 전형이 되었다는 점은 사람들의 의식 깊숙히 기계에 대한 불신과 반감을 형성할 가능성이 있다고 생각한다.

그래서 사람들이 보다 더 기계와 적극적으로 대화를 나누고 친숙해지려면, 이러한 장벽을 허무는 것이 중요하다. 이미 언급했듯 기술적인 한계가 크다. 그렇다고 이러한 ‘차가운 기계’의 경험이 오랫동안 지속되면 사람들은 ‘나쁜 로봇’의 캐릭터를 누적해서 경험하게 될 것이고, 이는 앞으로 인간과 기계의 커뮤니케이션에 있어서 장애 요소로 작용할 가능성이 있다.