회의를 녹음해 요약하려는 시도는 왜 멍청한가
기계가 듣고 작성한 회의록이 그럴듯해 보이나요? 아직 그렇지 않을 겁니다. 회의록을 다시 한 번 잘 살펴보세요.

사실 제목과 달리 회의를 녹음해 요약하려는 시도는 안 멍청할 수도 있습니다. 어쩌면 제가 지금 하려고 하는 이야기는 의미 있게 동작하는 AI의 등장을 따라잡지 못하는 사람의 러다이트 운동에 가까운 행동일 수 있다는 사실을 미리 인정합니다. 러다이트 운동의 본질은 기술 발전이나 자동화에 반대하는 관점으로 해석할 수도 있지만 주로 기술 발전으로 인한 불평등과 착취에 대한 저항의 관점으로 해석하는 것이 더 올바르다는 사실을 알고 있습니다. 다만 여기서는 전자의 관점으로 해석될 수 있음을 인정한다는 의미입니다. 실은 저 자신도 인공지능의 등장으로 머지않아 밥그릇이 사라질 가능성이 높은 직군에 종사하고 있습니다. 이미 미래는 정해져 있는 것이나 다름 없는데 저를 포함해 개발팀의 많은 부분을차지하는 고위 의사결정자의 결정을 실행하는 사람들 상당수는 필요 없어질 가능성이 높습니다. 다만 그런 현실이 찾아올 시점을 조금이라도 뒤로 미루기 위해 이미 저 같은 수준의 사람들도 활용하기에 나쁘지 않은 인공지능에 기반한 서비스의 도움을 최대한 받으며 생산성을 개선하려는 시도를 하고 있습니다. 가령 전화회사에서 써 보라고 한 검색 서비스를 사용하다 보니 구글을 안 쓰게 되었다든지, 컨플루언스 클라우드에서 사용할 수 있는 아틀라시안 인텔리전스를 활용하는 식입니다. 이들은 아직 제가 기대하는 수준의 파이프라인을 구축하지는 못하지만 이전에 비해 검색, 문제해결, 요약 같은 작업을 빠르게 끝낼 수 있게 해 줍니다.
이전 같으면 구글에서 여러 번의 검색과 검색 결과 확인, 여기서 이어지는 다음 단계의 검색과 검색 결과 확인을 반복하며 결론에 도달하고 또 문제해결에 도움을 받아 왔습니다. 시간이 꽤 필요한 일입니다. 단순히 리눅스 환경에서 어떤 상황을 해결하기 위한 명령어를 검색하려고 할 때 명령어의 매뉴얼을 차근차근 읽어 나가는 건 여러 사람들이 권장하지만 썩 효율적이지는 않습니다. 매뉴얼은 이 명령어의 모든 기능을 나열하지만 정작 제 상황에 맞는 명령어의 사용 방법을 알려주지는 않기 때문입니다. 검색 결과에는 이미 저와 비슷한 상황을 겪은 사람들이 어딘가에 똑같은 질문을 한 결과들도 나타나는데 운이 좋으면 이 결과로부터 한 번에 제가 원하는 결과를 얻을 수도 있지만 대부분은 질문자의 상황에 대한 공감능력이 완전히 결여된 사람들의 답변과는 거리가 먼 핀잔을 읽다가 시간을 낭비하기도 합니다. 매뉴얼에 다 나와 있는데 왜 이런 질문을 올리는지 모르겠다는 답변을 다는 사람부터 시작해 엉뚱한 환경에 사용할 명령어를 말하거나 현재의 접근 방식은 근본적으로 잘못되었으니 아예 다른 접근 방법을 쓰라고 말하지만 정작 구체적으로 그것이 무엇인지 말하지는 않는 온갖 쓸모 없는 답변들을 읽는데 시간을 낭비해야 합니다. 저는 집에서 운용하는 온프레미스 서버를 와이파이를 통해 인터넷에 연결해 놓았습니다. 응답속도, 연결의 안정성을 고려할 때 좋은 방법이 아니라는 사실을 잘 알고 있지만 여러 가지 상황 상 유선으로 인터넷을 사용할 수 있는 상황을 만들기 어려웠습니다. 와이파이로 인터넷에 연결된 서버는 지난 1년이 넘는 시간에 걸쳐 약간 느릴 수는 있겠지만 꽤 멀쩡히 동작했습니다. 저는 문득 저와 비슷하게 사용하는 사람이 있지 않을까 해서 사례를 검색했는데 역시 누군가 저와 같은 시도를 하기 전에 올린 질문을 찾았습니다. 하지만 답변들은 하나같이 한숨을 쉬며 그러지 말라고 말할 뿐 왜 그래서는 안되는지 말하지는 않는 앞서 소개한 근본적으로 공감능력이 결여된 이상한 사람들 뿐이었습니다.
하지만 본격적으로 인공지능에 기반한 검색 서비스를 사용하면서 저는 인터넷에 널려 있는 공감능력이 결여된 사람들로부터 마음을 다치거나 이들 때문에 짜증을 내며 시간을 낭비할 것 없이 멍청해 보일 수 있음을 전혀 걱정하지 않고 질문을 마구 입력했습니다. 그리고 이 인공지능에 기반한 검색 서비스는 마치 제가 했을법한 방식으로 검색 결과에 나타난 페이지를 직접 살펴보고 또 유튜브에서 영상을 살펴보며 다른 질문을 만들어낸 다음 또 그에 대한 검색을 반복한 결과를 요약해 돌려주었고 여기에는 공감능력이 결여된 사람들로부터 받을 수 있는 쓸모 없는 답변을 생략하고 실제 도움이 되는 답변들, 그리고 답변을 획득하는데 참고한 페이지 목록이 함께 나타났습니다. 이 안전한 질문, 답변 환경은 좀 더 적극적으로 여러 가지 질문을 자신있게 반복하게 만들어 주었고 각 질문에 대한 답변은 고작 몇십 초 안에 얻었습니다. 답변이 마음에 안 들거나 핀트에서 어긋나면 바로 이어서 좀 더 정확한 프롬프트에 기반한 질문을 하면 그만이었습니다. 또 블로그에 글을 쓸 때 대부분은 그 순간의 뇌 스냅샷에 기반해 이미 알고 있는 정보에 기반해 글을 쓰곤 했습니다. 블로그 글은 논문이 아니고 약간 틀린 정보나 출처가 명확하지 않은 말을 하더라도 별 문제가 되지 않는다고 생각했습니다. 또 어떤 사건이나 사례를 가볍게 인용하고 지나가려고 할 때마다 이들 각각을 본격적으로 조사하는 행동은 가볍게 글을 써 내려가는 리듬을 깨서 썩 마음에 들지 않기도 했습니다. 하지만 안전한 환경에서 편안하게 질문할 수 있게 되면서 간단한 언급 역시 검색을 해 보게 됐습니다. 마치 영상을 볼 때 영상의 길이를 미리 알고 있는 것과 비슷하게 어지간한 검색은 몇 초에서 몇 십 초 사이에 끝난다는 사실을 알고 있기에 시간을 예측할 수 있어 리듬을 깨지 않을 수 있었습니다. 가령 글을 시작할 때 저는 그저 러다이트 운동을 현대에 돌아볼 때 새로운 기술에 저항하는 사람들의 단면만을 알고 있었지만 이를 빠르게 검색해 기술에 의한 착취와 불평등에 대한 측면이 더 중요함을 빠르게 알아내고 이를 말할 수 있었습니다.
컨플루언스에 도입된 아틀라시안 인텔리전스는 처음 기대한 것 만큼 훌륭하지는 않지만 적어도 없는 것 보다는 나은 수준으로 동작하고 있습니다. 2년 전 처음 아틀라시안이 이 기능을 공개할 때 개인적으로 가장 기대한 것은 거대언어모델이 컨플루언스 위키 전체를 읽고 질문에 답하는 것이었습니다. 그들 역시 버추얼 팀메이트라는 개념을 선보이며 사람에게 물어보면 그 사람이 기억에 근거해 적당한 컨플루언스 페이지를 찾아 주는 것과 비슷하게 행동하는 검색 기능을 만들 작정이라고 발표했습니다. 그리고 2년여가 지난 지금 이 기능은 잘 동작하지 않습니다. 사실 그럴 수밖에 없는 것이 아틀라시안은 지라나 컨플루언스 같은 규모가 큰 조직에서 주로 사용할 법한 정보시스템을 개발하는데 전문성을 가진 곳입니다. 이들이 갑자기 거대언어모델에 기반한 검색 서비스를 도입하려 하더라도 이들은 거대언어모델 기술을 회사 안에 수직계열화 하고 있지 않을 가능성이 높습니다. 하다못해 이들은 자사의 클라우드 서비스를 모두 AWS에 의존하고 있는데 이는 달리 말하면 자신들의 클라우드 서비스를 운용할 데이터센터 구축에 필요한 기술을 수직계열화 하고 있지 않다는 의미이기도 합니다. 사실 이런 행동이 단점은 아닙니다. 집중해야 할 곳에 집중하고 외부 자원을 안정적으로 사용할 수 있다면 굳이 그 기능을 회사 안에 수직계열화 할 필요가 없습니다. 적어도 지라 클라우드나 컨플루언스 클라우드를 AWS를 통해 제공할 때는 그랬습니다. 그런데 거대언어모델 기반의 검색 기능을 컨플루언스에 도입하려고 보니 스스로 데이터센터를 구축할 능력이 없다는 것, 스스로 거대언어모델을 통제할 능력이 없다는 것은 이들이 2년 전 발표 때 선언한 버추얼 팀메이트라고 주장하기에는 현저히 수준이 떨어지는 검색 기능을 유지하게 만들었습니다.
컨플루언스 클라우드에서 아틀라시안 인텔리전스는 적어도 현재 페이지를 작성하는데는 꽤 유용하게 동작합니다. 글을 검토해 재작성해주고 필요 없는 부분을 제외해 더 간결한 모양을 만들 수도 있습니다. 개인적으로 문서가 조금이라도 길어지면 문서 맨 앞에 세 줄 요약을 넣곤 하는데 이 세 줄 요약을 제가 하지 않아도 기계에게 해 달라고 요구하면 그럭저럭 괜찮은 결과를 만들어냈습니다. 만약 결과가 마음에 들지 않으면 바로 이어서 마음에 들지 않는 이유를 말하고 이를 수정 반영해 달라고 하면 바로 수정된 요약을 얻을 수도 있었습니다. 또 현재 작성 중인 문서 그 자체에 기반해 질문하고 답변을 얻을 수도 있습니다. 가령 문서를 작성하다가 아틀라시안 인텔리전스 프롬프트를 열고 ‘이런 내용을 언급했나요?’ 라고 물어보면 문서를 살펴본 다음 순식간에 답변을 내놓았습니다. 이전 회의에서 다음에 수정할 기획서에 어떤 논의사항을 반영하겠다고 말해 놓고 이걸 빼먹으면 다음 회의에서 저는 처형 당할 겁니다. 아틀라시안 인텔리전스는 이런 목숨이 걸린 위협을 회피하는데 도움을 줍니다. 또 긴 문서를 실수 없이 파악하는데도 도움이 됩니다. 가령 어떤 사람들은 줄글로 표현할 수 있는 내용이라도 반드시 표 모양으로 만들곤 하는데 이는 때때로 도움이 되지만 대부분은 표를 만든 사람과 비슷한 사고 방식을 이해하지 않으면 도통 이해할 수 없기도 합니다. 또 표는 때때로 너무 커져 한 화면을 벗어나는데 이런 표는 더더욱 알아보기 어렵습니다. 최근 우리들이 올해 처리해야 할 모든 목표들과 현재 상태가 나열된 표를 읽어야 했는데 이 표 역시 여기 저기 산발적으로 수정되어 알아보기 어려웠습니다. 정신을 집중해 표를 차근차근 살펴보려다가 문득 그냥 아틀라시안 인텔리전스에게 보여주면 되지 않을까 싶은 생각이 들어 표를 컨플루언스 클라우드에 붙여 넣은 다음 아틀라시안 인텔리전스 프롬프트를 열어 말했습니다. ‘이 표에서 배경이 회색인 항목은 이미 처리된 것이고 보라색으로 표시된 것은 미래에 수행해야 하는 일이며 제목이 빨간색인 것은 중요한 일인데 이 중 김우진이 해야 할 일을 나열해 주세요’. 아틀라시안 인텔리전스는 정확한 답변을 내놓았고 저는 이 결과를 얻는데 채 30초도 걸리지 않았습니다.
하지만 아틀라시안 인텔리전스는 아직 여러 문서에 걸친 답변을 하지 못합니다. 프롬프트에 특정 스페이스나 특정 문서 및 그 하위 트리에 있는 문서를 읽어보고 이 질문에 답해 달라고 요청하면 아마도 하드코딩 되어 있을 것 같은 에러 메시지가 나타납니다. 예상하기에 이들은 아틀라시안 인텔리전스를 유지하는데 사용량에 따라 요금을 지불해야 하는 외부 서비스를 사용하고 있는데 한 페이지 수준의 문서를 보내는 정도는 비용을 감당할 수 있지만 여러 문서를 보내야 하는 질문은 문서의 양에 따라 때때로 답하기도 하고 도 때때로 답하지 않는 것 같습니다. 이런 제약은 아마도 아틀라시안이 수직계열화 하지 못한 인공지능 서비스를 사용하는데 필요한 비용을 통제하기 위한 제한처럼 보입니다. 하지만 근본적으로 여러 문서를 읽고 이를 백터화 해 저장한 다음 이를 기반으로 질문에 답하지 않는다면 그들이 2년 전에 선언했던 버추얼 팀메이트 수준에 도달하기는 어렵습니다. 제 개인 컨플루언스만 해도 이미 모든 문서 수가 다섯 자리를 넘긴 지 오래 됐고 이 문서들에는 일기부터 시작해 온갖 종류의 텍스트가 넘쳐납니다. 이 문서들은 그저 전통적인 검색을 통해 몇 달 또는 몇 년에 한 번 열람되어 도움을 주곤 하지만 만약 이 문서들을 모두 읽었거나 적어도 그때그때 제가 지정한 범위에 해당하는 문서를 읽은 다음 질문에 답한다면 큰 시너지를 얻을 수 있으리라 기대합니다. 하지만 아틀라시안 인텔리전스는 아직 그 정도 수준은 아닙니다. 어쩌면 그 정도 수준에 한동안 도달하지 못할 수 있으며 이는 아틀라시안 스스로의 노력에 의해 해결되기보다는 외부 서비스를 제공하는 회사들의 경쟁과 서비스 변경에 의해 달성될 가능성이 있습니다. 요약하면 머지 않아 기계에게 일자리를 빼앗길 미래는 이미 확정되어 있지만 그 순간에 이르기 전까지는 인공지능을 활용해 생산성을 올리려 노력하고 있고 전화회사에서 서보라고 준 검색 서비스와 아틀라시안 인텔리전스에 여러 모로 의존하고 있는데 장단이 있다는 이야기입니다. 여전히 갈 길이 멀어 보입니다.
한편 제 수준으로 소극적인 범위에서 인공지능을 활용하는데 머무르는 사람이 있는가 하면 또 다른 사람들은 훨씬 적극적으로 인공지능을 활용하려는 시도를 하는 것 같습니다. 과거에 비해 음성인식기술은 비교할 수 없을 정도로 발전했습니다. 개인적으로 처음 접한 음성인식기술은 간신히 ‘화자독립음성인식’ 수준에 도달하는 중이었는데 현대에 이를 다시 돌아보면 왜 저것이 하나의 기술 이름으로 포장될 수 있었는지 납득하기 어려울 지경입니다. 현대 인공지능 기술의 발전으로 음성인식 같은 패턴 매칭 분야가 비약적으로 발전했고 현대에는 어지간한 서비스들이 녹음 파일을 주면 이를 기반으로 꽤 정확한 텍스트를 만들어내며 심지어 상황을 인식해 공격적인 표현을 알아서 걸러주거나 특정 업계에서만 사용될 것 같은 고유명서마저도 처음에는 틀리지만 나중에는 철자를 제대로 맞추는 수준에 도달했습니다. 이쯤 되면 모든 회의에 기계 속기사를 대동하는 것과 별로 다르지 않은 상황입니다. 여기에 비용을 지속적으로 지불할 의지가 있다면요. 녹음을 꽤 훌륭한 텍스트로 바꿀 수 있으니 조금 더 나아가면 이를 기반으로 그럴싸한 회의록을 만들어낼 수 있을 거라는 생각을 하는 것은 크게 이상하지 않습니다. 이런 시도를 한 사례들을 알고 있고 또 멀지 않은 곳에서 비슷한 시도를 하는 것을 본 적도 있습니다. 아쉽지만 예측 가능한 이유로 녹음을 텍스트로 바꾸는데 까지는 아주 완벽하게 동작하던 서비스들이 이를 회의록으로 바꾸려고 하면 별로 훌륭하지 않은 결과를 내놓았습니다. 재미있게도 이런 시도를 하는 분들은 대체로 잘 작성된 회의록과 그렇지 않은 회의록을 구분할 수 있는 능력이 부족한 경우가 많았습니다.
잠깐 메모에 대한 이야기를 하고 지나가겠습니다. 저는 제가 나름 메모를 많이 하고 메모로부터 큰 도움을 받고 있다고 생각합니다. 메모라고 하기에는 기록량이 많고 이를 지탱하기 위해 여러 방법을 전전하다가 결국 몇 년 전에 주로 기업용 정보시스템으로 활용되곤 하는 컨플루언스 클라우드에 완전히 정착했습니다. 메모라고 부르기에는 기록의 분량이 많은 편이기 때문에 널리 사용되는 메모 앱 보다는 위키 모양의 기록 방식을 제공하는 서비스가 필요했는데 컨플루언스는 심지어 한 사이트에 3만명 이상의 동시 사용자를 지원하기 때문에 저 한 명이 아무리 하드코어하게 서비스를 사용한다 하더라도 규모 때문에 문제가 일어날 가능성은 거의 없을 겁니다. 많은 기록을 만들어내는 이유는 제 정신적 특성에 기인합니다. 제대로 진단을 받아 그에 합당한 조치를 취하고 있기는 하지만 진단 이전부터 다른 사람들과 비슷한 수준으로 사회에서 살아남기 위한 방법을 만들어냈는데 이것이 바로 기록에 기반해 생각하는 것입니다. 생각의 멱살에 설명했는데 머릿속으로 집중해서 생각을 이어나가기 굉장히 어렵기 때문에 이전에는 손으로 글씨를 쓰며 생각을 이어나갔고 손으로 글씨를 쓰는 속도로는 감당할 수 없는 상황이 맞닥뜨린 다음부터는 키보드로 글자를 타이핑하며 이를 기반으로 생각을 유지하고 또 진행 시켜 나가고 있습니다. 그래서 메모라고 부르기에는 분량이 많은 제 생각의 진행 과정을 그대로 나열한 온갖 문서가 만들어지고 또 이전에 했던 다른 생각을 기입한 페이지를 연결해 인용해 가며 생각을 유지합니다. 이 과정은 마치 마인드맵을 작성해 나가는 것과 비슷해 보이지만 실제로는 단순히 컨플루언스 위키에 페이지를 만들어 문장 모양으로 생각을 작성해 나가다가 다른 브라우저를 열어 위키를 검색한 다음 페이지 주소를 알아내 다시 생각을 하던 페이지로 돌아와 링크하기를 반복하는 지극히 단순한 모양입니다.
제가 이런 메모 또는 기록에 크게 의존하는 가장 큰 이유는 정신적인 특징 대문에 다른 사람들처럼 머릿속으로 생각을 유지하고 이어가기 어렵다는 점이 가장 크지만 또 다른 이유는 이 기록 행동을 통해 기억에 도움을 받을 수 있다는 점 때문입니다. 개인적으로 한자를 거의 사용하지 않아 심지어 키보드에 한자 키가 없어도 거의 불편함을 느끼지 않습니다. 몇 달에 한 번 정도 한자를 입력할 일이 있는데 그럴 때는 그냥 한자를 검색한 다음 원하는 문자가 나타나면 이를 복사해 붙여 넣는 식으로 입력합니다. 메인으로 사용하는 키보드에 한자 키를 할당하지 않았고 만약 이키가 있는 키보드를 한동안 사용할 일이 생긴다면 이 키를 제가 사용하는 다른 키로 바꿔 사용하곤 합니다. 어릴 때 학교에서는 한자를 가르쳤는데 지금 와서 생각해보면 한자를 가르쳤다기보다는 한문을 가르쳤다는 것이 더 정확해 보입니다. 한국어는 여전히 아주 많은 부분이 한자에 근거한 단어로 구성되어 있어 한자의 존재를 알고 있으면 단어와 문장을 이해하는데 도움이 됩니다. 하지만 학교에서는 이를 단순히 한자를 외우는 방식으로 교육하느라 적어도 저에게는 흥미를 전혀 만들어내지 못했습니다. 한문 교육은 그저 한문을 소리 내 읽고 한문을 끝없이 반복해서 작성하도록 고안된 노트에 같은 문자를 끝없이 반복해서 적는 것이었습니다. 한문 학습 과제는 주로 어떤 문자를 100번, 1000번 써오기 같은 모양이었기 때문에 시간을 줄이기 위해 글자 하나 하나를 완성하기 보다는 여러 칸에 걸쳐 글자의 같은 부분을 빠르게 쓰기를 반복하는 방식으로 과제를 하곤 했는데 이 때 포드 모델 T의 생산방식이 얼마나 효율적이었는지 직접 체험해볼 수 있었습니다.
결국 적어도 저 한 사람의 사례를 볼 때 한문 교육은 시간을 낭비했을 뿐 현대의 저에게 별 영향을 끼치지 못했습니다. 하지만 뭔가를 일시적으로 외우려면 이를 무한히 반복해서 작성하면 도움이 된다는 점을 알 수는 있었습니다. 이후에도 암기가 필요한 때가 오면 암기해야 할 정보들을 반복해서 작성하는 방법을 사용했고 대체로 잘 통했습니다. 다만 이렇게 암기한 기억은 그리 오래 가지 못했습니다. 또한 현대에 가까워질수록 뭔가 생각 나지 않을 때 이를 기억해내려고 노력하기 보다는 검색을 통해 빨리 찾아내는데 더 익숙해져 어떤 정보를 암기해야만 하는 상황은 점점 더 줄어드는 것처럼 보입니다. 그런데 제가 생각을 지속하기 위해 메모하고 메모보다는 더 긴 기록을 만들어내기를 반복하면서 얻은 장점에는 단지 다른 사람들과 비슷하거나 그보다는 못한 수준으로 생각을 이어갈 수는 있게 되었다는 것 하나만 있지는 않습니다. 기록에 의존해 생각하게 되면서 저는 생각을 머리와 손가락으로 동시에 하고 있는데 이는 제가 작성하는 기록의 전체적인 내용을 완전하지는 않지만 대략적으로 기억해 적어도 무엇을 검색하면 제가 원하는 기록에 도달하게 되는지 수준으로는 기억할 수 있게 해 주었습니다. 이는 마치 오래 전 한문 과제를 빨리 수행하기 위해 여러 칸에 걸쳐 한문의 같은 부분을 반복해서 기록하는 것과 비교할 수 있을 것 같은데 현대의 저는 생각을 위해 기록을 만들고 기록을 만드는 과정에서 우연히 기록의 여러 부분을 기억하게 되었습니다.
이제 다시 회의록 이야기로 돌아가 봅시다. 회의록은 사실 그 회의 하나에 오간 내용을 기록하고 정리한 문서가 아닙니다. 어떤 회의가 일어났다면 이 회의가 일어나게 만든 맥락이 있고 이 맥락을 이해하기 위해서는 이 회이에 참여한 여러 사람들이 그동안 작성한 여러 다른 문서들을 살펴봐야만 합니다. 함게 일하고 있고 또 각자가 어떤 일을 하고 있는지 대략 알고 있으니 그 모든 문서를 다 볼 필요도 없고 또 회의에 참여하는 모든 사람들이 착실하게 문서를 만들지도 않기는 합니다만, 그래도 한 회의에 오가는 대화를 살펴보면 각자가 어떤 맥락에 의해 저 이야기를 하고 있는지 짐작할 수는 있습니다. 이 짐작은 곧 회의 하나를 이해하기 위해서는 그 회의 이전에 오간 대화나 문서들을 미리 살펴봐야만 그 맥락을 온전히 따라잡을 수 있다는 의미이기도 합니다. 그렇습니다. 회의 하나를 이해하기 위해서는 그 회의 때 오간 대화 뿐 아니라 대화 도중 화면에 띄운 문서, 이 회의의 주제를 만들어내기까지 영향을 끼친 여러 문서와 코드, 에셋 따위에 기반한 맥락이 필요합니다. 그런데 음성 녹음에 기반해 회의록을 만들고 그 내용이 꽤 그럴싸하다고 생각하는 사람들은 회의 하나에 도달하는데 필요한 여러 맥락의 존재를 종종 고려하지 않는 것처럼 보입니다. 오직 그 회의에 오간 대화에 기반해 요약된 회의록은 마치 의사록의 요약처럼 주요 논의사항과 액션플랜을 도출할 수는 있습니다. 하지만 이 결과는 종종 회의에 참여한 사람들의 의도나 이들이 나눈 대화의 뉘앙스 같은 맥락에 기반한 정보를 완전히 무시하기 때문에 예상과 상당히 다른 결과를 보일 때가 많습니다. 중요한 내용이 누락되거나 별로 중요하지 않은 내용이 주요 액션 플랜에 나타나기도 합니다. 당연합니다. 회의를 요약한 인공지능은 오직 회의 때 오간 대화에 접근할 뿐 그 이상의 정보에는 접근하지 않았기 때문입니다. 어쩌면 그렇게까지 제한된 상황에서도 최소한 말이 되는 회의록을 만들어낸 것이 오히려 대단한 것인지도 모릅니다.
하지만 우리는 기계가 작성한 그럴싸한 회의록이 필요하지 않습니다. 우리들이 실제로 회의 결과에 따라 행동하기 위해서는 회의 이전의 업무 진행에 따른 맥락을 파악하고 이에 기반해 회의 내용을 작성한 회의록이 필요합니다. 회의 녹음에 기반해 이를 텍스트로 변환하고 이 텍스트를 다시 회의록 모양으로 변환하는 동작은 분명 신기해 보이기는 하지만 앞서 설명한 아틀라시안 인텔리전스가 보다 광범위한 문서에 기반해 답하지 않기 때문에 그 활용과 가능성이 제한되는 것처럼 오직 회의 녹음에 기반해 작성된 회의록 역시 같은 한계가 있습니다. 만약 이 회의록에 도달하기가지 일어난 사건과 기록에 기반한 맥락을 모르는 상태에서 회의록만을 본다면 기계가 대단히 훌륭하게 회의록을 작성했다고 평가할 수도 있습니다. 하지만 이런 시각에서 훌륭한 회의록은 그 후 사람들을 움직이지는 못할 겁니다. 이 모든 과정은 상황과 기록의 맥락에 의해 일어나며 회의록은 그 맥락의 연장에 불과하기 때문입니다. 그래서 저는 최소한 개인적으로, 그리고 아직 까지는 녹음에 기반해 기계가 회의록을 작성하게 하고 이를 그대로 활용하는 시도는 멍청한 짓이라고 생각합니다. 기계는 회의록에 도달할 맥락을 이해할 수 있을 수준에 도달했지만 우리들은 아직 그럴 파이프라인을 구축하거나 이에 당연히 요구되는 비용을 지불할 준비가 안 됐기 때문입니다.
오직 회의 하나의 내용에 기반해 작성된 회의록을 만드는데 낮은 비용만 필요합니다. 하지만 그 결과는 그 낮은 비용만큼이나 쓸모 없습니다. 이 역시 컨플루언스에 도입되어 있는 아틀라시안 인텔리전스가 그러하듯 이 기능을 수직계열화 하지 않은 이상 스스로 해결할 수 없습니다. 인공지능 서비스를 제공하는 회사들이 서로 간의 경쟁을 통해 서비스를 개선하고 가격을 조정한 다음에야 기계에게 그 동안의 맥락을 이해 시키고 이에 기반한 회의록을 작성하게 할 수 있을 겁니다. 이 시점에 도달한 다음에야 기계에게 녹음에 기반한 회의록을 작성하게 하고 이를 신뢰하려고 하는 시도가 비로소 멍청하지 않은 행동이 됩니다.