*다니엘라 라마스 박사는 보스턴 브리검 여성병원 중환자실에서 일하는 폐 질환 전문의다.
인턴 시절 회진 중에 유난히 어려운 질문을 맞닥뜨리면 나는 곧장 화장실로 뛰어갔다. 그곳에서 주머니 속에 넣어 다니던 의학 참고서를 뒤져 답을 알아낸 후 대답할 준비가 되면 다시 서둘러 환자에게 돌아가곤 했다.
당시에 나는 의사의 일이 암기, 그러니까 가장 난해한 의학용어를 몽땅 외워버리는 일이라고 굳게 믿고 있었다. 탁월한 임상의라면 책이나 컴퓨터 없이도 진단을 내릴 수 있어야 하지 않을까. 적어도 당시에는 그렇게 생각했다.
그로부터 20년이 채 지나지 않은 지금, 우리는 의학의 새 시대라고 일컬어지는 때를 맞이하고 있다. 인공지능이 의료 기록을 작성하고 환자들과 소통하며 진단을 내리는 새로운 세상. 그 잠재력은 어마어마하다. 그러나 앞으로 이런 시스템이 발전하고 진료 과정에 통합되면 우리는 아주 복잡한 질문을 마주할 수밖에 없다. (의사의) 전문성은 어디에 필요한 것인가? 진단에 이르는 사고 과정을 '부조종사'인 컴퓨터가 수행할 수 있다면, 의사와 환자에게 의료 행위란 어떻게 달라지는 것일까?
의학계는 획기적인 혁신이 곧 생명을 구할 수 있는 분야지만, 아이러니하게도 의사들은 새로운 기술을 받아들이는 데 상대적으로 느린 편이다. 의사들은 여전히 다른 병원과 정보를 주고받을 때 팩스를 사용한다. 전자 의료 기록이 환자의 호흡, 체온, 심박수 등 활력 징후와 이상 검사 결과를 종합한 결과 감염이 있을지도 모른다고 경고한다면, 나는 그 경고가 도움이 된다고 느끼기보다 방해가 된다고 받아들일 것이다. 새로운 기술을 받아들이기를 주저하는 이유 가운데 하나는 물론 어떤 기술이든 검증을 거쳐야만 신뢰할 수 있기 때문이다. 그러나 '세상 어떤 교과서보다 많은 것을 머릿속에 담고 있는 진단의'라는 낭만적인 이상을 여전히 가슴 한쪽에 품고 있기 때문이기도 하다.
컴퓨터 진단이라는 개념은 이미 오래전부터 주목받았다. 의사들은 수십 년간 의사처럼 '생각'하고 진단할 수 있는 기계를 만들고자 시도해 왔다. 의학 드라마 「하우스」의 주인공 하우스 박사처럼 여러 가지 증상을 종합해 하나의 진단을 내릴 수 있는 프로그램 말이다. 그러나 초기 모델들은 작동하는 데 시간이 너무 오래 걸리고 결국에는 현실의 진료실에서 그다지 유용하지 않았다. 자연어 처리의 발전으로 컴퓨터가 인간처럼 새로운 콘텐츠를 만들어 낼 수 있는 생성 AI가 등장하기 전까지, 이러한 기계의 역할은 제한적이었다. 인공지능은 구글에서 증상을 검색해 보는 것과 달리 데이터를 종합하고 전문가 수준으로 '사고'하는 능력을 갖췄다.
아직 의사들은 생성 AI를 중환자실 업무에 도입하지 않았지만, 이는 곧 불가피해질 것으로 보인다. 병원에서 AI를 사용하는 방법 가운데 가장 떠올리기 쉬운 것이라면, 엑스레이 판독과 같이 패턴 인식에 활용하는 것을 꼽을 수 있다. 가장 뛰어난 의사라도 복잡한 패턴을 선입견 없이 인식하는 일에는 기계만큼 능숙하지 않을 수 있다. AI 프로그램이 일종의 전자 서기처럼 매일 환자 차트를 작성해 준다면 시간을 상당히 아낄 수 있기 때문에 이 부문에서도 기대가 크다. 의학 분야에서 AI의 활용 가능성에 대한 글을 쓴 심장전문의 에렉 토폴 박사가 지적한 대로, AI 기술은 의사와 환자 사이의 관계를 개선할 수 있다. 토폴 박사는 내게 "의료 분야에서 인간성을 회복시킬 방법이 여기에 있다"고 말하기도 했다.
시간을 절약하는 것 외에도 AI의 '지능'은 잘만 활용한다면 의사의 직업 역량을 향상할 수 있다. 메이요 클리닉 심장학과 AI 공동소장인 프란시스코 로페즈-히메네스 박사는 심장의 전기적 활동을 기록하는 장치인 심전도 판독에 AI를 활용하는 방법을 연구해 왔다. 심장전문의는 심전도에서 다양한 정보를 얻을 수 있지만, 컴퓨터는 심장이 얼마나 잘 작동하고 있는지를 비롯해 더 많은 정보를 뽑아낼 수 있고 이는 추가 검사가 필요한 환자를 걸러내는 데 도움을 줄 수 있다.
더욱 놀라운 사실은 로페즈-히메네스 연구팀이 AI에게 심전도 정보를 바탕으로 환자의 나이를 추측하게 했을 때 기계가 때로는 완전히 잘못된 답변을 내놓았다는 점이다. 처음에 연구진은 그저 기계가 심전도 정보로 나이를 추측하는 작업을 잘 못 하는 거라고 생각했지만, 얼마 안 가 기계가 실제 나이가 아닌 '생물학적 나이'를 제공한다는 사실을 깨달았다. 심전도의 패턴만으로 기계는 환자의 노화에 대해서 임상의보다 더 많은 사실을 알아내고 있었던 것이다.
이는 시작일 뿐이다. 환자의 목소리만으로 병을 진단하는 AI에 대한 연구도 이미 진행 중이다. AI를 마약 중독 치료에 사용하는 방법을 연구하는 이들도 있다. 그러나 중환자실 담당 의사로서 나는 생성 AI 프로그램의 진단 능력에 가장 큰 매력을 느낀다. 세상에 존재하는 모든 의료 지식을 단 몇 초 만에 찾아볼 수 있는 주머니 속 전문가를 회진에 대동한다고 상상해 보라.
이런 것을 활용하려면 무엇을 증명해야 할까? 차트를 적어주는 프로그램에 비하면 진단 프로그램에 대한 기준은 훨씬 높다. 우리가 의료 분야에서 통상적으로 사용하는 검증 방법, 즉 수년에 걸친, 엄격하게 설계된 무작위 임상 시험을 여기에 적용할 수는 없다. 임상 시험이 끝날 때쯤엔 또 새로운 기술이 나와 있을 테니 말이다. 검증 여부와 관계없이 이런 기술이 의료계의 일상으로 침투하는 것을 현실적으로 막을 방법은 없다.
보스턴의 베스 이스라엘 티코니스 병원에 근무하는 내과의이자 역사학자인 애덤 로드먼은 자신이 가르치는 의대생 대부분이 회진 중에 도움을 받기 위해, 또는 시험 문제를 예측하기 위해 이미 챗GPT를 쓰고 있다는 사실을 알게 됐다. AI가 난해한 의료 사례에 어떤 답을 내놓을지 궁금했던 로드먼 박사는 어렵기로 악명 높은 뉴잉글랜드 의학 저널의 주간 사례를 기계에 제시했는데, 기계는 60% 이상의 진단 적중률을 기록했다. 의사 한 사람이 이보다 나은 결과를 내기는 쉽지 않다.
AI의 능력이 현실 세계에서 어떻게 적용될지는 두고 봐야 한다. 그러나 신기술을 막 받아들이려는 상황에서도 로드먼 박사는 뭔가를 잃어버리게 되지 않을까 고민한다. 의사 수련은 오랫동안 매우 명확한 방식을 따랐다. 환자를 보고, 감독받는 환경에서 열심히 노력해 치료법을 찾고, 수련을 마칠 때까지 그 과정을 반복했다. 그러나 AI의 등장과 함께 수련 중인 의사는 스스로 진단하는 법을 배우기보다 그 힘든 과정을 기계에 의존해 수행할 수 있게 됐다. 잠재적인 진단에 이르기까지 서로 연관이 없어 보이는 다양한 증상을 스스로 정리하지 않는다면, 그 과정을 컴퓨터에 의존한다면, 훌륭한 의사로서 갖추어야 할 사고 과정은 어떻게 배울 수 있을까?
(남은 이야기는 스프에서)