챗지피티(ChatGPT)가 화제다. 미국의 스타트업 기업 오픈에이아이가 개발한 대화형 인공지능 챗봇으로, 지난해 11월 출시 후 겨우 두 달 만에 사용자 수가 1억명을 넘겼다고 한다. 이 챗봇에 대한 뉴스 기사, 책, 논문이 쏟아지고 있다. 인기를 넘어 가히 열풍이라 불릴만하다. 어마어마한 양의 자료를 학습한 덕분에 인간의 언어를 이해하는 능력이 탁월하다는 점이 특징인데, 기껏해야 단답형이나 정형화된 답변 정도를 할 수 있는 기존의 챗봇과는 달리 자연스러운 대화가 가능하다. 이전 대화 내용을 기억해 맥락을 이해할 수도 있고, 질문을 그저 알아듣는 수준이 아니라 웬만한 전문 영역에서까지 그럴듯한 답을 내놓아 기존의 챗봇과는 비교할 수 없을 정도의 경험을 선사한다.
나도 챗지피티와 몇 번 대화를 나눠보았다. 중학생 아들에게 적당한 생일 선물을 알려달라고 하니 게임 콘솔, 자전거, 악기, 책, 스포츠 용품 등을 추천했다. 십대 남자 아이를 위한 무난한 답변인데, 아이의 관심사와 성격을 고려해야 한다는 조언도 빼놓지 않았다. 러닝할 때 들을 한 시간짜리 플레이리스트를 만들어달라는 요청에는 스무 곡짜리 리스트를 뚝딱 내놓았다. 이중 몇 곡은 내 스마트폰의 리스트에도 추가해 종종 듣고 있다.
조금 더 전문적인 요구도 해보았다. 미국, 영국, 한국의 의료 제도를 비교해달라는 요청에 한 장 남짓 분량의 요약문을 깔끔하게 만들어냈다. 리포트를 보니 무턱대고 서술하는 것이 아니라 세 나라 제도의 특성과 핵심을 이해하고 있다는 생각이 들었다. 구체적인 예시를 포함해 이천 단어 분량으로 좀더 긴 글을 요구했다. 그러자 미국의 경우엔 오바마 케어를 둘러싼 논란을, 영국의 경우엔 관절 치환술과 같은 수술을 받기까지의 오랜 대기 기간을 문제점으로 꼽았다. 한국에 대해선 코로나 팬데믹에 대해 효과적으로 대응할 수 있었던 배경에 고유의 의료 제도가 있었다고 설명했다. 학부 리포트 정도론 충분한 수준이었다. 온라인에선 챗지피티를 사용한 이들의 경험담이 넘쳐난다. 논문 초록이나 서론을 특정 저널의 형식에 맞춰 그럴듯하게 작성해 주더라는 후기도 찾을 수 있다.
사정이 이렇다 보니 교육계와 학계에서도 챗지피티에 대한 논란이 뜨겁다. 과제에 챗지피티를 이용하는 것을 금지하거나 인공지능 활용에 대한 지침을 마련한 학교가 늘고 있고, 네이처나 사이언스와 같은 유명 저널은 챗지피티를 저자로 인정할 수 없다는 입장을 내놓았다. 임상 의학계도 예외는 아니어서, 최근 New England Journal of Medicine에서는 챗지피티 활용에 있어서 장점과 한계에 대한 특별 기고를 발표하기도 했다.
챗지피티는 생성형 인공지능(Generative AI)에 속한다. 챗지피티 열풍의 핵심은 이용자의 요구에 따라 새로운 결과를 만들어내는 이 생성 능력에 있다. 하지만 놀라운 능력 이면에는 그림자도 있는데, 바로 ‘환각(hallucination)’이라 부르는 문제다. 인공지능이 모르는 질문에 대한 답변도 아는 척 그럴듯하게 만들어내는 현상을 일컫는 용어이다. 세종대왕이 맥북 프로를 던진 사건에 대한 조선왕조실록의 기록을 알려달라는 황당한 질문에 실제 한글 창제 과정에서 있었던 역사적 사건이라고 답을 한 사례는 유명하다. 현재 한국 대통령을 묻는 질문도 환각의 대표적인 예다. 2021년 자료까지만 학습한 챗지피티가 이 질문에 답하는 것은 애초에 불가능함에도 종종 틀린 답을 천연덕스럽게 내놓는다.
이러한 사례를 고려하면 아직까지 챗지피티를 정보 검색 용도로 쓰기엔 한계가 있어 보이지만, 언젠가는 인공지능을 이용한 검색이 대세가 될지도 모른다. 최근엔 마이크로소프트가 챗지피티의 최신 언어 모델 GPT-4를 탑재한 새로운 빙을 내놓고 구글의 아성에 도전하고 있다. 구글도 생성형 인공지능을 이용한 검색 서비스를 준비하고 있다 하니 두 공룡 기업의 싸움이 어떻게 진행될지 흥미롭다. 두 기업의 생성형 인공지능 중 어느 쪽이 승자가 될지는 모르지만 개인적으로는 검색 시장에서 구글의 영향력이 더 강해질 거라고 생각한다. 바로 유튜브 때문이다.
작년에 아들의 자전거를 새로 사면서 자전거를 자주 타는 동료에게 자전거 모델 추천을 부탁했다. 이런저런 조언을 해주던 그가 말했다. “유튜브도 한번 찾아보세요. 요즘은 자전거 타는 사람들이 많아서 유튜브에 정보가 다 있습니다.” 유튜브로 검색을 한다고? 검색 하면 자연스레 구글이나 네이버를 떠올리는 나로선 낯선 경험이었다. 그런데 찾아보니 실제 유용한 정보가 많았다. 요즘 유행하는 자전거 모델, 자전거를 살 때 주의할 점, 구입 후기와 사용기 등 초보에게 필요한 콘텐츠도 충분했다.
직접 검색을 해보니 왜 유튜브를 이용하는지 이내 알 수 있었다. 동영상은 텍스트나 이미지에 비해 이해하기 쉽고 기억에도 오래 남았다. 자전거를 고를 때만 그럴까. ‘강남역 맛집’, ‘부산 여행’, ‘스파게티 만들기’ 등의 검색어를 입력할 때 네이버나 구글, 그리고 유튜브 중 어느 쪽이 더 생생한 정보를 줄 수 있을지를 생각해보자. 제품 사용기, 여행기, 요리, 맛집 후기 등 사용자 경험에 기반한 정보라면 동영상이 주는 장점이 클 것이다. 영화나 미술, 게임과 같은 문화 콘텐츠도 마찬가지이다. 유튜브에는 신작 영화나 게임 스토리를 요약한 십여 분짜리 영상이 넘쳐난다. 젊은 연령일수록 유튜브를 더 많이 이용한다고 하니 유튜브의 영향력은 점점 커질 것이다. 컴퓨터 게임을 좋아하는 중학생 내 아들만 해도 검색을 위해 초록색 테두리 창이 아닌 붉은색 유튜브 아이콘을 먼저 떠올리지 않을까 싶다.
검색을 통해 얻을 수 있는 정보 중에 건강에 대한 내용을 빼놓을 수 없다. 의료는 전문성이 높고 학문의 발전 속도가 빨라 공급자와 소비자 간에 정보의 비대칭이 가장 심한 분야이다. 환자 입장에선 이 의사의 말이 맞는지 틀린지, 이 병원과 저 병원 중 어떤 병원이 더 나은 진료를 하는지 판단하기 어렵다. 그래서 인터넷을 뒤진다. 미국의 조사에 따르면 환자 네 명 중 세 명이 자신의 질병에 대한 의사결정 과정에서 온라인 정보를 이용했다. 최근 국내 조사에서도 국민 열 명 중 일곱 명이 인터넷을 통해 건강 정보를 얻는다고 답했다(과기정통부 2021년 인터넷이용실태조사). 이는 팬데믹을 거치며 크게 증가한 수치다. 이렇게 많은 사람들이 온라인에서 건강 정보를 찾지만 막상 그 정보가 얼마나 정확한지 판단하기란 역시 어렵고 잘못된 정보를 만나는 경우도 많다.
국가 기관이나 대학 병원의 정보라면 대개 믿을만하지만 난이도가 문제이다. 건강 정보를 이해하고 활용할 수 있는 역량을 헬스 리터러시(health literacy)라고 하는데, 2020년 조사에서 적정 수준의 헬스 리터러시를 지닌 사람은 우리 국민의 29.1%에 불과했다(한국보건사회연구원). 건강 정보에 대한 일반인의 이해 수준이 낮은 만큼 정보의 내용도 이에 맞추어야 하겠지만 그게 만만치 않다.
몇 년 전 질병관리청의 국가건강정보포털 원고를 집필한 적이 있다. 국민에게 질병이나 증상에 대한 정보를 제공할 목적으로 만들어진 웹사이트로, 유용한 정보가 많다. 이 포털의 원고 집필 지침은 누구나 이해할 수 있도록, 초등학교 고학년 눈높이에 맞추도록 하는데 이렇게 쓰는 것이 보통 고민스런 일이 아니었다. 의학 용어 하나, 표현 하나도 일반인이 이해할 수 있도록 풀어 써야 했다. 나를 비롯한 모든 집필진이 비슷한 고민을 했겠지만 정보들이 이용자의 눈높이에 충분히 맞추어져 있는지는 의문이다. 전문가라 해도 의학 지식의 양과 그 지식을 일반 대중에게 전달하는 능력은 비례하지 않기 때문이다.
텍스트 형식에 비해 동영상은 쉽고 친근하며 정보 전달력도 높다. 이런 장점은 딱딱한 의학 지식을 전달하는 과정에서 빛을 발한다. 이러한 이유로 건강 정보를 검색하는 플랫폼으로서 유튜브의 역할도 점점 커지고 있다. 유튜브의 인기가 높다 보니 학회, 대학 병원은 물론 웬만한 종합 병원들도 홍보와 정보 전달 목적으로 유튜브 채널을 운영한다. 의사 중에서도 유명 유튜버가 많다. 비의료인이 운영하는 구독자 수십만의 채널들도 있다. 그렇다면 이들 채널의 정보는 얼마나 정확할까.
캐나다 연구진에 따르면 코로나 19 관련 인기 있는 유튜브 컨텐츠를 분석한 결과 27.5%가 잘못된 정보를 담고 있었다. 국내 연구에서도 통풍에 대한 유튜브 컨텐츠를 검토한 결과 10개 중 3개의 컨텐츠가 잘못된 정보를 주거나 개인적 경험을 전달하는 수준으로 나타났다. 유용한 컨텐츠의 대부분은 통풍과 관련된 학회나 전문의가 제작한 것이었고, 반면에 비전문가의 컨텐츠는 잘못된 정보를 담은 경우가 많았다. 하지만 영상에 대한 선호도는 정보의 정확성 여부와 관련이 없었고, 조회 수는 부정확한 컨텐츠가 오히려 높았다. 이 경우 검색 결과 부정확한 정보를 만나게 될 확률이 높아진다. 유튜브 검색 알고리즘은 정확성보다는 컨텐츠의 인기나 과거 시청 패턴을 기반으로 하기 때문이다.
유튜브에서 가짜 건강 정보를 피하기 위한 팁을 몇 가지 소개한다. 일단 의사가 만든 동영상을 선택하면 비교적 안전하다. 더 깐깐하게 고르자면 의사 개인 채널보다는 병원이나 학회의 채널이 낫다. 의사라고 해서 모두 맞는 말만 하진 않기 때문이다. 의사가 아닌 기타 무슨무슨 전문가나 박사 등의 채널은 적당히 거른다. 건강기능식품 쇼핑몰을 함께 운영하는 채널은 피하는 게 답이다. 추가로 ‘이것만 하면 된다’, ‘이건 큰일난다’거나, ‘무조건’, ‘반드시’ 등의 단어로 확신을 내뿜는 제목은 조회 수를 늘리기 위한 장치일 뿐이니 내용을 기대하지 말 것.
챗지피티에서 환각 현상과 같은 오류는 시간이 가면서 줄어들겠지만 유튜브에서 엉터리 건강 정보를 만나는 일이 줄어들지는 의문이다. 건강 정보의 경우 어느 영역보다도 생산자와 소비자 간의 격차가 큰데다, 유튜브 컨텐츠 생산자의 수입은 정보의 질이 아니라 구독자와 조회 수가 결정하기 때문이다. 이러한 구조에서는 정확한 내용보다 구독자의 관심을 끌 만한 내용의 정보가 많이 만들어지고 유통될 수밖에 없다.
부정확한 정보가 문제가 되면서 유튜브에서는 의사들이 만든 컨텐츠를 상단에 배치하는 등 나름의 대응책을 마련해 왔다. 최근엔 대학 병원 중심으로 인증 기관을 선정하고 신뢰도가 높은 컨텐츠를 우선 노출시키는 ‘유튜브 헬스’ 서비스를 시작한다고 한다. 일단 환영할 일이지만 문제가 해결될지는 모르겠다. 정확한 정보가 아니라 조회 수를 올릴 수 있는 내용의 컨텐츠가 수익을 올리는 구조는 그대로일 테니 말이다.
참고문헌
Osman W, Mohamed F, Elhassan M, Shoufan A. Is YouTube a reliable source of health-related information? A systematic review. BMC Med Educ. 2022 May 19;22(1):382.
Koo BS, Kim D, Jun JB. Reliability and Quality of Korean YouTube Videos for Education Regarding Gout. J Korean Med Sci. 2021 Nov;36(45):e303.
‘의료 괴담’은 그만…유튜브, 의학 콘텐츠 인증제 도입