Canadian perspective on teaching artificial intelligence to medical students

Tak fordi du besøgte Nature.com.Den version af browseren, du bruger, har begrænset CSS-understøttelse.For de bedste resultater anbefaler vi at bruge en nyere version af din browser (eller at slå kompatibilitetstilstand fra i Internet Explorer).I mellemtiden, for at sikre løbende support, viser vi siden uden styling eller JavaScript.
Anvendelser af klinisk kunstig intelligens (AI) vokser hurtigt, men eksisterende lægeskolepensum tilbyder begrænset undervisning, der dækker dette område.Her beskriver vi et kunstig intelligens træningskursus, vi har udviklet og leveret til canadiske medicinstuderende, og kommer med anbefalinger til fremtidig træning.
Kunstig intelligens (AI) i medicin kan forbedre effektiviteten på arbejdspladsen og hjælpe klinisk beslutningstagning.For sikkert at vejlede brugen af kunstig intelligens, skal læger have en vis forståelse for kunstig intelligens.Mange kommentarer går ind for undervisning i AI-koncepter1, såsom at forklare AI-modeller og verifikationsprocesser2.Der er dog kun gennemført få strukturerede planer, især på nationalt plan.Pinto dos Santos et al.3.263 medicinstuderende blev undersøgt, og 71 % var enige i, at de havde brug for træning i kunstig intelligens.At undervise i kunstig intelligens til et medicinsk publikum kræver et omhyggeligt design, der kombinerer tekniske og ikke-tekniske koncepter for studerende, der ofte har omfattende forhåndsviden.Vi beskriver vores erfaring med at levere en række AI-workshops til tre grupper af medicinstuderende og kommer med anbefalinger til fremtidig medicinsk uddannelse i AI.
Vores fem ugers Introduktion til kunstig intelligens i medicin-workshop for medicinstuderende blev afholdt tre gange mellem februar 2019 og april 2021. Et skema for hver workshop, med en kort beskrivelse af ændringer i kurset, er vist i figur 1. Vores kursus har tre primære læringsmål: studerende forstår, hvordan data behandles i kunstig intelligens-applikationer, analyserer kunstig intelligens-litteraturen til kliniske anvendelser og udnytter mulighederne for at samarbejde med ingeniører, der udvikler kunstig intelligens.
Blå er emnet for foredraget og lyseblå er den interaktive spørgsmål og svar periode.Det grå afsnit er omdrejningspunktet for den korte litteraturgennemgang.De orange sektioner er udvalgte casestudier, der beskriver kunstig intelligens-modeller eller -teknikker.Green er et guidet programmeringskursus designet til at lære kunstig intelligens at løse kliniske problemer og evaluere modeller.Indholdet og varigheden af workshoppene varierer ud fra en vurdering af elevernes behov.
Den første workshop blev afholdt på University of British Columbia fra februar til april 2019, og alle 8 deltagere gav positiv feedback4.På grund af COVID-19 blev den anden workshop afholdt praktisk talt i oktober-november 2020, hvor 222 medicinstuderende og 3 beboere fra 8 canadiske medicinske skoler tilmeldte sig.Præsentationsdias og kode er blevet uploadet til et websted med åben adgang (http://ubcaimed.github.io).Den centrale feedback fra den første iteration var, at forelæsningerne var for intense og materialet for teoretisk.At betjene Canadas seks forskellige tidszoner udgør yderligere udfordringer.Således forkortede den anden workshop hver session til 1 time, forenklede kursusmaterialet, tilføjede flere casestudier og skabte kedelprogrammer, der gjorde det muligt for deltagerne at fuldføre kodestykker med minimal debugging (boks 1).Nøglefeedback fra den anden iteration omfattede positiv feedback på programmeringsøvelserne og en anmodning om at demonstrere planlægning af et maskinlæringsprojekt.Derfor inkluderede vi i vores tredje workshop, som blev afholdt virtuelt for 126 medicinstuderende i marts-april 2021, mere interaktive kodningsøvelser og projektfeedbacksessioner for at demonstrere virkningen af at bruge workshopkoncepter på projekter.
Dataanalyse: Et studieområde inden for statistik, der identificerer meningsfulde mønstre i data ved at analysere, behandle og kommunikere datamønstre.
Data mining: processen med at identificere og udtrække data.I forbindelse med kunstig intelligens er dette ofte stort, med flere variabler for hver prøve.
Dimensionalitetsreduktion: Processen med at transformere data med mange individuelle funktioner til færre funktioner, samtidig med at de vigtige egenskaber i det originale datasæt bevares.
Karakteristika (i sammenhæng med kunstig intelligens): målbare egenskaber for en prøve.Bruges ofte i flæng med "egenskab" eller "variabel".
Gradient Activation Map: En teknik, der bruges til at fortolke kunstig intelligens-modeller (især konvolutionelle neurale netværk), som analyserer processen med at optimere den sidste del af netværket for at identificere områder af data eller billeder, der er meget forudsigelige.
Standardmodel: En eksisterende AI-model, der er blevet fortrænet til at udføre lignende opgaver.
Test (i sammenhæng med kunstig intelligens): observere, hvordan en model udfører en opgave ved hjælp af data, den ikke har stødt på før.
Træning (i forbindelse med kunstig intelligens): At levere en model med data og resultater, så modellen justerer sine interne parametre for at optimere sin evne til at udføre opgaver ved hjælp af nye data.
Vektor: række af data.I maskinlæring er hvert array-element normalt et unikt træk ved prøven.
Tabel 1 viser de seneste kurser for april 2021, inklusive målrettede læringsmål for hvert emne.Denne workshop er beregnet til dem, der er nye på det tekniske niveau og kræver ikke nogen matematisk viden ud over det første år af en bacheloruddannelse.Kurset er udviklet af 6 medicinstuderende og 3 lærere med videregående uddannelser i ingeniørvidenskab.Ingeniører udvikler kunstig intelligensteori til at undervise, og medicinstuderende lærer klinisk relevant materiale.
Workshops omfatter forelæsninger, casestudier og guidet programmering.I den første forelæsning gennemgår vi udvalgte begreber for dataanalyse i biostatistik, herunder datavisualisering, logistisk regression og sammenligning af beskrivende og induktiv statistik.Selvom dataanalyse er grundlaget for kunstig intelligens, udelukker vi emner som data mining, signifikanstestning eller interaktiv visualisering.Dette skyldtes tidsbegrænsninger, og også fordi nogle bachelorstuderende havde forudgående uddannelse i biostatistik og ønskede at dække mere unikke maskinlæringsemner.Det efterfølgende foredrag introducerer moderne metoder og diskuterer AI-problemformulering, fordele og begrænsninger ved AI-modeller og modeltest.Forelæsningerne suppleres af litteratur og praktisk forskning om eksisterende kunstig intelligens-enheder.Vi lægger vægt på de færdigheder, der kræves for at evaluere effektiviteten og gennemførligheden af en model til at løse kliniske spørgsmål, herunder forståelse af begrænsningerne ved eksisterende kunstig intelligens-enheder.For eksempel bad vi eleverne om at fortolke retningslinjerne for pædiatriske hovedskader foreslået af Kupperman et al., 5, som implementerede en kunstig intelligens-beslutningstræ-algoritme for at bestemme, om en CT-scanning ville være nyttig baseret på en læges undersøgelse.Vi understreger, at dette er et almindeligt eksempel på kunstig intelligens, der giver prædiktive analyser, som læger kan fortolke i stedet for at erstatte læger.
I de tilgængelige open source bootstrap-programmeringseksempler (https://github.com/ubcaimed/ubcaimed.github.io/tree/master/programming_examples), demonstrerer vi, hvordan man udfører undersøgende dataanalyse, dimensionsreduktion, standardmodelindlæsning og træning .og testning.Vi bruger Google Colaboratory-notebooks (Google LLC, Mountain View, CA), som gør det muligt at udføre Python-kode fra en webbrowser.Fig. 2 viser et eksempel på en programmeringsøvelse.Denne øvelse involverer forudsigelse af maligniteter ved hjælp af Wisconsin Open Breast Imaging Dataset6 og en beslutningstræalgoritme.
Præsenter programmer i løbet af ugen om relaterede emner, og vælg eksempler fra offentliggjorte AI-applikationer.Programmeringselementer medtages kun, hvis de vurderes at være relevante for at give indsigt i fremtidig klinisk praksis, såsom hvordan man evaluerer modeller for at afgøre, om de er klar til brug i kliniske forsøg.Disse eksempler kulminerer i en fuldgyldig ende-til-ende-applikation, der klassificerer tumorer som benigne eller ondartede baseret på medicinske billedparametre.
Heterogenitet af tidligere viden.Vores deltagere varierede i deres matematiske viden.For eksempel leder studerende med avanceret ingeniørbaggrund efter mere dybdegående materiale, såsom hvordan man udfører deres egne Fourier-transformationer.Det er dog ikke muligt at diskutere Fourier-algoritmen i klassen, fordi det kræver indgående kendskab til signalbehandling.
Fremmøde afgang.Deltagelse i opfølgningsmøder faldt, især i online-formater.En løsning kan være at spore fremmøde og give et færdiggørelsesbevis.Medicinske skoler er kendt for at genkende udskrifter af studerendes ekstracurricular akademiske aktiviteter, som kan tilskynde studerende til at forfølge en grad.
Kursusdesign: Fordi AI spænder over så mange underfelter, kan det være udfordrende at vælge kernekoncepter med passende dybde og bredde.For eksempel er kontinuiteten i brugen af AI-værktøjer fra laboratoriet til klinikken et vigtigt emne.Mens vi dækker dataforbehandling, modelbygning og validering, inkluderer vi ikke emner som big data-analyse, interaktiv visualisering eller udførelse af kliniske forsøg med AI, i stedet fokuserer vi på de mest unikke AI-koncepter.Vores ledende princip er at forbedre læsefærdigheder, ikke færdigheder.For eksempel er forståelsen af, hvordan en model behandler inputfunktioner, vigtig for fortolkningen.En måde at gøre dette på er at bruge gradientaktiveringskort, som kan visualisere, hvilke områder af dataene der er forudsigelige.Dette kræver dog multivariat beregning og kan ikke indføres8.At udvikle en fælles terminologi var udfordrende, fordi vi forsøgte at forklare, hvordan man arbejder med data som vektorer uden matematisk formalisme.Bemærk, at forskellige udtryk har samme betydning, for eksempel i epidemiologi beskrives en "karakteristik" som en "variabel" eller "attribut."
Opbevaring af viden.Fordi anvendelsen af AI er begrænset, er det endnu uvist, i hvilket omfang deltagerne bevarer viden.Medicinske skoles læseplaner er ofte afhængige af gentagelser med afstand for at styrke viden under praktiske rotationer9, som også kan anvendes til AI-undervisning.
Faglighed er vigtigere end læsefærdighed.Materialets dybde er designet uden matematisk stringens, hvilket var et problem ved lanceringen af kliniske kurser i kunstig intelligens.I programmeringseksemplerne bruger vi et skabelonprogram, der giver deltagerne mulighed for at udfylde felter og køre softwaren uden at skulle finde ud af, hvordan man opsætter et komplet programmeringsmiljø.
Bekymringer om kunstig intelligens behandlet: Der er udbredt bekymring for, at kunstig intelligens kan erstatte nogle kliniske opgaver3.For at løse dette problem forklarer vi begrænsningerne ved AI, herunder det faktum, at næsten alle AI-teknologier godkendt af regulatorer kræver lægetilsyn11.Vi understreger også vigtigheden af bias, fordi algoritmer er tilbøjelige til bias, især hvis datasættet ikke er forskelligartet12.Som følge heraf kan en bestemt undergruppe være modelleret forkert, hvilket fører til uretfærdige kliniske beslutninger.
Ressourcer er offentligt tilgængelige: Vi har oprettet offentligt tilgængelige ressourcer, herunder forelæsningsslides og kode.Selvom adgang til synkront indhold er begrænset på grund af tidszoner, er open source-indhold en bekvem metode til asynkron læring, da AI-ekspertise ikke er tilgængelig på alle medicinske skoler.
Tværfagligt samarbejde: Denne workshop er et joint venture initieret af medicinstuderende for at planlægge kurser sammen med ingeniører.Dette viser samarbejdsmuligheder og videnhuller på begge områder, hvilket giver deltagerne mulighed for at forstå den potentielle rolle, de kan bidrage med i fremtiden.
Definer AI kernekompetencer.Definition af en liste over kompetencer giver en standardiseret struktur, der kan integreres i eksisterende kompetencebaserede medicinske læseplaner.Denne workshop bruger i øjeblikket læringsmålniveau 2 (forståelse), 3 (anvendelse) og 4 (analyse) af Blooms taksonomi.At have ressourcer på højere klassifikationsniveauer, såsom at skabe projekter, kan yderligere styrke viden.Dette kræver, at man arbejder med kliniske eksperter for at bestemme, hvordan AI-emner kan anvendes på kliniske arbejdsgange og forhindre undervisning i gentagne emner, der allerede er inkluderet i standard medicinske læseplaner.
Opret casestudier ved hjælp af AI.I lighed med kliniske eksempler kan case-baseret læring forstærke abstrakte begreber ved at fremhæve deres relevans for kliniske spørgsmål.For eksempel analyserede et workshopstudie Googles AI-baserede diabetisk retinopati-detektionssystem 13 for at identificere udfordringer langs vejen fra laboratorium til klinik, såsom eksterne valideringskrav og regulatoriske godkendelsesveje.
Brug erfaringsbaseret læring: Tekniske færdigheder kræver fokuseret praksis og gentagen anvendelse for at mestre, svarende til de roterende læringserfaringer hos kliniske praktikanter.En potentiel løsning er den flippede klasseværelsesmodel, som er blevet rapporteret at forbedre videnfastholdelsen i ingeniøruddannelserne14.I denne model gennemgår eleverne teoretisk materiale selvstændigt, og undervisningstiden er afsat til at løse problemer gennem casestudier.
Skalering for multidisciplinære deltagere: Vi forestiller os AI-adoption, der involverer samarbejde på tværs af flere discipliner, herunder læger og allierede sundhedsprofessionelle med varierende uddannelsesniveauer.Derfor kan det være nødvendigt at udvikle læseplaner i samråd med fakulteter fra forskellige institutter for at skræddersy deres indhold til forskellige områder af sundhedsvæsenet.
Kunstig intelligens er højteknologisk, og dets kernebegreber er relateret til matematik og datalogi.Uddannelse af sundhedspersonale til at forstå kunstig intelligens giver unikke udfordringer i indholdsvalg, klinisk relevans og leveringsmetoder.Vi håber, at indsigten opnået fra AI-in Education-workshopsene vil hjælpe fremtidige undervisere med at omfavne innovative måder at integrere AI i medicinsk uddannelse.
Google Colaboratory Python-scriptet er open source og tilgængeligt på: https://github.com/ubcaimed/ubcaimed.github.io/tree/master/.
Prober, KG og Khan, S. Rethinking medicinsk uddannelse: en opfordring til handling.Akkad.medicin.88, 1407-1410 (2013).
McCoy, LG osv. Hvad skal medicinstuderende egentlig vide om kunstig intelligens?NPZh-numre.Medicin 3, 1–3 (2020).
Dos Santos, DP, et al.Medicinstuderendes holdning til kunstig intelligens: en multicenterundersøgelse.EURO.stråling.29, 1640-1646 (2019).
Fan, KY, Hu, R. og Singla, R. Introduktion til maskinlæring for medicinstuderende: et pilotprojekt.J. Med.underviser.54, 1042-1043 (2020).
Cooperman N, et al.Identifikation af børn med meget lav risiko for klinisk signifikant hjerneskade efter hovedskade: en prospektiv kohorteundersøgelse.Lancet 374, 1160-1170 (2009).
Street, WN, Wolberg, WH og Mangasarian, OL.Nuklear funktionsekstraktion til brysttumordiagnose.Biomedicinsk Videnskab.Billedbehandling.Biomedicinsk Videnskab.Weiss.1905, 861-870 (1993).
Chen, PHC, Liu, Y. og Peng, L. Hvordan man udvikler maskinlæringsmodeller til sundhedspleje.Nat.Matt.18, 410-414 (2019).
Selvaraju, RR et al.Grad-cam: Visuel fortolkning af dybe netværk via gradient-baseret lokalisering.Proceedings of the IEEE International Conference on Computer Vision, 618–626 (2017).
Kumaravel B, Stewart K og Ilic D. Udvikling og evaluering af en spiralmodel til vurdering af evidensbaserede medicinkompetencer ved hjælp af OSCE i den medicinske bacheloruddannelse.BMK Medicin.underviser.21, 1-9 (2021).
Kolachalama VB og Garg PS Maskinlæring og medicinsk uddannelse.NPZh-numre.medicin.1, 1-3 (2018).
van Leeuwen, KG, Schalekamp, S., Rutten, MJ, van Ginneken, B. og de Rooy, M. Kunstig intelligens i radiologi: 100 kommercielle produkter og deres videnskabelige beviser.EURO.stråling.31, 3797-3804 (2021).
Topol, EJ Højtydende medicin: konvergensen af menneskelig og kunstig intelligens.Nat.medicin.25, 44-56 (2019).
Bede, E. et al.Menneskecentreret evaluering af et dybt læringssystem indsat i klinikken til påvisning af diabetisk retinopati.Proceedings of the 2020 CHI Conference on Human Factors in Computing Systems (2020).
Kerr, B. The flipped classroom in engineering education: A research review.Proceedings of the 2015 International Conference on Interactive Collaborative Learning (2015).
Forfatterne takker Danielle Walker, Tim Salcudin og Peter Zandstra fra Biomedical Imaging and Artificial Intelligence Research Cluster ved University of British Columbia for støtte og finansiering.
RH, PP, ZH, RS og MA var ansvarlige for at udvikle workshoppens undervisningsindhold.RH og PP var ansvarlige for at udvikle programmeringseksemplerne.KYF, OY, MT og PW stod for den logistiske tilrettelæggelse af projektet og analysen af værkstederne.RH, OY, MT, RS var ansvarlige for at lave figurerne og tabellerne.RH, KYF, PP, ZH, OY, MY, PW, TL, MA, RS var ansvarlige for at udarbejde og redigere dokumentet.
Kommunikationsmedicin takker Carolyn McGregor, Fabio Moraes og Aditya Borakati for deres bidrag til gennemgangen af dette arbejde.

Indlægstid: 19. februar 2024

Canadisk perspektiv på undervisning i kunstig intelligens til medicinstuderende