• vi

Canadisk perspektiv på undervisning i kunstig intelligens til medicinstuderende

Tak fordi du besøgte Nature.com. Den version af browser, du bruger, har begrænset CSS -support. For de bedste resultater anbefaler vi at bruge en nyere version af din browser (eller slukke for kompatibilitetstilstand i Internet Explorer). I mellemtiden, for at sikre løbende støtte, viser vi stedet uden styling eller JavaScript.
Anvendelser af klinisk kunstig intelligens (AI) vokser hurtigt, men eksisterende medicinske skoleplaner tilbyder begrænset undervisning, der dækker dette område. Her beskriver vi et kunstig efterretningskursus, vi udviklede og leverede til canadiske medicinstuderende og fremsætter henstillinger til fremtidig træning.
Kunstig intelligens (AI) inden for medicin kan forbedre arbejdspladsens effektivitet og hjælpe klinisk beslutningstagning. For sikkert at guide brugen af ​​kunstig intelligens, skal læger have en vis forståelse af kunstig intelligens. Mange kommentarer går ind for at undervise i AI -koncepter1, såsom at forklare AI -modeller og verifikationsprocesser2. Imidlertid er der blevet implementeret få strukturerede planer, især på nationalt niveau. Pinto dos Santos et al.3. 263 medicinstuderende blev undersøgt, og 71% var enige om, at de havde brug for træning i kunstig intelligens. Undervisning i kunstig intelligens til et medicinsk publikum kræver omhyggelig design, der kombinerer tekniske og ikke-tekniske begreber for studerende, der ofte har omfattende forudgående viden. Vi beskriver vores erfaring med at levere en række AI -workshops til tre grupper af medicinstuderende og fremsætter henstillinger til fremtidig medicinsk uddannelse i AI.
Vores fem ugers introduktion til kunstig intelligens i medicinværkstedet for medicinstuderende blev afholdt tre gange mellem februar 2019 og april 2021. En tidsplan for hvert værksted med en kort beskrivelse af ændringer i kurset er vist i figur 1. Vores kursus har Tre primære læringsmål: Studerende forstår, hvordan data behandles i applikationer til kunstig intelligens, analyserer den kunstige intelligenslitteratur til kliniske applikationer og drager fordel af mulighederne for at samarbejde med ingeniører, der udvikler kunstig intelligens.
Blå er emnet for forelæsningen og lyseblå er det interaktive spørgsmål og svarperiode. Det grå afsnit er i fokus for den korte litteraturanmeldelse. De orange sektioner er valgte casestudier, der beskriver kunstige intelligensmodeller eller teknikker. Green er et guidet programmeringskursus designet til at undervise i kunstig intelligens til at løse kliniske problemer og evaluere modeller. Indholdet og varigheden af ​​workshops varierer baseret på en vurdering af studerendes behov.
Den første workshop blev afholdt på University of British Columbia fra februar til april 2019, og alle 8 deltagere gav positiv feedback4. På grund af Covid-19 blev det andet værksted afholdt næsten i oktober-november 2020 med 222 medicinske studerende og 3 indbyggere fra 8 canadiske medicinske skoler, der registrerede sig. Præsentationsglas og kode er blevet uploadet til et åbent adgangssted (http://ubcaimed.github.io). Den vigtigste feedback fra den første iteration var, at forelæsningerne var for intense og materialet for teoretisk. At betjene Canadas seks forskellige tidszoner udgør yderligere udfordringer. Således tilføjede den anden workshop hver session til 1 time, forenklede kursusmaterialet, tilføjede flere casestudier og skabte kedelpladeprogrammer, der gjorde det muligt for deltagerne at gennemføre kodestykker med minimal fejlfinding (boks 1). Nøglefeedback fra den anden iteration omfattede positiv feedback på programmeringsøvelserne og en anmodning om at demonstrere planlægning af et maskinlæringsprojekt. I vores tredje workshop, der blev afholdt stort set for 126 medicinstuderende i marts-april 2021, inkluderede vi derfor mere interaktive kodningsøvelser og projektfeedback-sessioner for at demonstrere virkningen af ​​at bruge workshop-koncepter på projekter.
Dataanalyse: Et studiefelt i statistikker, der identificerer meningsfulde mønstre i data ved at analysere, behandle og kommunikere datamønstre.
Datamining: Processen med at identificere og udtrække data. I forbindelse med kunstig intelligens er dette ofte stort med flere variabler for hver prøve.
Dimensionalitetsreduktion: Processen med at omdanne data med mange individuelle funktioner til færre funktioner, samtidig med at de vigtige egenskaber ved det originale datasæt bevares.
Karakteristika (i forbindelse med kunstig intelligens): målbare egenskaber ved en prøve. Ofte brugt ombytteligt med "ejendom" eller "variabel".
Gradientaktiveringskort: En teknik, der bruges til at fortolke kunstige intelligensmodeller (især indviklede neurale netværk), der analyserer processen med at optimere den sidste del af netværket til at identificere regioner med data eller billeder, der er meget forudsigelige.
Standardmodel: En eksisterende AI-model, der er foruddannet til at udføre lignende opgaver.
Testning (i forbindelse med kunstig intelligens): Iagttagelse af, hvordan en model udfører en opgave ved hjælp af data, den ikke har stødt før.
Træning (i forbindelse med kunstig intelligens): Tilvejebringelse af en model med data og resultater, så modellen justerer sine interne parametre for at optimere sin evne til at udføre opgaver ved hjælp af nye data.
Vector: Array of Data. I maskinlæring er hvert array -element normalt et unikt træk ved prøven.
Tabel 1 viser de seneste kurser for april 2021, inklusive målrettede læringsmål for hvert emne. Denne workshop er beregnet til dem, der er nye på det tekniske niveau og kræver ikke nogen matematisk viden ud over det første år af en medicinsk grad. Kurset blev udviklet af 6 medicinstuderende og 3 lærere med avancerede grader inden for teknik. Ingeniører udvikler kunstig intelligensteori at undervise, og medicinstuderende lærer klinisk relevant materiale.
Workshops inkluderer forelæsninger, casestudier og guidet programmering. I det første foredrag gennemgår vi valgte koncepter om dataanalyse i biostatistik, herunder datavisualisering, logistisk regression og sammenligningen af ​​beskrivende og induktiv statistik. Selvom dataanalyse er grundlaget for kunstig intelligens, udelukker vi emner såsom datamining, betydningstest eller interaktiv visualisering. Dette skyldtes tidsbegrænsninger, og også fordi nogle studerende havde tidligere træning i biostatistik og ønskede at dække mere unikke maskinindlæringsemner. Det efterfølgende foredrag introducerer moderne metoder og diskuterer AI -problemformulering, fordele og begrænsninger af AI -modeller og modelforsøg. Foredragene suppleres med litteratur og praktisk forskning på eksisterende kunstige intelligensenheder. Vi understreger de færdigheder, der kræves for at evaluere effektiviteten og gennemførligheden af ​​en model til at tackle kliniske spørgsmål, herunder forståelse af begrænsningerne i eksisterende kunstige intelligensenheder. For eksempel bad vi studerende om at fortolke de pædiatriske retningslinjer for hovedskade foreslået af Kupperman et al., 5, der implementerede en kunstig intelligensbeslutningstræalgoritme for at afgøre, om en CT -scanning ville være nyttig baseret på en læges undersøgelse. Vi understreger, at dette er et almindeligt eksempel på, at AI leverer forudsigelig analyse for læger til at fortolke snarere end at erstatte læger.
I de tilgængelige open source bootstrap -programmeringseksempler (https://github.com/ubcaimed/ubcaimed.github.io/tree/master/programming_examples), demonstrerer vi, hvordan man udfører udforskende dataanalyse, dimensionalitetsreduktion, standardmodelbelastning og træning og træning . og test. Vi bruger Google Colaboratory Notebooks (Google LLC, Mountain View, CA), som gør det muligt at udføre Python -kode fra en webbrowser. I fig. Figur 2 giver et eksempel på en programmeringsøvelse. Denne øvelse involverer at forudsige maligniteter ved hjælp af Wisconsin Open Breast Imaging Dataset6 og en beslutningstræalgoritme.
Nuværende programmer i løbet af ugen om relaterede emner og udvalg af eksempler fra offentliggjorte AI -applikationer. Programmeringselementer er kun inkluderet, hvis de betragtes som relevante for at give indsigt i fremtidig klinisk praksis, såsom hvordan man evaluerer modeller for at bestemme, om de er klar til brug i kliniske forsøg. Disse eksempler kulminerer med en fuldgyldig ende-til-ende-applikation, der klassificerer tumorer som godartede eller ondartede baseret på medicinske billedparametre.
Heterogenitet af forudgående viden. Vores deltagere varierede i deres niveau af matematisk viden. For eksempel er studerende med avanceret teknisk baggrund på udkig efter mere dybtgående materiale, såsom hvordan man udfører deres egne Fourier-transformationer. At diskutere Fourier-algoritmen i klassen er imidlertid ikke mulig, fordi den kræver en dybdegående viden om signalbehandling.
Deltagelsesudstrømning. Deltagelse på opfølgningsmøder faldt, især i onlineformater. En løsning kan være at spore deltagelse og give et certifikat for færdiggørelse. Det er kendt, at medicinske skoler anerkender udskrifter af studerendes fritidsskoler, som kan tilskynde studerende til at forfølge en grad.
Kursusdesign: Fordi AI spænder over så mange underfelter, kan det være udfordrende at vælge kernekoncepter med passende dybde og bredde. For eksempel er kontinuiteten i brugen af ​​AI -værktøjer fra laboratoriet til klinikken et vigtigt emne. Mens vi dækker forarbejdning af data, modelopbygning og validering, inkluderer vi ikke emner som Big Data Analytics, Interactive Visualization eller udførelse af AI -kliniske forsøg, i stedet fokuserer vi på de mest unikke AI -koncepter. Vores vejledende princip er at forbedre læsefærdigheder, ikke færdigheder. For eksempel er det vigtigt at forstå, hvordan en model behandler inputfunktioner, vigtig for tolkbarhed. En måde at gøre dette på er at bruge gradientaktiveringskort, som kan visualisere, hvilke regioner af dataene der er forudsigelige. Dette kræver dog multivariat beregning og kan ikke introduceres8. At udvikle en fælles terminologi var udfordrende, fordi vi forsøgte at forklare, hvordan vi arbejder med data som vektorer uden matematisk formalisme. Bemærk, at forskellige udtryk har den samme betydning, for eksempel i epidemiologi, en "karakteristisk" beskrives som en "variabel" eller "attribut."
Videnopbevaring. Fordi anvendelsen af ​​AI er begrænset, er det, i hvilket omfang deltagerne bevarer viden, der skal ses. Læreplaner for medicinsk skole er ofte afhængige af en afstands gentagelse for at styrke viden under praktiske rotationer, 9, som også kan anvendes til AI -uddannelse.
Professionalisme er vigtigere end læsefærdighed. Dybden af ​​materialet er designet uden matematisk strenghed, hvilket var et problem, når man lancerede kliniske kurser i kunstig intelligens. I programmeringseksemplerne bruger vi et skabelonprogram, der giver deltagerne mulighed for at udfylde felter og køre softwaren uden at skulle finde ud af, hvordan man opretter et komplet programmeringsmiljø.
Bekymringer for kunstig intelligens adresseret: Der er en bred bekymring for, at kunstig intelligens kan erstatte nogle kliniske opgaver3. For at tackle dette problem forklarer vi begrænsningerne i AI, herunder det faktum, at næsten alle AI -teknologier, der er godkendt af tilsynsmyndigheder, kræver lægeovervågning11. Vi understreger også betydningen af ​​bias, fordi algoritmer er tilbøjelige til bias, især hvis datasættet ikke er forskelligartet12. Derfor kan en bestemt undergruppe modelleres forkert, hvilket fører til urimelige kliniske beslutninger.
Ressourcer er offentligt tilgængelige: Vi har oprettet offentligt tilgængelige ressourcer, herunder forelæsningsglas og kode. Selvom adgangen til synkront indhold er begrænset på grund af tidszoner, er open source -indhold en praktisk metode til asynkron læring, da AI -ekspertise ikke er tilgængelig på alle medicinske skoler.
Tværfagligt samarbejde: Dette værksted er et joint venture, der er indledt af medicinstuderende for at planlægge kurser sammen med ingeniører. Dette demonstrerer samarbejdsmuligheder og videnhuller i begge områder, hvilket giver deltagerne mulighed for at forstå den potentielle rolle, de kan bidrage i fremtiden.
Definer AI -kernekompetencer. Definition af en liste over kompetencer giver en standardiseret struktur, der kan integreres i eksisterende kompetencebaserede medicinske læseplaner. Denne workshop bruger i øjeblikket læringsmål 2 (forståelse), 3 (applikation) og 4 (analyse) af Blooms taksonomi. At have ressourcer på højere klassificeringsniveauer, såsom at skabe projekter, kan yderligere styrke viden. Dette kræver at arbejde med kliniske eksperter for at bestemme, hvordan AI -emner kan anvendes på kliniske arbejdsgange og forhindrer undervisning i gentagne emner, der allerede er inkluderet i standard medicinske læseplaner.
Opret casestudier ved hjælp af AI. I lighed med kliniske eksempler kan case-baserede læring forstærke abstrakte koncepter ved at fremhæve deres relevans for kliniske spørgsmål. For eksempel analyserede en workshop-undersøgelse Googles AI-baserede diabetiske retinopati-detektionssystem 13 for at identificere udfordringer langs stien fra laboratorium til klinik, såsom eksterne valideringskrav og lovgivningsmæssige godkendelsesveje.
Brug erfaringsmæssig læring: Tekniske færdigheder kræver fokuseret praksis og gentagen anvendelse til mestring, svarende til de roterende læringsoplevelser fra kliniske praktikanter. En potentiel løsning er den flippede klassemodel, der er rapporteret at forbedre videnopbevaring i ingeniøruddannelse14. I denne model gennemgår studerende teoretisk materiale uafhængigt, og klassetiden er afsat til at løse problemer gennem casestudier.
Skalering for tværfaglige deltagere: Vi ser for os vedtagelse af AI, der involverer samarbejde på tværs af flere discipliner, herunder læger og allierede sundhedsfagfolk med forskellige uddannelsesniveauer. Derfor kan læseplaner være nødvendigt at udvikle i samråd med fakultetet fra forskellige afdelinger for at skræddersy deres indhold til forskellige områder af sundhedsvæsenet.
Kunstig intelligens er højteknologisk, og dens kernebegreber er relateret til matematik og datalogi. Uddannelse af sundhedspersonale til at forstå kunstig intelligens giver unikke udfordringer inden for valg af indhold, klinisk relevans og leveringsmetoder. Vi håber, at den indsigt, der er opnået fra AI i uddannelsesworkshops, vil hjælpe fremtidige undervisere med at omfavne innovative måder at integrere AI i medicinsk uddannelse.
Google Colaboratory Python -scriptet er open source og tilgængelig på: https://github.com/ubcaimed/ubcaimed.github.io/tree/master/.
Prober, KG og Khan, S. Rethinking Medical Education: A Call to Action. Akkad. medicin. 88, 1407–1410 (2013).
McCoy, LG osv. Hvad har medicinstuderende virkelig brug for at vide om kunstig intelligens? NPZH -numre. Medicin 3, 1–3 (2020).
Dos Santos, DP, et al. Medicinske studerendes holdninger til kunstig intelligens: en multicenterundersøgelse. Euro. Stråling. 29, 1640–1646 (2019).
Fan, KY, Hu, R. og Singla, R. Introduktion til maskinlæring for medicinstuderende: et pilotprojekt. J. Med. lære. 54, 1042–1043 (2020).
Cooperman N, et al. Identificering af børn med meget lav risiko for klinisk signifikant hjerneskade efter hovedskade: en potentiel kohortundersøgelse. Lancet 374, 1160–1170 (2009).
Street, WN, Wolberg, WH og Mangasarian, OL. Ekstraktion af nuklear funktion til brysttumordiagnose. Biomedicinsk videnskab. Billedbehandling. Biomedicinsk videnskab. Weiss. 1905, 861–870 (1993).
Chen, PHC, Liu, Y. og Peng, L. Sådan udvikler man maskinlæringsmodeller til sundhedsydelser. Nat. Matt. 18, 410–414 (2019).
Selvaraju, RR et al. Grad-Cam: Visuel fortolkning af dybe netværk via gradientbaseret lokalisering. Forløb af IEEE International Conference on Computer Vision, 618–626 (2017).
Kumaravel B, Stewart K og Ilic D. Udvikling og evaluering af en spiralmodel til vurdering af evidensbaserede medicinskompetencer ved hjælp af OSCE i undergraduate medicinsk uddannelse. BMK Medicine. lære. 21, 1–9 (2021).
Kolachalama VB og Garg PS Machine Learning and Medical Education. NPZH -numre. medicin. 1, 1–3 (2018).
Van Leeuwen, KG, Schalekamp, ​​S., Rutten, MJ, Van Ginneken, B. og De Rooy, M. Kunstig intelligens i radiologi: 100 kommercielle produkter og deres videnskabelige beviser. Euro. Stråling. 31, 3797–3804 (2021).
Topol, EJ High-Performance Medicine: Konvergensen af ​​menneskelig og kunstig intelligens. Nat. medicin. 25, 44–56 (2019).
Bede, E. et al. Human-centreret evaluering af et dybt læringssystem, der er implementeret i klinikken til påvisning af diabetisk retinopati. Forløb af Chi -konferencen i 2020 om menneskelige faktorer i computersystemer (2020).
Kerr, B. Det flippede klasseværelse i ingeniøruddannelse: en forskningsanmeldelse. Forløb af 2015 International Conference on Interactive Collaborative Learning (2015).
Forfatterne takker Danielle Walker, Tim Salcudin og Peter Zandstra fra Biomedical Imaging and Artificial Intelligence Research Cluster på University of British Columbia for Support and Finansiing.
RH, PP, ZH, RS og MA var ansvarlige for at udvikle workshop -undervisningsindholdet. RH og PP var ansvarlige for at udvikle de programmeringseksempler. KYF, OY, MT og PW var ansvarlige for den logistiske organisering af projektet og analysen af ​​workshops. RH, OY, MT, RS var ansvarlige for at oprette figurer og tabeller. RH, KYF, PP, ZH, OY, MY, PW, TL, MA, RS var ansvarlig for at udarbejde og redigere dokumentet.
Kommunikationsmedicin takker Carolyn McGregor, Fabio Moraes og Aditya Borakati for deres bidrag til gennemgangen af ​​dette arbejde.


Posttid: Feb-19-2024