• vi

Validering af en datamining-model mod traditionelle metoder til aldersvurdering blandt koreanske teenagere og unge voksne

Tak fordi du besøger Nature.com.Den version af browseren, du bruger, har begrænset CSS-understøttelse.For de bedste resultater anbefaler vi at bruge en nyere version af din browser (eller at slå kompatibilitetstilstand fra i Internet Explorer).I mellemtiden, for at sikre løbende support, viser vi siden uden styling eller JavaScript.
Tænder betragtes som den mest nøjagtige indikator for den menneskelige krops alder og bruges ofte til retsmedicinsk aldersvurdering.Vi havde til formål at validere datamining-baserede dental aldersvurderinger ved at sammenligne estimeringsnøjagtigheden og klassificeringsydelsen for 18-års tærsklen med traditionelle metoder og datamining-baserede aldersestimater.I alt 2657 panoramarøntgenbilleder blev indsamlet fra koreanske og japanske borgere i alderen 15 til 23 år.De blev opdelt i et træningssæt, der hver indeholdt 900 koreanske røntgenbilleder, og et internt testsæt indeholdende 857 japanske røntgenbilleder.Vi sammenlignede klassificeringsnøjagtigheden og effektiviteten af ​​traditionelle metoder med testsæt af data mining-modeller.Nøjagtigheden af ​​den traditionelle metode på det interne testsæt er lidt højere end data mining-modellens nøjagtighed, og forskellen er lille (gennemsnitlig absolut fejl <0,21 år, middelværdi af kvadratfejl <0,24 år).Klassificeringsydelsen for 18-års cutoff er også ens mellem traditionelle metoder og datamining-modeller.Traditionelle metoder kan således erstattes af datamining-modeller, når der udføres retsmedicinsk aldersvurdering ved hjælp af modenheden af ​​anden og tredje kindtand hos koreanske teenagere og unge voksne.
Dental aldersvurdering er meget brugt i retsmedicin og pædiatrisk tandpleje.Især på grund af den høje korrelation mellem kronologisk alder og tandudvikling er aldersvurdering efter tandudviklingsstadier et vigtigt kriterium for vurdering af børns og unges alder1,2,3.Men for unge mennesker har estimering af dental alder baseret på dental modenhed sine begrænsninger, fordi tandvæksten er næsten fuldstændig, med undtagelse af de tredje kindtænder.Det juridiske formål med aldersbestemmelsen for unge og unge er at give nøjagtige skøn og videnskabelig dokumentation for, om de er nået myndig.I den medicinsk-juridiske praksis for teenagere og unge voksne i Korea blev alder estimeret ved hjælp af Lees metode, og en juridisk tærskel på 18 år blev forudsagt baseret på data rapporteret af Oh et al 5 .
Machine learning er en type kunstig intelligens (AI), der gentagne gange lærer og klassificerer store mængder data, løser problemer på egen hånd og driver dataprogrammering.Maskinlæring kan opdage nyttige skjulte mønstre i store mængder data6.I modsætning hertil kan klassiske metoder, som er arbejdskrævende og tidskrævende, have begrænsninger, når de håndterer store mængder komplekse data, som er svære at behandle manuelt7.Derfor er der for nylig blevet udført mange undersøgelser ved hjælp af de nyeste computerteknologier for at minimere menneskelige fejl og effektivt behandle multidimensionelle data8,9,10,11,12.Især dyb læring er blevet brugt i vid udstrækning i medicinsk billedanalyse, og forskellige metoder til aldersvurdering ved automatisk at analysere røntgenbilleder er blevet rapporteret for at forbedre nøjagtigheden og effektiviteten af ​​aldersvurdering13,14,15,16,17,18,19,20 .For eksempel udviklede Halabi et al. 13 en maskinlæringsalgoritme baseret på konvolutionelle neurale netværk (CNN) til at estimere skeletalder ved hjælp af røntgenbilleder af børns hænder.Denne undersøgelse foreslår en model, der anvender maskinlæring på medicinske billeder og viser, at disse metoder kan forbedre diagnostisk nøjagtighed.Li et al14 estimerede alder fra bækken røntgenbilleder ved hjælp af en deep learning CNN og sammenlignede dem med regressionsresultater ved brug af ossifikationsstadie-estimering.De fandt ud af, at deep learning CNN-modellen viste den samme aldersvurderingspræstation som den traditionelle regressionsmodel.Guo et al.'s undersøgelse [15] evaluerede CNN-teknologiens alderstoleranceklassificeringsydelse baseret på dentale ortofotos, og resultaterne af CNN-modellen viste, at mennesker udkonkurrerede sin aldersklassificeringsydelse.
De fleste undersøgelser om aldersvurdering ved hjælp af maskinlæring bruger dyb læringsmetoder13,14,15,16,17,18,19,20.Aldersestimering baseret på dyb læring rapporteres at være mere nøjagtig end traditionelle metoder.Denne tilgang giver dog ringe mulighed for at præsentere det videnskabelige grundlag for aldersestimater, såsom aldersindikatorerne brugt i estimaterne.Der er også en juridisk strid om, hvem der udfører inspektionerne.Derfor er aldersvurdering baseret på dyb læring vanskelig at acceptere af administrative og retslige myndigheder.Data mining (DM) er en teknik, der kan opdage ikke kun forventet, men også uventet information som en metode til at opdage nyttige sammenhænge mellem store mængder data6,21,22.Machine learning bruges ofte i data mining, og både data mining og machine learning bruger de samme nøglealgoritmer til at opdage mønstre i data.Aldersestimering ved hjælp af tandudvikling er baseret på undersøgerens vurdering af måltændernes modenhed, og denne vurdering er udtrykt som et stadie for hver måltand.DM kan bruges til at analysere sammenhængen mellem tandvurderingsstadiet og faktisk alder og har potentiale til at erstatte traditionel statistisk analyse.Derfor, hvis vi anvender DM-teknikker til aldersvurdering, kan vi implementere maskinlæring i retsmedicinsk aldersestimering uden at bekymre os om juridisk ansvar.Der er publiceret adskillige sammenlignende undersøgelser af mulige alternativer til traditionelle manuelle metoder, der anvendes i retsmedicinsk praksis og EBM-baserede metoder til bestemmelse af dental alder.Shen et al23 viste, at DM-modellen er mere præcis end den traditionelle Camerer-formel.Galibourg et al24 anvendte forskellige DM-metoder til at forudsige alder i henhold til Demirdjian-kriteriet25, og resultaterne viste, at DM-metoden udkonkurrerede Demirdjian- og Willems-metoderne ved at estimere den franske befolknings alder.
For at vurdere tandalderen for koreanske teenagere og unge voksne, er Lees metode 4 meget brugt i koreansk retsmedicinsk praksis.Denne metode bruger traditionel statistisk analyse (såsom multipel regression) til at undersøge forholdet mellem koreanske emner og kronologisk alder.I denne undersøgelse er aldersvurderingsmetoder opnået ved hjælp af traditionelle statistiske metoder defineret som "traditionelle metoder."Lees metode er en traditionel metode, og dens nøjagtighed er blevet bekræftet af Oh et al.5;dog er anvendeligheden af ​​aldersvurdering baseret på DM-modellen i koreansk retsmedicinsk praksis stadig tvivlsom.Vores mål var at videnskabeligt validere den potentielle nytte af aldersvurdering baseret på DM-modellen.Formålet med denne undersøgelse var (1) at sammenligne nøjagtigheden af ​​to DM-modeller i estimering af dental alder og (2) at sammenligne klassificeringsydelsen af ​​7 DM-modeller i en alder af 18 år med dem opnået ved brug af traditionelle statistiske metoder. og tredje kindtænder i begge kæber.
Middelværdier og standardafvigelser for kronologisk alder efter stadie og tandtype er vist online i Supplerende tabel S1 (træningssæt), Supplerende tabel S2 (internt testsæt) og Supplerende tabel S3 (eksternt testsæt).Kappa-værdierne for intra- og interobservatør-pålidelighed opnået fra træningssættet var henholdsvis 0,951 og 0,947.P-værdier og 95 % konfidensintervaller for kappa-værdier er vist i online supplerende tabel S4.Kappa-værdien blev fortolket som "næsten perfekt", i overensstemmelse med kriterierne fra Landis og Koch26.
Når man sammenligner middel absolut fejl (MAE), overgår den traditionelle metode en smule DM-modellen for alle køn og i det eksterne mandlige testsæt, med undtagelse af multilayer perceptron (MLP).Forskellen mellem den traditionelle model og DM-modellen på det interne MAE-testsæt var 0,12-0,19 år for mænd og 0,17-0,21 år for kvinder.For det eksterne testbatteri er forskellene mindre (0,001-0,05 år for mænd og 0,05-0,09 år for kvinder).Derudover er root mean square error (RMSE) lidt lavere end den traditionelle metode, med mindre forskelle (0,17-0,24, 0,2-0,24 for det mandlige interne testsæt og 0,03-0,07, 0,04-0,08 for eksternt testsæt).).MLP viser lidt bedre ydeevne end Single Layer Perceptron (SLP), undtagen i tilfældet med det kvindelige eksterne testsæt.For MAE og RMSE scorer det eksterne testsæt højere end det interne testsæt for alle køn og modeller.Alle MAE og RMSE er vist i tabel 1 og figur 1.
MAE og RMSE af traditionelle og datamining-regressionsmodeller.Gennemsnitlig absolut fejl MAE, root mean square error RMSE, enkeltlagsperceptron SLP, flerlagsperceptron MLP, traditionel CM-metode.
Klassificeringsydelse (med en cut-off på 18 år) af de traditionelle modeller og DM-modeller blev demonstreret i form af sensitivitet, specificitet, positiv prædiktiv værdi (PPV), negativ prædiktiv værdi (NPV) og areal under modtagerens driftskarakteristikkurve (AUROC) 27 (Tabel 2, Figur 2 og Supplerende Figur 1 online).Hvad angår det interne testbatteris følsomhed, klarede traditionelle metoder sig bedst blandt mænd og dårligere blandt kvinder.Forskellen i klassificeringsydelse mellem traditionelle metoder og SD er dog 9,7 % for mænd (MLP) og kun 2,4 % for kvinder (XGBoost).Blandt DM-modeller viste logistisk regression (LR) bedre følsomhed hos begge køn.Med hensyn til specificiteten af ​​det interne testsæt blev det observeret, at de fire SD-modeller klarede sig godt hos mænd, mens den traditionelle model klarede sig bedre hos kvinder.Forskellene i klassificeringsydelse for mænd og kvinder er henholdsvis 13,3 % (MLP) og 13,1 % (MLP), hvilket indikerer, at forskellen i klassificeringsydelse mellem modeller overstiger følsomheden.Blandt DM-modellerne klarede støttevektormaskinen (SVM), beslutningstræet (DT) og random forest (RF) modellerne bedst blandt mænd, mens LR-modellen klarede sig bedst blandt kvinder.AUROC for den traditionelle model og alle SD-modeller var større end 0,925 (k-nærmeste nabo (KNN) hos mænd), hvilket viser fremragende klassificeringspræstation ved at skelne 18-årige prøver28.For det eksterne testsæt var der et fald i klassificeringsydelsen med hensyn til sensitivitet, specificitet og AUROC sammenlignet med det interne testsæt.Desuden varierede forskellen i sensitivitet og specificitet mellem klassificeringsydelsen af ​​de bedste og værste modeller fra 10 % til 25 % og var større end forskellen i det interne testsæt.
Sensitivitet og specificitet af data mining klassifikationsmodeller sammenlignet med traditionelle metoder med en cut-off på 18 år.KNN k nærmeste nabo, SVM support vektor maskine, LR logistisk regression, DT beslutningstræ, RF random forest, XGB XGBoost, MLP flerlagsperceptron, traditionel CM metode.
Det første trin i denne undersøgelse var at sammenligne nøjagtigheden af ​​dental aldersestimater opnået fra syv DM-modeller med dem opnået ved hjælp af traditionel regression.MAE og RMSE blev evalueret i interne testsæt for begge køn, og forskellen mellem den traditionelle metode og DM-modellen varierede fra 44 til 77 dage for MAE og fra 62 til 88 dage for RMSE.Selvom den traditionelle metode var lidt mere præcis i denne undersøgelse, er det svært at konkludere, om en så lille forskel har klinisk eller praktisk betydning.Disse resultater indikerer, at nøjagtigheden af ​​dental aldersvurdering ved hjælp af DM-modellen er næsten den samme som den traditionelle metode.Direkte sammenligning med resultater fra tidligere undersøgelser er vanskelig, fordi ingen undersøgelse har sammenlignet nøjagtigheden af ​​DM-modeller med traditionelle statistiske metoder, der anvender samme teknik til registrering af tænder i samme aldersgruppe som i denne undersøgelse.Galibourg et al24 sammenlignede MAE og RMSE mellem to traditionelle metoder (Demirjian-metode25 og Willems-metode29) og 10 DM-modeller i en fransk befolkning i alderen 2 til 24 år.De rapporterede, at alle DM-modeller var mere nøjagtige end traditionelle metoder, med forskelle på henholdsvis 0,20 og 0,38 år i MAE og 0,25 og 0,47 år i RMSE sammenlignet med Willems- og Demirdjian-metoderne.Uoverensstemmelsen mellem SD-modellen og traditionelle metoder vist i Halibourg-undersøgelsen tager højde for adskillige rapporter30,31,32,33 om, at Demirdjian-metoden ikke nøjagtigt estimerer dental alder i andre populationer end de franske canadiere, som undersøgelsen var baseret på.i dette studie.Tai et al 34 brugte MLP-algoritmen til at forudsige tandalderen fra 1636 kinesiske ortodontiske fotografier og sammenlignede dens nøjagtighed med resultaterne af Demirjian og Willems-metoden.De rapporterede, at MLP har højere nøjagtighed end traditionelle metoder.Forskellen mellem Demirdjian-metoden og den traditionelle metode er <0,32 år, og Willems-metoden er 0,28 år, hvilket svarer til resultaterne af nærværende undersøgelse.Resultaterne af disse tidligere undersøgelser24,34 stemmer også overens med resultaterne af nærværende undersøgelse, og aldersvurderingsnøjagtigheden af ​​DM-modellen og den traditionelle metode er ens.Men baseret på de præsenterede resultater kan vi kun forsigtigt konkludere, at brugen af ​​DM-modeller til at estimere alder kan erstatte eksisterende metoder på grund af manglen på sammenlignende og reference tidligere undersøgelser.Opfølgningsundersøgelser med større prøver er nødvendige for at bekræfte resultaterne opnået i denne undersøgelse.
Blandt de undersøgelser, der testede nøjagtigheden af ​​SD i estimering af dental alder, viste nogle højere nøjagtighed end vores undersøgelse.Stepanovsky et al 35 anvendte 22 SD-modeller til panorama-røntgenbilleder af 976 tjekkiske indbyggere i alderen 2,7 til 20,5 år og testede nøjagtigheden af ​​hver model.De vurderede udviklingen af ​​i alt 16 øvre og nedre venstre permanente tænder ved hjælp af klassificeringskriterierne foreslået af Moorrees et al 36 .MAE spænder fra 0,64 til 0,94 år og RMSE spænder fra 0,85 til 1,27 år, hvilket er mere nøjagtigt end de to DM-modeller, der er brugt i denne undersøgelse.Shen et al23 brugte Cameriere-metoden til at estimere tandalderen for syv permanente tænder i venstre mandible hos østkinesiske beboere i alderen 5 til 13 år og sammenlignede den med alder beregnet ved brug af lineær regression, SVM og RF.De viste, at alle tre DM-modeller har højere nøjagtighed sammenlignet med den traditionelle Cameriere-formel.MAE og RMSE i Shens undersøgelse var lavere end dem i DM-modellen i denne undersøgelse.Den øgede præcision af undersøgelserne af Stepanovsky et al.35 og Shen et al.23 kan skyldes, at yngre forsøgspersoner er inkluderet i deres undersøgelsesprøver.Fordi aldersestimater for deltagere med udviklende tænder bliver mere nøjagtige, efterhånden som antallet af tænder stiger under tandudvikling, kan nøjagtigheden af ​​den resulterende aldersvurderingsmetode blive kompromitteret, når undersøgelsens deltagere er yngre.Derudover er MLP's fejl i aldersvurdering lidt mindre end SLP's, hvilket betyder, at MLP er mere nøjagtig end SLP.MLP anses for lidt bedre til aldersvurdering, muligvis på grund af de skjulte lag i MLP38.Der er dog en undtagelse for den ydre prøve af kvinder (SLP 1,45, MLP 1,49).Konstateringen af, at MLP er mere nøjagtig end SLP ved vurdering af alder, kræver yderligere retrospektive undersøgelser.
Klassifikationspræstationen for DM-modellen og den traditionelle metode ved en tærskel på 18 år blev også sammenlignet.Alle testede SD-modeller og traditionelle metoder på det interne testsæt viste praktisk taget acceptable niveauer af diskrimination for den 18-årige prøve.Sensitiviteten for mænd og kvinder var henholdsvis større end 87,7 % og 94,9 %, og specificiteten var større end 89,3 % og 84,7 %.AUROC for alle testede modeller overstiger også 0,925.Så vidt vi ved, har ingen undersøgelse testet ydeevnen af ​​DM-modellen for 18-års klassificering baseret på dental modenhed.Vi kan sammenligne resultaterne af denne undersøgelse med deep learning-modellers klassifikationspræstation på panorama-røntgenbilleder.Guo et al.15 beregnede klassifikationsydelsen af ​​en CNN-baseret deep learning-model og en manuel metode baseret på Demirjians metode for en bestemt alderstærskel.Sensitiviteten og specificiteten af ​​den manuelle metode var henholdsvis 87,7 % og 95,5 %, og sensitiviteten og specificiteten af ​​CNN-modellen oversteg henholdsvis 89,2 % og 86,6 %.De konkluderede, at deep learning-modeller kan erstatte eller overgå manuel vurdering ved klassificering af alderstærskler.Resultaterne af denne undersøgelse viste lignende klassificeringsydelse;Det menes, at klassificering ved hjælp af DM-modeller kan erstatte traditionelle statistiske metoder til aldersvurdering.Blandt modellerne var DM LR den bedste model med hensyn til sensitivitet for den mandlige prøve og sensitivitet og specificitet for den kvindelige prøve.LR er nummer to i specificitet for mænd.Desuden anses LR for at være en af ​​de mere brugervenlige DM35-modeller og er mindre kompleks og svær at behandle.Baseret på disse resultater blev LR betragtet som den bedste cutoff-klassifikationsmodel for 18-årige i den koreanske befolkning.
Samlet set var nøjagtigheden af ​​aldersvurdering eller klassificeringsydelse på det eksterne testsæt ringe eller lavere sammenlignet med resultaterne på det interne testsæt.Nogle rapporter indikerer, at klassificeringsnøjagtigheden eller effektiviteten falder, når aldersestimater baseret på den koreanske befolkning anvendes på den japanske befolkning5,39, og et lignende mønster blev fundet i denne undersøgelse.Denne forringelsestendens blev også observeret i DM-modellen.For at estimere alder nøjagtigt, selv når der anvendes DM i analyseprocessen, bør metoder afledt af indfødte befolkningsdata, såsom traditionelle metoder, derfor foretrækkes5,39,40,41,42.Da det er uklart, om deep learning-modeller kan vise lignende tendenser, er undersøgelser, der sammenligner klassifikationsnøjagtighed og effektivitet ved hjælp af traditionelle metoder, DM-modeller og deep learning-modeller på de samme prøver, nødvendige for at bekræfte, om kunstig intelligens kan overvinde disse racemæssige forskelle i begrænset alder.vurderinger.
Vi demonstrerer, at traditionelle metoder kan erstattes af aldersvurdering baseret på DM-modellen i retsmedicinsk aldersvurderingspraksis i Korea.Vi opdagede også muligheden for at implementere maskinlæring til retsmedicinsk aldersvurdering.Der er dog klare begrænsninger, såsom det utilstrækkelige antal deltagere i denne undersøgelse til definitivt at bestemme resultaterne, og manglen på tidligere undersøgelser til at sammenligne og bekræfte resultaterne af denne undersøgelse.I fremtiden bør DM-undersøgelser udføres med et større antal prøver og mere forskelligartede populationer for at forbedre dets praktiske anvendelighed sammenlignet med traditionelle metoder.For at validere gennemførligheden af ​​at bruge kunstig intelligens til at estimere alder i flere populationer, er fremtidige undersøgelser nødvendige for at sammenligne klassificeringsnøjagtigheden og effektiviteten af ​​DM- og deep learning-modeller med traditionelle metoder i de samme prøver.
Undersøgelsen brugte 2.657 ortografiske fotografier indsamlet fra koreanske og japanske voksne i alderen 15 til 23 år.De koreanske røntgenbilleder blev opdelt i 900 træningssæt (19,42 ± 2,65 år) og 900 interne testsæt (19,52 ± 2,59 år).Træningssættet blev indsamlet på én institution (Seoul St. Mary's Hospital), og det eget testsæt blev indsamlet på to institutioner (Seoul National University Dental Hospital og Yonsei University Dental Hospital).Vi indsamlede også 857 røntgenbilleder fra andre populationsbaserede data (Iwate Medical University, Japan) til ekstern testning.Røntgenbilleder af japanske forsøgspersoner (19,31 ± 2,60 år) blev udvalgt som det eksterne testsæt.Data blev indsamlet retrospektivt for at analysere stadierne af dental udvikling på panorama røntgenbilleder taget under tandbehandling.Alle indsamlede data var anonyme undtagen køn, fødselsdato og røntgenbillede.Inklusions- og eksklusionskriterier var de samme som tidligere publicerede undersøgelser 4 , 5 .Prøvens faktiske alder blev beregnet ved at trække fødselsdatoen fra den dato, hvor røntgenbilledet blev taget.Prøvegruppen blev opdelt i ni aldersgrupper.Alders- og kønsfordelingen er vist i tabel 3. Denne undersøgelse blev udført i overensstemmelse med Helsinki-erklæringen og godkendt af Institutional Review Board (IRB) på Seoul St. Mary's Hospital på det katolske universitet i Korea (KC22WISI0328).På grund af det retrospektive design af denne undersøgelse kunne informeret samtykke ikke opnås fra alle patienter, der skulle gennemgå røntgenundersøgelse til terapeutiske formål.Seoul Korea University St. Mary's Hospital (IRB) frafaldt kravet om informeret samtykke.
Udviklingsstadier af bimaxillær anden og tredje molar blev vurderet i henhold til Demircan-kriterier25.Kun én tand blev valgt, hvis den samme type tand blev fundet på venstre og højre side af hver kæbe.Hvis homologe tænder på begge sider var på forskellige udviklingsstadier, blev tanden med det nederste udviklingstrin udvalgt for at tage højde for usikkerhed i den estimerede alder.Et hundrede tilfældigt udvalgte røntgenbilleder fra træningssættet blev bedømt af to erfarne observatører for at teste interobservatør-pålidelighed efter prækalibrering for at bestemme dental modenhed.Intraobservatørens pålidelighed blev vurderet to gange med tre måneders intervaller af den primære observatør.
Køn og udviklingsstadium af den anden og tredje kindtand i hver kæbe i træningssættet blev estimeret af en primær observatør trænet med forskellige DM-modeller, og den faktiske alder blev sat som målværdien.SLP- og MLP-modeller, som er meget brugt i maskinlæring, blev testet mod regressionsalgoritmer.DM-modellen kombinerer lineære funktioner ved hjælp af de fire tænders udviklingsstadier og kombinerer disse data for at estimere alder.SLP er det enkleste neurale netværk og indeholder ikke skjulte lag.SLP fungerer baseret på tærskeltransmission mellem noder.SLP-modellen i regression ligner matematisk multipel lineær regression.I modsætning til SLP-modellen har MLP-modellen flere skjulte lag med ikke-lineære aktiveringsfunktioner.Vores eksperimenter brugte et skjult lag med kun 20 skjulte noder med ikke-lineære aktiveringsfunktioner.Brug gradient descent som optimeringsmetode og MAE og RMSE som tabsfunktion til at træne vores maskinlæringsmodel.Den bedst opnåede regressionsmodel blev anvendt på de interne og eksterne testsæt, og tændernes alder blev estimeret.
Der blev udviklet en klassifikationsalgoritme, der bruger modenheden af ​​fire tænder på træningssættet til at forudsige, om en prøve er 18 år gammel eller ej.For at bygge modellen udledte vi syv repræsentationsmaskinelæringsalgoritmer6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBoost og (7) MLP .LR er en af ​​de mest udbredte klassifikationsalgoritmer44.Det er en overvåget læringsalgoritme, der bruger regression til at forudsige sandsynligheden for, at data tilhører en bestemt kategori fra 0 til 1 og klassificerer dataene som tilhørende en mere sandsynlig kategori baseret på denne sandsynlighed;bruges hovedsageligt til binær klassificering.KNN er en af ​​de enkleste maskinlæringsalgoritmer45.Når den får nye inputdata, finder den k data tæt på det eksisterende sæt og klassificerer dem derefter i klassen med den højeste frekvens.Vi sætter 3 for antallet af betragtede naboer (k).SVM er en algoritme, der maksimerer afstanden mellem to klasser ved at bruge en kernefunktion til at udvide det lineære rum til et ikke-lineært rum kaldet fields46.Til denne model bruger vi bias = 1, potens = 1 og gamma = 1 som hyperparametre for polynomiumkernen.DT er blevet anvendt i forskellige felter som en algoritme til at opdele et helt datasæt i flere undergrupper ved at repræsentere beslutningsregler i en træstruktur47.Modellen er konfigureret med et minimum antal poster pr. node på 2 og bruger Gini-indekset som et mål for kvalitet.RF er en ensemblemetode, der kombinerer flere DT'er for at forbedre ydeevnen ved hjælp af en bootstrap-aggregeringsmetode, der genererer en svag klassifikator for hver prøve ved tilfældigt at trække prøver af samme størrelse flere gange fra det originale datasæt48.Vi brugte 100 træer, 10 trædybder, 1 mindste nodestørrelse og Gini-blandingsindeks som nodeseparationskriterier.Klassificeringen af ​​nye data bestemmes ved flertalsafstemning.XGBoost er en algoritme, der kombinerer boostingsteknikker ved hjælp af en metode, der tager fejlen mellem de faktiske og forudsagte værdier af den tidligere model som træningsdata og øger fejlen ved hjælp af gradienter49.Det er en meget brugt algoritme på grund af dens gode ydeevne og ressourceeffektivitet, samt høje pålidelighed som en overfitting-korrektionsfunktion.Modellen er udstyret med 400 støttehjul.MLP er et neuralt netværk, hvor en eller flere perceptroner danner flere lag med et eller flere skjulte lag mellem input- og outputlagene38.Ved at bruge dette kan du udføre ikke-lineær klassificering, hvor når du tilføjer et inputlag og får en resultatværdi, sammenlignes den forudsagte resultatværdi med den faktiske resultatværdi, og fejlen spredes tilbage.Vi lavede et skjult lag med 20 skjulte neuroner i hvert lag.Hver model, vi udviklede, blev anvendt på interne og eksterne sæt for at teste klassifikationsydelse ved at beregne sensitivitet, specificitet, PPV, NPV og AUROC.Sensitivitet er defineret som forholdet mellem en prøve, der er estimeret til at være 18 år eller ældre, og en prøve, der estimeres til at være 18 år eller ældre.Specificitet er andelen af ​​prøver under 18 år og dem, der skønnes at være under 18 år.
De tandstadier, der blev vurderet i træningssættet, blev konverteret til numeriske stadier til statistisk analyse.Multivariat lineær og logistisk regression blev udført for at udvikle prædiktive modeller for hvert køn og udlede regressionsformler, der kan bruges til at estimere alder.Vi brugte disse formler til at estimere tandalderen for både interne og eksterne testsæt.Tabel 4 viser de regressions- og klassifikationsmodeller, der er brugt i denne undersøgelse.
Intra- og interobservatør-reliabilitet blev beregnet ved hjælp af Cohens kappa-statistik.For at teste nøjagtigheden af ​​DM og traditionelle regressionsmodeller beregnede vi MAE og RMSE ved hjælp af de estimerede og faktiske alder af de interne og eksterne testsæt.Disse fejl bruges almindeligvis til at evaluere nøjagtigheden af ​​modelforudsigelser.Jo mindre fejlen er, jo højere er nøjagtigheden af ​​prognosen24.Sammenlign MAE og RMSE for interne og eksterne testsæt beregnet ved hjælp af DM og traditionel regression.Klassificeringspræstation for 18-års cutoff i traditionel statistik blev vurderet ved hjælp af en 2 × 2 kontingentabel.Den beregnede sensitivitet, specificitet, PPV, NPV og AUROC af testsættet blev sammenlignet med de målte værdier af DM-klassificeringsmodellen.Data er udtrykt som middel ± standardafvigelse eller antal (%) afhængigt af datakarakteristika.Tosidede P-værdier <0,05 blev betragtet som statistisk signifikante.Alle rutinemæssige statistiske analyser blev udført ved hjælp af SAS version 9.4 (SAS Institute, Cary, NC).DM-regressionsmodellen blev implementeret i Python ved hjælp af Keras50 2.2.4 backend og Tensorflow51 1.8.0 specifikt til matematiske operationer.DM-klassifikationsmodellen blev implementeret i Waikato Knowledge Analysis Environment og Konstanz Information Miner (KNIME) 4.6.152 analyseplatform.
Forfatterne anerkender, at data, der understøtter undersøgelsens konklusioner, kan findes i artiklen og supplerende materialer.De datasæt, der genereres og/eller analyseres under undersøgelsen, er tilgængelige fra den tilsvarende forfatter på rimelig anmodning.
Ritz-Timme, S. et al.Aldersvurdering: state of the art for at opfylde de specifikke krav til retsmedicinsk praksis.internationalitet.J. Retsmedicin.113, 129-136 (2000).
Schmeling, A., Reisinger, W., Geserik, G., og Olze, A. Nuværende status for retsmedicinsk aldersvurdering af levende subjekter til straffeforfølgelsesformål.Forensics.medicin.Patologi.1, 239-246 (2005).
Pan, J. et al.En modificeret metode til vurdering af tandalderen for børn i alderen 5 til 16 år i det østlige Kina.klinisk.Mundtlig undersøgelse.25, 3463-3474 (2021).
Lee, SS osv. Kronologi af udviklingen af ​​anden og tredje kindtand hos koreanere og dens anvendelse til retsmedicinsk aldersvurdering.internationalitet.J. Retsmedicin.124, 659-665 (2010).
Oh, S., Kumagai, A., Kim, SY og Lee, SS Nøjagtighed af aldersvurdering og estimering af 18-års tærsklen baseret på modenheden af ​​anden og tredje kindtand hos koreanere og japansk.PLoS ONE 17, e0271247 (2022).
Kim, JY, et al.Præoperativ maskinlæringsbaseret dataanalyse kan forudsige behandlingsresultatet for søvnkirurgi hos patienter med OSA.videnskaben.Rapport 11, 14911 (2021).
Han, M. et al.Nøjagtig aldersvurdering fra maskinlæring med eller uden menneskelig indgriben?internationalitet.J. Retsmedicin.136, 821-831 (2022).
Khan, S. og Shaheen, M. Fra Data Mining til Data Mining.J.Information.videnskaben.https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. og Shaheen, M. WisRule: Den første kognitive algoritme for foreningsregelminedrift.J.Information.videnskaben.https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. og Abdullah U. Karm: Traditionel datamining baseret på kontekstbaserede foreningsregler.Beregn.Matt.Blive ved.68, 3305-3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. og Habib M. Deep learning baseret semantisk lighedsdetektion ved hjælp af tekstdata.informere.teknologier.styring.https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z., og Shahin, M. Et system til genkendelse af aktivitet i sportsvideoer.multimedie.Værktøjsapplikationer https://doi.org/10.1007/s11042-021-10519-6 (2021).
Halabi, SS et al.RSNA Machine Learning Challenge i pædiatrisk knoglealder.Radiologi 290, 498–503 (2019).
Li, Y. et al.Retsmedicinsk aldersvurdering fra bækkenrøntgen ved hjælp af dyb læring.EURO.stråling.29, 2322-2329 (2019).
Guo, YC, et al.Nøjagtig aldersklassificering ved hjælp af manuelle metoder og dybe foldede neurale netværk fra ortografiske projektionsbilleder.internationalitet.J. Retsmedicin.135, 1589-1597 (2021).
Alabama Dalora et al.Knoglealdersestimering ved hjælp af forskellige maskinlæringsmetoder: en systematisk litteraturgennemgang og meta-analyse.PLoS ONE 14, e0220242 (2019).
Du, H., Li, G., Cheng, K., og Yang, J. Befolkningsspecifik aldersvurdering af afroamerikanere og kinesere baseret på pulpkammervolumener af første kindtænder ved hjælp af keglestrålecomputertomografi.internationalitet.J. Retsmedicin.136, 811-819 (2022).
Kim S., Lee YH, Noh YK, Park FK og Oh KS Bestemmelse af aldersgrupper af levende mennesker ved hjælp af kunstig intelligens-baserede billeder af første kindtænder.videnskaben.Rapport 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N., og Urschler, M. Automatisk aldersestimering og majoritetsaldersklassificering fra multivariate MR-data.IEEE J. Biomed.Sundhedsadvarsler.23, 1392-1403 (2019).
Cheng, Q., Ge, Z., Du, H. og Li, G. Aldersestimering baseret på 3D-pulpakammersegmentering af første kindtænder fra keglestrålecomputertomografi ved at integrere dyb læring og niveausæt.internationalitet.J. Retsmedicin.135, 365-373 (2021).
Wu, WT, et al.Data mining i klinisk big data: almindelige databaser, trin og metodemodeller.Verden.medicin.ressource.8, 44 (2021).
Yang, J. et al.Introduktion til medicinske databaser og datamineteknologier i Big Data-æraen.J. Avid.Grundlæggende medicin.13, 57-69 (2020).
Shen, S. et al.Camerers metode til at estimere tandalderen ved hjælp af maskinlæring.BMC Oral Health 21, 641 (2021).
Galliburg A. et al.Sammenligning af forskellige maskinlæringsmetoder til at forudsige dental alder ved hjælp af Demirdjian iscenesættelsesmetoden.internationalitet.J. Retsmedicin.135, 665-675 (2021).
Demirdjian, A., Goldstein, H. og Tanner, JM Et nyt system til vurdering af dental alder.snøfte.biologi.45, 211-227 (1973).
Landis, JR og Koch, GG Mål for observatøraftale om kategoriske data.Biometrics 33, 159-174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK og Choi HK.Teksturel, morfologisk og statistisk analyse af todimensionel magnetisk resonansbilleddannelse ved brug af kunstig intelligensteknikker til differentiering af primære hjernetumorer.Sundhedsoplysninger.ressource.https://doi.org/10.4258/hir.2022.28.1.46 (2022).


Posttid: Jan-04-2024