Validation of a data mining model against traditional dental age estimation methods among Korean adolescents and young adults

Tak fordi du besøgte Nature.com. Den version af browser, du bruger, har begrænset CSS -support. For de bedste resultater anbefaler vi at bruge en nyere version af din browser (eller slukke for kompatibilitetstilstand i Internet Explorer). I mellemtiden, for at sikre løbende støtte, viser vi stedet uden styling eller JavaScript.
Tænder betragtes som den mest nøjagtige indikator for den menneskelige krops alder og bruges ofte i retsmedicinsk aldersvurdering. Vi havde til formål at validere dataminingbaserede tandlæge-estimater ved at sammenligne estimeringsnøjagtigheden og klassificeringsydelsen for den 18-årige tærskel med traditionelle metoder og data mining-baserede aldersestimater. I alt 2657 panoramiske røntgenbilleder blev indsamlet fra koreanske og japanske borgere i alderen 15 til 23 år. De blev opdelt i et træningssæt, der hver indeholdt 900 koreanske røntgenbilleder og et internt testsæt indeholdende 857 japanske røntgenbilleder. Vi sammenlignede klassificeringsnøjagtigheden og effektiviteten af traditionelle metoder med testsæt af data mining -modeller. Nøjagtigheden af den traditionelle metode på det interne testsæt er lidt højere end for dataminingsmodellen, og forskellen er lille (gennemsnitlig absolut fejl <0,21 år, rod gennemsnit firkantet fejl <0,24 år). Klassificeringsydelsen for den 18-årige cutoff er også ens mellem traditionelle metoder og data mining-modeller. Således kan traditionelle metoder erstattes af data mining -modeller, når man udfører retsmedicinsk aldersvurdering ved hjælp af modenheden af anden og tredje molarer hos koreanske unge og unge voksne.
Tandalderens estimering er vidt brugt i retsmedicinsk medicin og pædiatrisk tandlæge. På grund af den høje sammenhæng mellem kronologisk alder og tandudvikling er aldersvurdering af tandudviklingsstadier især et vigtigt kriterium for vurdering af børn og unge 1,2,3. For unge mennesker har estimering af tandalder baseret på tandmodenhed imidlertid sine begrænsninger, fordi tandvækst er næsten komplet, med undtagelse af de tredje molarer. Det juridiske formål med at bestemme alderen for unge mennesker og unge er at give nøjagtige skøn og videnskabelige beviser for, om de har nået majoritetens alder. I den medico-juridiske praksis hos unge og unge voksne i Korea blev alder estimeret ved anvendelse af Lees metode, og en juridisk tærskel på 18 år blev forudsagt baseret på de data, der blev rapporteret af OH et al 5.
Machine Learning er en type kunstig intelligens (AI), der gentagne gange lærer og klassificerer store mængder data, løser problemer på egen hånd og driver dataprogrammering. Maskinindlæring kan opdage nyttige skjulte mønstre i store mængder data6. I modsætning hertil kan klassiske metoder, der er arbejdskrævende og tidskrævende, have begrænsninger, når man håndterer store mængder komplekse data, der er vanskelige at behandle manuelt7. Derfor er der for nylig blevet udført mange undersøgelser ved hjælp af de nyeste computerteknologier for at minimere menneskelige fejl og effektivt behandle multidimensionelle data8,9,10,11,12. Især er dyb læring blevet vidt brugt i medicinsk billedanalyse, og forskellige metoder til aldersestimering ved automatisk at analysere røntgenbilleder er rapporteret at forbedre nøjagtigheden og effektiviteten af aldersestimering13,14,15,16,17,18,19,20 . F.eks. Udviklede Halabi et al. 13 en maskinlæringsalgoritme baseret på indviklede neurale netværk (CNN) til at estimere skeletalder ved hjælp af røntgenbilleder af børns hænder. Denne undersøgelse foreslår en model, der anvender maskinlæring til medicinske billeder og viser, at disse metoder kan forbedre diagnostisk nøjagtighed. Li et al14 estimeret alder fra bækken-røntgenbilleder ved hjælp af en dyb læring CNN og sammenlignede dem med regressionsresultater ved hjælp af estimering af ossifikationsstadiet. De fandt, at den dybe læring CNN -model viste samme aldersestimering som den traditionelle regressionsmodel. Guo et al .'s undersøgelse [15] evaluerede alderstoleranceklassificeringsydelsen for CNN -teknologi baseret på tandal ortophotos, og resultaterne af CNN -modellen beviste, at mennesker overgik sin aldersklassificeringsydelse.
De fleste undersøgelser af aldersestimering ved hjælp af maskinindlæring Brug dybe læringsmetoder13,14,15,16,17,18,19,20. Aldersestimering baseret på dyb læring rapporteres at være mere nøjagtig end traditionelle metoder. Imidlertid giver denne tilgang kun ringe mulighed for at præsentere det videnskabelige grundlag for aldersestimater, såsom aldersindikatorerne, der bruges i estimaterne. Der er også en juridisk tvist om, hvem der foretager inspektioner. Derfor er aldersestimering baseret på dyb læring vanskelig at acceptere af administrative og retlige myndigheder. Data Mining (DM) er en teknik, der ikke kun kan opdage forventet, men også uventet information som en metode til at opdage nyttige sammenhænge mellem store mængder data6,21,22. Maskinindlæring bruges ofte i datamining, og både datamining og maskinlæring bruger de samme nøglealgoritmer til at opdage mønstre i data. Aldersestimering ved hjælp af tandudvikling er baseret på eksaminatorens vurdering af modenheden af måltænderne, og denne vurdering udtrykkes som et trin for hver måltand. DM kan bruges til at analysere sammenhængen mellem tandvurderingstrin og faktisk alder og har potentialet til at erstatte traditionel statistisk analyse. Derfor, hvis vi anvender DM -teknikker til aldersestimering, kan vi implementere maskinlæring i retsmedicinsk tidsestimering uden at bekymre os om juridisk ansvar. Flere komparative undersøgelser er blevet offentliggjort om mulige alternativer til traditionelle manuelle metoder, der er anvendt i retsmedicinsk praksis og EBM-baserede metoder til bestemmelse af tandalder. Shen et al23 viste, at DM -modellen er mere nøjagtig end den traditionelle Camerer -formel. Galibourg et al24 anvendte forskellige DM -metoder til at forudsige alder i henhold til Demirdjian Criterion25, og resultaterne viste, at DM -metoden overgik Demirdjian- og Willems -metoderne til at estimere alderen for den franske befolkning.
For at estimere den tandlægealder for koreanske unge og unge voksne er Lees metode 4 i vid udstrækning brugt på koreansk retsmedicinsk praksis. Denne metode bruger traditionel statistisk analyse (såsom multiple regression) til at undersøge forholdet mellem koreanske individer og kronologisk alder. I denne undersøgelse defineres aldersestimeringsmetoder opnået ved anvendelse af traditionelle statistiske metoder som "traditionelle metoder." Lees metode er en traditionel metode, og dens nøjagtighed er blevet bekræftet af Oh et al. 5; Imidlertid er anvendeligheden af aldersestimering baseret på DM -modellen på koreansk retsmedicinsk praksis stadig tvivlsom. Vores mål var at videnskabeligt validere den potentielle anvendelighed af aldersestimering baseret på DM -modellen. Formålet med denne undersøgelse var (1) at sammenligne nøjagtigheden af to DM -modeller til estimering af tandalder og (2) at sammenligne klassificeringsydelsen på 7 DM -modeller i en alder af 18 år med dem, der er opnået ved hjælp af traditionelle statistiske metoder og tredje molarer i begge kæber.
Midler og standardafvigelser i kronologisk alder efter trin og tandtype vises online i supplerende tabel S1 (træningssæt), supplerende tabel S2 (internt testsæt) og supplerende tabel S3 (eksternt testsæt). Kappa-værdierne for intra- og interobserver-pålidelighed opnået fra træningssættet var henholdsvis 0,951 og 0,947. P -værdier og 95% konfidensintervaller for kappa -værdier er vist i online supplerende tabel S4. Kappa -værdien blev fortolket som ”næsten perfekt” i overensstemmelse med kriterierne for Landis og Koch26.
Når man sammenligner gennemsnitlig absolut fejl (MAE), overgår den traditionelle metode lidt DM -modellen for alle køn og i det eksterne mandlige testsæt, med undtagelse af flerlags perceptron (MLP). Forskellen mellem den traditionelle model og DM -modellen på det interne MAE -testsæt var 0,12–0,19 år for mænd og 0,17–0,21 år for kvinder. For det eksterne testbatteri er forskellene mindre (0,001–0,05 år for mænd og 0,05–0,09 år for kvinder). Derudover er roden gennemsnitlig firkantfejl (RMSE) lidt lavere end den traditionelle metode med mindre forskelle (0,17–0,24, 0,2–0,24 for det mandlige interne testsæt og 0,03–0,07, 0,04–0,08 for eksternt testsæt). ). MLP viser lidt bedre ydelse end enkeltlag perceptron (SLP), undtagen i tilfælde af det kvindelige eksterne testsæt. For MAE og RMSE scorer de eksterne testsanlæg højere end det interne testsæt for alle køn og modeller. Alle MAE og RMSE er vist i tabel 1 og figur 1.
Mae og RMSE af traditionelle regressionsmodeller og data mining -regressionsmodeller. Gennemsnitlig absolut fejl Mae, rod gennemsnit firkantet fejl RMSE, enkeltlag perceptron SLP, flerlags perceptron MLP, traditionel CM -metode.
Klassificeringsydelse (med en cutoff på 18 år) af de traditionelle og DM -modeller blev demonstreret med hensyn til følsomhed, specificitet, positiv forudsigelsesværdi (PPV), negativ forudsigelsesværdi (NPV) og område under modtagerens driftskarakteristiske kurve (AUROC) 27 (tabel 2, figur 2 og supplerende figur 1 online). Med hensyn til følsomheden af det interne testbatteri udførte traditionelle metoder bedst blandt mænd og værre blandt kvinder. Forskellen i klassificeringsydelse mellem traditionelle metoder og SD er imidlertid 9,7% for mænd (MLP) og kun 2,4% for kvinder (XGBOOST). Blandt DM -modeller viste logistisk regression (LR) bedre følsomhed hos begge køn. Med hensyn til specificiteten af det interne testsæt blev det observeret, at de fire SD -modeller fungerede godt hos mænd, mens den traditionelle model fungerede bedre hos kvinder. Forskellene i klassificeringsydelse for mænd og kvinder er henholdsvis 13,3% (MLP) og 13,1% (MLP), hvilket indikerer, at forskellen i klassificeringsydelse mellem modeller overstiger følsomheden. Blandt DM -modellerne presterede Support Vector Machine (SVM), beslutningstræet (DT) og Random Forest (RF) modeller bedst blandt mænd, mens LR -modellen presterede bedst blandt kvinder. AUROC for den traditionelle model og alle SD-modeller var større end 0,925 (K-nærmeste nabo (KNN) hos mænd), hvilket demonstrerede fremragende klassificeringsydelse i at skelne 18-årige prøver28. For det eksterne testsæt var der et fald i klassificeringsydelse med hensyn til følsomhed, specificitet og AUROC sammenlignet med det interne testsæt. Desuden varierede forskellen i følsomhed og specificitet mellem klassificeringsydelsen for de bedste og værste modeller fra 10% til 25% og var større end forskellen i det interne testsæt.
Følsomhed og specificitet af data mining -klassificeringsmodeller sammenlignet med traditionelle metoder med en cutoff på 18 år. Knn K nærmeste nabo, SVM Support Vector Machine, LR Logistic Regression, DT Decision Tree, RF Random Forest, XGB XGBOOST, MLP Multilayer Perceptron, traditionel CM -metode.
Det første trin i denne undersøgelse var at sammenligne nøjagtigheden af tandalderestimater opnået fra syv DM -modeller med dem, der blev opnået ved hjælp af traditionel regression. MAE og RMSE blev evalueret i interne testsæt for begge køn, og forskellen mellem den traditionelle metode og DM -modellen varierede fra 44 til 77 dage for MAE og fra 62 til 88 dage for RMSE. Selvom den traditionelle metode var lidt mere nøjagtig i denne undersøgelse, er det vanskeligt at konkludere, om en sådan lille forskel har klinisk eller praktisk betydning. Disse resultater indikerer, at nøjagtigheden af estimering af tandalder ved anvendelse af DM -modellen er næsten den samme som for den traditionelle metode. Direkte sammenligning med resultater fra tidligere undersøgelser er vanskelig, fordi ingen undersøgelse har sammenlignet nøjagtigheden af DM -modeller med traditionelle statistiske metoder ved anvendelse af den samme teknik til registrering af tænder i samme aldersinterval som i denne undersøgelse. Galibourg et al24 sammenlignede MAE og RMSE mellem to traditionelle metoder (Demirjian Method25 og Willems Method29) og 10 DM -modeller i en fransk befolkning i alderen 2 til 24 år. De rapporterede, at alle DM -modeller var mere nøjagtige end traditionelle metoder, med forskelle på 0,20 og 0,38 år i MAE og 0,25 og 0,47 år i RMSE sammenlignet med Willems og Demirdjian -metoderne. Uoverensstemmelsen mellem SD -modellen og traditionelle metoder, der er vist i Halibourg -undersøgelsen, tager højde for adskillige rapporter30,31,32,33, at den demirdjiske metode ikke nøjagtigt estimerer tandlægealderen i andre populationer end de franske canadiere, som undersøgelsen var baseret på. I denne undersøgelse. Tai et al 34 brugte MLP -algoritmen til at forudsige tandalderen fra 1636 kinesiske ortodontiske fotografier og sammenlignede dens nøjagtighed med resultaterne af Demirjian- og Willems -metoden. De rapporterede, at MLP har højere nøjagtighed end traditionelle metoder. Forskellen mellem den demirdjiske metode og den traditionelle metode er <0,32 år, og Willems -metoden er 0,28 år, hvilket svarer til resultaterne af den nuværende undersøgelse. Resultaterne af disse tidligere undersøgelser24,34 er også i overensstemmelse med resultaterne af den nuværende undersøgelse, og aldersestimeringsnøjagtigheden af DM -modellen og den traditionelle metode er ens. Baseret på de præsenterede resultater kan vi imidlertid kun med forsigtighed konkludere, at brugen af DM -modeller til at estimere alder kan erstatte eksisterende metoder på grund af manglen på sammenlignende og reference tidligere undersøgelser. Opfølgningsundersøgelser ved anvendelse af større prøver er nødvendige for at bekræfte de opnåede resultater i denne undersøgelse.
Blandt de undersøgelser, der tester nøjagtigheden af SD ved estimering af tandalder, viste nogle højere nøjagtighed end vores undersøgelse. Stepanovsky et al 35 anvendte 22 SD -modeller på panoramiske røntgenbilleder på 976 tjekkiske beboere i alderen 2,7 til 20,5 år og testede nøjagtigheden af hver model. De vurderede udviklingen af i alt 16 øvre og nedre venstre permanente tænder ved hjælp af de klassificeringskriterier, der blev foreslået af Moorrees et al 36. MAE varierer fra 0,64 til 0,94 år og RMSE varierer fra 0,85 til 1,27 år, hvilket er mere nøjagtige end de to DM -modeller, der blev anvendt i denne undersøgelse. Shen et al23 anvendte kamera -metoden til at estimere tandalderen på syv permanente tænder i venstre mandible hos østkinesiske beboere i alderen 5 til 13 år og sammenlignede den med aldre estimeret ved hjælp af lineær regression, SVM og RF. De viste, at alle tre DM -modeller har højere nøjagtighed sammenlignet med den traditionelle kameraereformel. MAE og RMSE i Shens undersøgelse var lavere end dem i DM -modellen i denne undersøgelse. Den øgede præcision af undersøgelserne af Stepanovsky et al. 35 og Shen et al. 23 kan skyldes inkludering af yngre forsøgspersoner i deres undersøgelsesprøver. Da aldersestimater for deltagere med udvikling af tænder bliver mere nøjagtige, efterhånden som antallet af tænder øges under tandudvikling, kan nøjagtigheden af den resulterende aldersestimeringsmetode blive kompromitteret, når deltagerne er yngre. Derudover er MLPs fejl i aldersestimering lidt mindre end SLP'er, hvilket betyder, at MLP er mere nøjagtig end SLP. MLP betragtes som lidt bedre til aldersestimering, muligvis på grund af de skjulte lag i MLP38. Der er dog en undtagelse for den ydre prøve af kvinder (SLP 1.45, MLP 1.49). Det konstaterer, at MLP er mere nøjagtig end SLP ved vurdering af alderen kræver yderligere retrospektive undersøgelser.
Klassificeringsydelsen af DM-modellen og den traditionelle metode ved en 18-årig tærskel blev også sammenlignet. Alle testede SD-modeller og traditionelle metoder på det interne testsæt viste praktisk talt acceptable niveauer af forskelsbehandling for den 18-årige prøve. Følsomheden for mænd og kvinder var henholdsvis større end 87,7% og 94,9%, og specificiteten var større end 89,3% og 84,7%. AUROC for alle testede modeller overstiger også 0,925. Så vidt vi ved, har ingen undersøgelse testet ydelsen af DM-modellen for 18-årig klassificering baseret på tandmodenhed. Vi kan sammenligne resultaterne af denne undersøgelse med klassificeringsydelsen af dybe læringsmodeller på panoramiske røntgenbilleder. Guo et al.15 beregnet klassificeringsydelsen for en CNN-baseret dyb læringsmodel og en manuel metode baseret på Demirjians metode til en bestemt aldersgrænse. Følsomheden og specificiteten af den manuelle metode var henholdsvis 87,7% og 95,5%, og følsomheden og specificiteten af CNN -modellen oversteg henholdsvis 89,2% og 86,6%. De konkluderede, at dybe læringsmodeller kan erstatte eller overgå manuel vurdering i klassificering af aldersgrænser. Resultaterne af denne undersøgelse viste lignende klassificeringsydelse; Det antages, at klassificering ved hjælp af DM -modeller kan erstatte traditionelle statistiske metoder til aldersestimering. Blandt modellerne var DM LR den bedste model med hensyn til følsomhed for den mandlige prøve og følsomhed og specificitet for den kvindelige prøve. LR rangerer nummer to i specificitet for mænd. Derudover betragtes LR som en af de mere brugervenlige DM35-modeller og er mindre komplekse og vanskelige at behandle. Baseret på disse resultater blev LR betragtet som den bedste cutoff-klassificeringsmodel for 18-årige i den koreanske befolkning.
Generelt var nøjagtigheden af aldersestimering eller klassificeringsydelse på det eksterne testsæt dårlig eller lavere sammenlignet med resultaterne på det interne testsæt. Nogle rapporter indikerer, at klassificeringsnøjagtighed eller effektivitet falder, når aldersestimater baseret på den koreanske befolkning anvendes til den japanske population5,39, og der blev fundet et lignende mønster i den nuværende undersøgelse. Denne forringelse tendens blev også observeret i DM -modellen. Derfor, for nøjagtigt at estimere alder, selv når man bruger DM i analyseprocessen, skal metoder, der stammer fra indfødte populationsdata, såsom traditionelle metoder, foretrækkes5,39,40,41,42. Da det er uklart, om dybe læringsmodeller kan vise lignende tendenser, er undersøgelser, der sammenligner klassificeringsnøjagtighed og effektivitet ved hjælp af traditionelle metoder, DM -modeller og dybe læringsmodeller på de samme prøver, nødvendige for at bekræfte, om kunstig intelligens kan overvinde disse racemæssige forskelle i begrænset alder. Vurderinger.
Vi demonstrerer, at traditionelle metoder kan erstattes af aldersestimering baseret på DM -modellen i retsmedicinsk tidsestimeringspraksis i Korea. Vi opdagede også muligheden for at implementere maskinlæring til retsmedicinsk aldersvurdering. Der er imidlertid klare begrænsninger, såsom det utilstrækkelige antal deltagere i denne undersøgelse til definitivt at bestemme resultaterne og manglen på tidligere undersøgelser til at sammenligne og bekræfte resultaterne af denne undersøgelse. I fremtiden skal DM -undersøgelser udføres med et større antal prøver og mere forskellige populationer for at forbedre dens praktiske anvendelighed sammenlignet med traditionelle metoder. For at validere gennemførligheden af at bruge kunstig intelligens til at estimere alder i flere populationer er fremtidige undersøgelser nødvendige for at sammenligne klassificeringsnøjagtigheden og effektiviteten af DM og dyb læringsmodeller med traditionelle metoder i de samme prøver.
Undersøgelsen anvendte 2.657 ortografiske fotografier indsamlet fra koreanske og japanske voksne i alderen 15 til 23 år. De koreanske røntgenbilleder blev opdelt i 900 træningssæt (19,42 ± 2,65 år) og 900 interne testsæt (19,52 ± 2,59 år). Træningssættet blev indsamlet på en institution (Seoul St. Mary's Hospital), og det eget testsæt blev indsamlet på to institutioner (Seoul National University Dental Hospital og Yonsei University Dental Hospital). Vi indsamlede også 857 røntgenbilleder fra en anden befolkningsbaserede data (IWate Medical University, Japan) til ekstern test. Radiografer af japanske forsøgspersoner (19,31 ± 2,60 år) blev valgt som det eksterne testsæt. Data blev indsamlet retrospektivt for at analysere stadierne af tandudvikling på panoramiske røntgenbilleder taget under tandbehandling. Alle indsamlede data var anonyme bortset fra køn, fødselsdato og radiografdato. Inkluderings- og ekskluderingskriterier var de samme som tidligere offentliggjorte undersøgelser 4, 5. Prøvens faktiske alder blev beregnet ved at trække fødselsdatoen fra den dato, radiografen blev taget. Prøvegruppen blev opdelt i ni aldersgrupper. Alder og kønsfordelinger er vist i tabel 3 Denne undersøgelse blev udført i overensstemmelse med Helsinki -erklæringen og godkendt af Institutional Review Board (IRB) fra Seoul St. Mary's Hospital of the Catholic University of Korea (KC22WISI0328). På grund af det retrospektive design af denne undersøgelse kunne informeret samtykke ikke opnås fra alle patienter, der gennemgik radiografisk undersøgelse til terapeutiske formål. Seoul Korea University St. Mary's Hospital (IRB) frafaldt kravet om informeret samtykke.
Udviklingsstadier af bimaxillære anden og tredje molarer blev vurderet i henhold til Demircan -kriterierne25. Kun en tand blev valgt, hvis den samme type tand blev fundet på venstre og højre side af hver kæbe. Hvis homologe tænder på begge sider var i forskellige udviklingsstadier, blev tanden med det lavere udviklingsstadium valgt til at redegøre for usikkerhed i den estimerede alder. Et hundrede tilfældigt valgte røntgenbilleder fra træningssættet blev scoret af to erfarne observatører til at teste Interobserver -pålidelighed efter præalibrering for at bestemme tandmodenhedsstadiet. Intraobserver-pålidelighed blev vurderet to gange med tre måneders intervaller af den primære observatør.
Køn og udviklingsstadium for den anden og tredje molar i hver kæbe i træningssættet blev estimeret af en primær observatør, der er trænet med forskellige DM -modeller, og den faktiske alder blev indstillet som målværdien. SLP- og MLP -modeller, der er vidt brugt i maskinlæring, blev testet mod regressionsalgoritmer. DM -modellen kombinerer lineære funktioner ved hjælp af udviklingsstadierne af de fire tænder og kombinerer disse data for at estimere alder. SLP er det enkleste neurale netværk og indeholder ikke skjulte lag. SLP fungerer baseret på tærskeltransmission mellem noder. SLP -modellen i regression ligner matematisk flere lineære regression. I modsætning til SLP -modellen har MLP -modellen flere skjulte lag med ikke -lineære aktiveringsfunktioner. Vores eksperimenter anvendte et skjult lag med kun 20 skjulte knudepunkter med ikke -lineære aktiveringsfunktioner. Brug gradientafstamning som optimeringsmetode og MAE og RMSE som tabsfunktion til at træne vores maskinlæringsmodel. Den bedst opnåede regressionsmodel blev påført de interne og eksterne testsæt, og tænderne blev estimeret.
En klassificeringsalgoritme blev udviklet, der bruger modenheden af fire tænder på træningssættet til at forudsige, om en prøve er 18 år gammel eller ej. For at opbygge modellen afledte vi syv repræsentation af maskinlæringsalgoritmer6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBOOST og (7) MLP . LR er en af de mest anvendte klassificeringsalgoritmer44. Det er en overvåget læringsalgoritme, der bruger regression til at forudsige sandsynligheden for data, der hører til en bestemt kategori fra 0 til 1 og klassificerer dataene som tilhørende en mere sandsynlig kategori baseret på denne sandsynlighed; Brugt hovedsageligt til binær klassificering. KNN er en af de enkleste maskinlæringsalgoritmer45. Når de får nye inputdata, finder de K -data tæt på det eksisterende sæt og klassificerer dem derefter i klassen med den højeste frekvens. Vi satte 3 for antallet af betragtede naboer (K). SVM er en algoritme, der maksimerer afstanden mellem to klasser ved hjælp af en kernefunktion til at udvide det lineære rum til et ikke-lineært rum kaldet Fields46. Til denne model bruger vi bias = 1, effekt = 1 og gamma = 1 som hyperparametre til polynomkernen. DT er blevet anvendt på forskellige felter som en algoritme til opdeling af et helt datasæt i flere undergrupper ved at repræsentere beslutningsregler i en træstruktur47. Modellen er konfigureret med et minimum antal poster pr. Knudepunkt på 2 og bruger Gini -indekset som et mål for kvalitet. RF er en ensemble -metode, der kombinerer flere DT'er til at forbedre ydelsen ved hjælp af en bootstrap -aggregeringsmetode, der genererer en svag klassifikator for hver prøve ved tilfældigt at tegne prøver af samme størrelse flere gange fra den originale Dataset48. Vi brugte 100 træer, 10 trædybder, 1 minimum nodestørrelse og Gini -blandingsindeks som knudeparationskriterier. Klassificeringen af nye data bestemmes af en flertal. XGBOOST er en algoritme, der kombinerer øget teknikker ved hjælp af en metode, der tager som træningsdata fejlen mellem de faktiske og forudsagte værdier for den forrige model og øger fejlen ved hjælp af Gradients49. Det er en meget brugt algoritme på grund af dens gode ydelse og ressourceeffektivitet såvel som høj pålidelighed som en overfittende korrektionsfunktion. Modellen er udstyret med 400 supporthjul. MLP er et neuralt netværk, hvor en eller flere perceptroner danner flere lag med et eller flere skjulte lag mellem input- og udgangslagene38. Ved hjælp af dette kan du udføre ikke-lineær klassificering, hvor når du tilføjer et inputlag og får en resultatværdi, sammenlignes den forudsagte resultatværdi med den faktiske resultatværdi, og fejlen forplantes tilbage. Vi skabte et skjult lag med 20 skjulte neuroner i hvert lag. Hver model, vi udviklede, blev anvendt på interne og eksterne sæt til testklassificeringsydelse ved at beregne følsomhed, specificitet, PPV, NPV og AUROC. Følsomheden defineres som forholdet mellem en prøve, der estimeres til at være 18 år eller ældre til en prøve, der estimeres til at være 18 år eller ældre. Specificitet er andelen af prøver under 18 år, og dem, der anslås til at være under 18 år.
De tandstadier, der blev vurderet i træningssættet, blev konverteret til numeriske stadier til statistisk analyse. Multivariat lineær og logistisk regression blev udført for at udvikle forudsigelige modeller for hvert køn og udlede regressionsformler, der kan bruges til at estimere alder. Vi brugte disse formler til at estimere tandalderen for både interne og eksterne testsæt. Tabel 4 viser regressions- og klassificeringsmodellerne anvendt i denne undersøgelse.
Intra- og Interobserver-pålidelighed blev beregnet ved hjælp af Cohens kappa-statistik. For at teste nøjagtigheden af DM og traditionelle regressionsmodeller beregnet vi MAE og RMSE ved hjælp af de estimerede og faktiske aldre for de interne og eksterne testsæt. Disse fejl bruges ofte til at evaluere nøjagtigheden af modelforudsigelser. Jo mindre fejlen er, jo højere er nøjagtigheden af prognosen24. Sammenlign MAE og RMSE af interne og eksterne testsæt beregnet ved hjælp af DM og traditionel regression. Klassificeringsydelse af den 18-årige cutoff i traditionel statistik blev vurderet ved hjælp af en 2 × 2 beredskabstabel. Den beregnede følsomhed, specificitet, PPV, NPV og AUROC af testsættet blev sammenlignet med de målte værdier af DM -klassificeringsmodellen. Data udtrykkes som gennemsnit ± standardafvigelse eller antal (%) afhængigt af datakarakteristika. Tosidede P-værdier <0,05 blev betragtet som statistisk signifikante. Alle rutinemæssige statistiske analyser blev udført under anvendelse af SAS version 9.4 (SAS Institute, Cary, NC). DM -regressionsmodellen blev implementeret i Python under anvendelse af KERAS50 2.2.4 backend og tensorflow51 1.8.0 specifikt til matematiske operationer. DM -klassificeringsmodellen blev implementeret i Waikato Knowledge Analysis -miljøet og Konstanz Information Miner (KNIME) 4.6.152 analyseplatform.
Forfatterne anerkender, at data, der understøtter undersøgelsens konklusioner, findes i artiklen og supplerende materialer. De datasæt, der genereres og/eller analyseres under undersøgelsen, er tilgængelige fra den tilsvarende forfatter på rimelig anmodning.
Ritz-Timme, S. et al. Aldersvurdering: Kunststilstand for at imødekomme de specifikke krav til retsmedicinsk praksis. internationalitet. J. Legal Medicine. 113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G., og Olze, A. Nuværende status for retsmedicinsk aldersvurdering af levende emner til strafforfølgelsesformål. Forensik. medicin. Patologi. 1, 239–246 (2005).
Pan, J. et al. En modificeret metode til vurdering af tandlægealderen for børn i alderen 5 til 16 år i det østlige Kina. klinisk. Oral undersøgelse. 25, 3463–3474 (2021).
Lee, SS osv. Kronologi om udvikling af anden og tredje molar i koreanere og dens anvendelse på retsmedicinsk aldersvurdering. internationalitet. J. Legal Medicine. 124, 659–665 (2010).
Åh, S., Kumagai, A., Kim, SY og Lee, SS-nøjagtighed af aldersestimering og estimering af den 18-årige tærskel baseret på modenheden af anden og tredje molarer i koreanere og japansk. PLOS ONE 17, E0271247 (2022).
Kim, JY, et al. Preoperativ maskinlæringsbaseret dataanalyse kan forudsige resultat af søvnkirurgi hos patienter med OSA. videnskaben. Rapport 11, 14911 (2021).
Han, M. et al. Præcis aldersestimering fra maskinlæring med eller uden menneskelig indgriben? internationalitet. J. Legal Medicine. 136, 821–831 (2022).
Khan, S. og Shaheen, M. Fra data mining til data mining. J.Information. videnskaben. https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. og Shaheen, M. Wisrule: Den første kognitive algoritme til foreningsregelminedrift. J.Information. videnskaben. https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. og Abdullah U. Karm: Traditionel datamining baseret på kontekstbaserede foreningsregler. beregne. Matt. fortsætte. 68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. og Habib M. Deep Learning Based Semantic lighedsdetektion ved hjælp af tekstdata. informere. teknologier. kontrollere. https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z. og Shahin, M. Et system til genkendelse af aktivitet i sportsvideoer. Multimedia. Værktøjsapplikationer https://doi.org/10.1007/S11042-021-10519-6 (2021).
Halabi, SS et al. RSNA Machine Learning Challenge i pædiatrisk knoglealder. Radiologi 290, 498–503 (2019).
Li, Y. et al. Forensisk tidsestimering fra bækken-røntgenstråler ved hjælp af dyb læring. Euro. Stråling. 29, 2322–2329 (2019).
Guo, YC, et al. Præcis aldersklassificering ved hjælp af manuelle metoder og dybe indviklede neurale netværk fra ortografiske projektionsbilleder. internationalitet. J. Legal Medicine. 135, 1589–1597 (2021).
Alabama Dalora et al. Benalderens estimering ved hjælp af forskellige maskinlæringsmetoder: En systematisk litteraturanmeldelse og metaanalyse. PLOS ONE 14, E0220242 (2019).
Du, H., Li, G., Cheng, K. og Yang, J. Befolkningsspecifik aldersestimering af afroamerikanere og kinesere baseret på massekammervolumener af første molarer ved hjælp af keglebjælkeberegningstomografi. internationalitet. J. Legal Medicine. 136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK og OH KS bestemmer aldersgrupper af levende mennesker, der bruger kunstig intelligensbaserede billeder af første molarer. videnskaben. Rapport 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N. og Urschler, M. Automatisk aldersestimering og majoritetsalderklassificering fra multivariate MR -data. IEEE J. Biomed. Sundhedsadvarsler. 23, 1392–1403 (2019).
Cheng, Q., Ge, Z., Du, H. og Li, G. Aldersestimering baseret på 3D -pulpkammersegmentering af første molarer fra keglebjælkecomputertomografi ved at integrere dyb læring og niveau sæt. internationalitet. J. Legal Medicine. 135, 365–373 (2021).
Wu, WT, et al. Data mining i kliniske big data: Almindelige databaser, trin og metodemodeller. Verden. medicin. Ressource. 8, 44 (2021).
Yang, J. et al. Introduktion til medicinske databaser og dataminingsteknologier i Big Data -æraen. J. Avid. Grundlæggende medicin. 13, 57–69 (2020).
Shen, S. et al. Kamerers metode til estimering af tandalder ved hjælp af maskinlæring. BMC Oral Health 21, 641 (2021).
Galliburg A. et al. Sammenligning af forskellige maskinlæringsmetoder til forudsigelse af tandalder ved hjælp af den demirdjiske iscenesættelsesmetode. internationalitet. J. Legal Medicine. 135, 665–675 (2021).
Demirdjian, A., Goldstein, H. og Tanner, JM Et nyt system til vurdering af tandalderen. Snort. biologi. 45, 211–227 (1973).
Landis, Jr og Koch, GG -mål for observatøraftale om kategoriske data. Biometri 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK og Choi HK. Teksturel, morfologisk og statistisk analyse af to-dimensionel magnetisk resonansafbildning ved anvendelse af kunstig intelligens teknikker til differentiering af primære hjernesvulster. Sundhedsoplysninger. Ressource. https://doi.org/10.4258/hir.2022.28.1.46 (2022).

Posttid: Jan-04-2024

Validering af en dataminingmodel mod traditionelle estimeringsmetoder