Lancet (Źródło: The Lancet)
Lancet (Źródło: The Lancet)

Algorytmy wykrywania chorób skóry mają za mało danych. Kolejne badanie podkreśla problem

Sztuczna inteligencja oraz algorytmy, również te medyczne, opierają swoją naukę m.in. o szeroko dostępne bazy danych, zawierające zdjęcia i użyteczne informacje o pacjencie. Okazuje się jednak, że takie bazy są wybrakowane. Może to spowodować w przyszłości błędy w leczeniu i diagnostyce, jeśli wykorzystamy nieprecyzyjne systemy.

Naukowcy alarmują o niekompletnych danych

Niedawno opublikowane wyniki badań w The Lancet Digital Health nad ogólnodostępnymi bazami danych stwierdzają jednoznacznie – algorytmy uczone z wykorzystaniem próbek z tych baz mają zbyt mało materiału, by precyzyjnie diagnozować choroby skóry.

Pierwszy problem, jaki wskazali naukowcy, to brak kompletnych informacji i etykiet dotyczących narodowości czy koloru skóry. Powoduje to, że naukowcy wspierający algorytmy w procesie uczenia nie są w stanie jednoznaczne wychwycić błędów i nieścisłości w tak uczących się programach. Skala problemu? Na 100000 sprawdzonych zdjęć tylko 1400 zawierało notkę dotyczącą narodowości, a 2236 informowało o kolorze skóry pacjenta ze zdjęć.

Drugi problem to znacząca przewaga zdjęć osób o jaśniejszych kolorach skóry. Spośród próbek z opisanym odcieniem, tylko 11 należało do pacjentów z dwoma najciemniejszymi fototypami skóry. W bazach brakuje również próbek dotyczących mieszkańców chociażby Afryki czy Południowej Azji.

Skala fototypu skóry Fitzpatricka (Źródło: Researchgate)
Skala fototypu skóry Fitzpatricka – w bazach brakuje typu 5 i 6 (Źródło: Researchgate)

Dlaczego tak ważna jest kontrola czym karmione są algorytmy? Coraz powszechniejsze w medycynie staje się zastosowanie sztucznej inteligencji i uczenia maszynowego wspierających pracę lekarzy i diagnostyków. Systemy wykrywające niepokojące zmiany w organizmie są dużo bardziej precyzyjne od ludzi, oszczędzają czas i pieniądze, które mogą być bardziej efektywnie spożytkowane w ratowaniu ludzkiego życia.

Jednak w sytuacji, gdy algorytmy mające docelowo ratować życie są niepoprawnie zbudowane – ich wiarygodność zostaje zaburzona. Te, które mają pomagać we wczesnym wykrywaniu niebezpiecznych chorób, np. nowotworów skóry, są uczone na niekompletnych bazach – zawierających w głównej mierze próbki jasne. Przez to algorytmy mogą stracić swoją skuteczność w przypadku osób o ciemniejszej karnacji.

To nie pierwsze takie badanie

Badanie z listopada to nie pierwsze tego typu sprawdzenie wiarygodności, czy algorytmy są budowane poprawnie. We wrześniu opublikowano w magazynie Jama wyniki podobnego badania. Naukowcy sprawdzili 70 projektów, w których rozwijane były algorytmy diagnostyczne. Wnioski były podobne – zbiory danych, wykorzystywane do uczenia algorytmów dermatologicznych, mają za mało informacji o narodowości czy odcieniu skóry.

Naukowcy liczą, że właściciele baz uzupełnią je o próbki o szerszym zróżnicowaniu narodowościowym oraz poprawią klarowność i transparentność baz. Wszystko dla rozwoju bardziej skutecznych narzędzi służących ratowaniu ludzkiego życia i zdrowia.