Talasemi Taşıyıcılığının Makine Öğrenmesi ile Erken Tespiti

Talasemi, vücutta yetersiz hemoglobin üretimi nedeniyle ortaya çıkan kalıtsal bir bozukluktur. Hemoglobin eksikliği, kırmızı kan hücrelerinin hayatta kalma oranını düşürerek kan dolaşımında daha az sayıda kırmızı kan hücresinin akmasına neden olur ve bu da yaşamı tehdit edebilecek sınırlı bir oksijen kaynağına yol açar. Bugün itibariyle birçok ülke dünya çapında sakatlık ve ölüm oranlarını önemli ölçüde arttıran talasemi ile mücadele etmektedir. Talasemi, özellikle Akdeniz ülkeleri, Orta Doğu, Güneydoğu Asya ve Hindistan gibi belirli coğrafyalarda daha sık görülür.

 

Talasemi, genetik bir kan hastalığıdır ve bu hastalığın tespiti için çeşitli genetik ve hematolojik testler kullanılmaktadır. β-Talasemi taşıyıcıları hastalığın belirtilerini göstermeyebilir. Tam kan sayımı testi, yüksek performanslı sıvı kromatografisi ve genetik testler ile teşhis edilebilirler. Talasemi tespiti için yaygın olarak kullanılan bazı analizler şunlardır:

 


 

Tam Kan Sayımı (Complete Blood Count – CBC):  CBC testi, kanın hücre sayısını ve özelliklerini değerlendirmek için kullanılır. Talasemi hastalarında, kırmızı kan hücrelerinin sayısı ve morfolojisi değişiklik gösterebilir.

 

 

Hemoglobin Elektroforezi:  Bu test, hemoglobin proteinlerini belirlemek için kullanılır. Talasemiler genellikle normal hemoglobin yerine anormal hemoglobin üretimine neden olduğu için bu testle farklı hemoglobin türleri tespit edilebilir.

 

HPLC (High-Performance Liquid Chromatography):  Bu analiz, kan örneğindeki hemoglobin türlerini ayrıştırarak ölçen bir yöntemdir. HPLC, hemoglobin elektroforezi gibi talasemi tiplerini belirlemede kullanılır.

 

Sağlık bilgi teknolojileri, sağlık hizmetlerinde bilgi teknolojilerinin kullanımını, bu teknolojilerin sağlık alanında bilgi yönetimi ve iletişimine entegrasyonunu ifade eder. Son yıllarda, tıbbi kayıtların etkili ve güvenli bir şekilde yönetilmesi gerekliliği nedeniyle sağlık bilgi teknolojilerinin önemi artmıştır. Bu durum, genetik bozukluklardan kaynaklanan hastalıkların erken teşhisini destekleyen sistemlerin geliştirilmesine yol açmıştır. Bu amaçla çeşitli veri madenciliği teknikleri kullanılmaktadır.

 

Veri madenciliği teknikleri, büyük miktardaki ham veriyi işlemek ve kullanışlı bilgileri keşfetmek için kullanılır. Bu nedenle, veri madenciliği teknikleri, talasemi gibi genetik bozuklukların erken teşhisine yardımcı olacak bir tespit sistemini geliştirmede etkili olabilir.

 

İşte talasemi taşıyıcısı ve talasemi taşıyıcısı olmayan bireylerin tam kan sayımı sonuçlarını veri tabanı olarak kullanan güncel makine öğrenimi araştırmaları:

 

 

Tablo açıklaması: Çalışmalarda kullanılan veri setleri toplamda 12 özelliği içerir. Bunlardan 9’u CBC (Tam Kan Sayımı) testlerine ait özellikleri, 2’si hastaların demografik bilgilerini ve 1’i hedef etiketi temsil eder.

 

 

Pakistan’da yapılan bir çalışmada Punjab talasemi önleme programından 5066 hastanın tam kan sayımı verileri üzerinde eğitilen ve değerlendirilen bir yapay zeka modeli kullanılmıştır. Bu model B-talasemi taşıyıcıları ve taşıyıcı olmayanları ayırmada %93 doğruluk oranına ulaşmıştır.

  

Çok merkezli yürütülen diğer bir çalışmada ise tam kan sayımı veri seti Dr.Haidari’nin İran’ın Zahedan şehrinde bulunan laboratuvarından toplanmış. Araştırmacılar farklı makine öğrenimi modellerini kendi veri setleri ile eğiterek karşılaştırma yapmışlardır. Deneyler için DT(Decision Tree), Naive Bayes, Bagging, SVC(Support Vector Classification) ve AdaBoost gibi çeşitli makine öğrenimi modelleri kullanıldı. Farklı modellerin performans karşılaştırması sonuçlarına göre, sırasıyla DT (%96), Naïve Bayes (%76.6), AdaBoost (%80.2), SVC (%95.5) ve Bagging (%96.6) modellerinin ilgili doğruluk oranlarına sahip olduğu bildirilmiştir. Araştırmacılar Bagging sınıflandırıcının daha iyi performans gösterdiği sonucuna varmıştır.

 

İtalya’da yapılan başka bir çalışmada RBF(Radial Basis Function) makine öğrenimi algoritmasına dayanan bir model geliştirilmiş ve veri seti olarak 304 hastanın tam kan sayımı kayıtları kullanılmıştır. Modelleri veri setlerindeki tüm hastaları doğru sınıflandırmıştır. PNN(Probabilistic Neural Network) ve k-NN(k-Nearest Neighbors) algoritmalarını da denemişler ama RBF’deki yüksek doğruluğa ulaşamamışlar ve RBF modelinin hız ve verimlilik açısından en iyi olduğunu söylemişler.

 

Yine İtalya’da yapılan başka bir çalışmada ise araştırmacılar, iki katmanlı sınıflandırıcıları SVM(Support Vector Machine) ve k-NN ile birleştirmiş ve bu sınıflandırıcıların sonuçlarını MLP(Multi Layer Perceptron) sınıflandırıcısı ile karşılaştırmıştır. İki katmanlı sınıflandırıcının ilk katmanı, Talassemi hastalarını ve sağlıklı bireyleri sınıflandırmak için çalışırken, diğer katmanlar, birinci katmandan gelen hastaları iki farklı Talassemi türüne göre sınıflandırmaktadır. Araştırmacılar, sınıflandırmaya etki eden RCB(Red Cell Distribution Width), MCV(Mean Corpuscular Volume) ve hemoglobin seviyesi gibi ilgili özellikleri normalizasyon işlemi gerçekleştirmeden kullanmışlardır. Çalışmanın sonuçlarına göre, MLP sınıflandırıcısının, iki katmanlı sınıflandırıcılardan daha iyi performans gösterdiği gözlemlenmiştir.

 

Makine öğrenimi temelli yaklaşımlar, talasemi taşıyıcılarını ve taşıyıcı olmayanları sınıflandırmak amacıyla son zamanlarda dikkat çeken bir araştırma alanı haline gelmiştir. Bu çalışmalar, genetik hastalıkların özellikle talasemi gibi önemli bir sağlık probleminin erken teşhisi için yenilikçi çözümler sunmaktadır.

 

Makine öğrenimi modelleri, bu analizlerde önemli bir rol oynar. DT, SVM, Naive Bayes gibi çeşitli algoritmalar kullanılarak elde edilen sonuçlar, taşıyıcı ve taşıyıcı olmayanları ayırt etme konusunda yüksek doğruluk oranlarına ulaşmaktadır. Bu gelişmeler, genetik hastalıkların erken teşhisi ve kişiselleştirilmiş tedavi yöntemlerinin geliştirilmesi açısından önemli bir adım olarak öne çıkmaktadır.

 

Makine öğrenimi temelli bu yeni yaklaşımlar, sağlık alanında önemli bir ilerleme kaydetmekte ve talasemi taşıyıcılarının tespiti konusunda daha etkili ve hızlı bir çözüm sunmaktadır. Bu çalışmaların ilerlemesi, talasemi ile mücadelede daha etkili stratejilere yol açabilir ve sağlık profesyonellerine daha fazla yardımcı olabilir.

 

 

REFERANSLAR:

 

1- Rustam, F., Ashraf, I., Jabbar, S. et al. Prediction of Thalassemia carriers using complete blood count features. Sci Rep 12, 19999 (2022). https://doi.org/10.1038/s41598-022-22011-8

2- Sadiq, S. et al. Classification of B-thalassemia carriers from red blood cell indices using ensemble classifier. IEEE Access 9, 45528–45538 (2021).

3- Noferesti, S., Shemshadi Nejad, N. & Heydari, F. Using data mining models for differential diagnosis of iron deficiency anemia and B-thalassemia minor. J. Health Biomed. Inform

4- Masala, G. L., Golosio, B., Cutzu, R. & Pola, R. A two-layered classifier based on the radial basis function for the screening of thalassaemia. Comput. Biol. Med. 43, 1724–1731 (2013).

5- microbenotes.com

6- cura4u.com

7- labpedia.net

Yazar

Oğuzkan İlmaz
Related Posts

Bir Cevap Yazın

Bu site, istenmeyenleri azaltmak için Akismet kullanıyor. Yorum verilerinizin nasıl işlendiği hakkında daha fazla bilgi edinin.