Liputan6.com, Jakarta - Bank hayati (biobank) memiliki peran sangat penting untuk penelitian medis karena menyediakan akses ke sejumlah besar informasi genetik dan kesehatan. Informasi ini digunakan untuk mempelajari interaksi genetika dan faktor lingkungan dalam perkembangan penyakit.
Dengan demikian, bank hayati dapat menjadi sumber daya yang tak ternilai dalam memberikan wawasan tentang banyak hal, mulai dari hubungan antara pola makan dan penyakit hingga dampak ukuran rumah tangga terhadap tingkat keparahan Covid-19. Namun, nilai bank hayati dibatasi oleh kualitas dan kelengkapan data yang terkandung di dalamnya.
Baca Juga
Data pasien yang tidak lengkap, sebagai contoh, tantangan besar bagi para peneliti medis. Data ini dapat berisi informasi yang hilang yang sangat penting untuk melakukan deteksi penyakit dan membuat terobosan baru.
Advertisement
Misalnya, seorang pasien mungkin memiliki riwayat medis diabetes tipe II, tetapi jika mereka tidak pernah dirawat di rumah sakit untuk itu, istilah "diabetes tipe II" mungkin tidak muncul dalam data mereka.
Untuk mengatasi masalah ini, tim peneliti dari Stanford University, yang dipimpin oleh Lu Yang, telah menciptakan sebuah model machine learning yang disebut POPDx.
Kerangka kerja berbasis machine learning ini dapat memprediksi serangkaian kode diagnosis yang komprehensif, yang juga dikenal sebagai kode fenotipe, untuk semua pasien di UK Biobank. Bank hayati ini menyimpan data dari setengah juta peserta dari Inggris, termasuk pasien dengan penyakit langka.
Â
Unggul
POPDx mengungguli model-model yang ada dalam memprediksi penyakit umum dan penyakit langka, bahkan penyakit yang tidak ada dalam data latih.
Para peneliti menilai itu adalah pencapaian besar karena sebagian besar model machine learning membutuhkan sejumlah besar data latih.
Namun, karena keterbatasan jumlah data medis yang tersedia, sangat penting untuk mengembangkan model yang dapat bekerja dengan data yang sedikit dan memberikan hasil yang berguna untuk pasien dengan penyakit yang tidak umum.
Model POPDx menggunakan kombinasi pemrosesan bahasa alami (natural language processing, NLP) dan Ontologi Penyakit Manusia untuk membuat keputusan probabilistik tentang penyakit. Model ini melihat berbagai macam data pasien, mulai dari informasi demografis hingga pemeriksaan medis dan tes laboratorium.
Â
Advertisement
Pembeda utama dari model lain
Keluasan informasi menjadi satu pembeda utama dari POPDx karena model sebelumnya membutuhkan kumpulan data yang dikurasi dengan baik dan tidak dapat mempertimbangkan keluasan fitur yang sama.
Model ini bekerja dengan mencari hubungan antara data pasien dan informasi penyakit, membuat prediksi tentang penyakit apa yang mungkin diderita oleh pasien.
Tantangan terbesar untuk model ini berasal dari penyakit dengan data yang terbatas atau tidak ada data sama sekali. Namun, POPDx telah menunjukkan kinerja yang mengesankan dengan data yang terbatas atau tanpa data sama sekali, sehingga meningkatkan kemungkinan untuk mengidentifikasi kasus-kasus positif dari penyakit dengan prevalensi rendah.
Salah satu tantangan yang dihadapi oleh UK Biobank adalah kecenderungan demografinya, dengan 56 persen partisipan adalah perempuan dan mayoritas partisipan berkulit putih dan berusia di atas 70 tahun.
Â
Solusi keterbatasan data
Kurangnya keragaman ini bukan karena kurangnya data, tetapi lebih karena kurangnya akses layanan kesehatan.
Namun, Yang dan timnya berharap bahwa penelitian mereka dapat membantu mengatasi tantangan ini dengan memberikan titik awal yang lebih baik bagi para dokter dan peneliti yang ingin mempelajari penyakit-penyakit langka ini.
Kesimpulannya, model POPDx yang dibuat oleh Lu Yang dan tim penelitinya di Stanford University menawarkan alat yang berharga untuk penelitian medis.
Dengan memberikan prediksi kode diagnosis yang komprehensif dan akurat, model ini memiliki potensi untuk mengatasi keterbatasan data yang tidak lengkap dan membantu memajukan pemahaman mengenai penyakit.
Dengan kemampuan untuk bekerja dengan data yang jarang, POPDx merupakan langkah maju yang penting dalam pengembangan model pembelajaran mesin untuk penelitian medis.
Advertisement