Yenilikçi teknolojilerin katkısıyla sağlık alanında bilgi tabanlı (knowledge based) karar sürecinin veriden hareketli (data driven) bir perspektife doğru kaymaya başladığını bir önceki yazıda açıklamıştık. Bu yazıda ise sağlıkta devasa miktardaki veri birikiminin (big data) ve çeşitli analitik platformlarla işlenmesinin bu dönüşüme etkisini açıklamaya çalışacağız.
Sağlıkta bilimsel araştırmaların gelişimi:
Bilindiği üzere, tıp alanında yeni gelişmeler, klinik deneylerle elde edilen bulguların bilimsel dergiler aracılığıyla yayınlanması ve zaman içinde biriken muteber sonuçların bütünleştirilp uygulamaya dahil edilmesiyle sağlanmaktadır. İlk resmi klinik deneyler 1747 yıllında denizcilerde skorbüt hastalığının tedavisine ilişkindir. Oldukça eskiye dayanan klinik araştırma sürecinin tamamlayıcı diğer bileşeni ise tıbbi yayıncılıktır. Günümüzde hala faaliyetlerine devam eden ve en eski tıp dergisi olarak kabul edilen The New England Journal of Medicine 1812’de kurulmuştur. Kontrollü deneylerin rutin olarak gerçekleştirilmesi 1940’lı yıllara, kanıta dayalı tıp yaklaşımının “bilimsel tıp” kavramı olarak ortaya atılması ise 1990’lı yılların başlarına dayanmaktadır.
Kontrollü klinik deneyler yeni tıbbi bilgi üretilmesinde tarihsel olarak altın standart kabul edilmektedir. Bu inceleme türünde, örnek olarak, rastgele seçilen iki hasta grubuna sağlanan iki alternatif tedavi (veya biri yeni tedavi diğeri plasebo) çalışmasına ilişkin sonuçlar sıklıkçı (frequentist) istatitiksel yaklaşımla incelenerek klinik sonuç veya maliyet açısından etkin olan seçenek tespit edilmeye çalışılır. Etkin sonuçlar sağlayan bu tür çalışmalar için toplanan örneklem -doğru bir sunum imkanı sağlaması için- ciddi bir hazırlık aşaması ve uzun zaman gerektirmektedir. Bundan dolayı büyük katılımlı randomize kontrollü deneylerin maliyeti oldukça pahalıdır.
Günümüzde ise Institute of Medicine (IOM)’un ifadesiyle, bilimsel bilgi üretme yeteneği sağlık hizmet sunucularının gündelik uygulamalarda bu bilgiyi benimseme ve kullanma hızının üzerine çıkmıştır. Alışılageldik klinik deney ve inceleme -dolayısıyla bilimsel tıp- yaklaşımı veri toplama, depolama, analiz ve elde edilen sonucu tıbbi karar sürecine dahil etmeye yönelik yeni teknolojik imkanlarla beraber daha da gelişmekte ve uygulamaya dayalı tıp yaklaşımının zemini oluşmaktadır. Halihazırda sağlık alanında gerek kaliteli hizmet sunumu sağlamak ve gerekse yasal zorunlululardan dolayı zaten çok fazla miktarda veri üretilmektedir. Bilgi ve iletişim teknolojilerinin yayılması ile beraber son yıllarda devasa miktardaki veriler (big data) üretilip, sayısal ortamlarda tutulmaya başlanmıştır. Bu veriler yine teknolojik gelişmeler sayesinde farklı analitik yöntemlerle işlenebilmekte, sonuçları klinik karar süreçlerinde, hastalık takibinde ve toplum sağlık yönetiminde kullanılabilmektedirler.
Sağlıkta büyük veri:
Ağustos 2012’de ABD Kongresine sunulan bir raporda büyük veri “Bilginin elde edilmesi, depolanması, dağıtılması, yönetimi ve analizi için gelişmiş teknik ve teknolojiler gerektiren büyük miktar, hız, karmaşıklık ve çeşitte veri” olarak tanımlanmıştır. Avrupa Komisyonu tarafından ise (2014) büyük veriyi “güncel veri işleme araç ve yöntemleri ile işlemenin zor olduğu veriler” veya “çok sayıda farklı veri kaynağından yüksek hızla üretilen çok miktarda farklı türde veri” olarak tanımlanmaktadır.
Büyük veri kavramında miktar, çeşitlilik ve hız parametreleri bulunmaktadır. Artık sağlık alanında geleneksel veri yönetim araç ve yöntemleriyle yönetimi kolay olmayacak miktarda veri üretilmektedir. Ayrıca üretilen verilerin çeşitliliği ve üretim hızı da oldukça fazladır. Bazı araştırmacılar veri doğruluğu (veracity) olarak açıklanabilecek dördüncü bir özellikten daha bahsetmektedirler. Sağlıkta da veri kalitesi önemli bir kaygı unsurudur ve analiz sonuçlarının hatasız olması kritik önem taşımaktadır.
Sağlık ve iyilik haline ilişkin veriler içerisinde klinik karar destek sistemleri ve bilgisayarlı talimat girişi sistemlerinden klinik veriler (hekim notları ve reçeteler, tıbbi görüntüleme, laboratuvar, eczane, sigorta ve diğer idari veriler), elektronik depolama sistemlerindeki hasta verileri, makineler/sensörler tarafından üretilen yaşamsal bulgu verileri, tweet’ler dahil sosyal medya gönderileri, bloglar, facebook ve diğer platformalarda durum güncellemeleri ve web sayfaları, acil olgu verileri, haberler ve tıbbi dergi makaleleri gibi daha az spesifik hasta verileri sayılabilir. Çoğu geleneksel tıbbi veri -kağıt dosyalar, röntgen filmleri, ve notlar- durağandır. Ancak günlük düzenli kan şekeri ölçümü, kan basıncı değerlendirmeleri veya EKG gibi düzenli takip verileri birikim hızını arttırmaktadır.
Zaman içinde sağlık verileri sürekli olarak üretilecek, depolanacak ve sonuçta çok miktarda veri birikecektir. Daha şimdiden, kişisel sağlık kayıtları, radyolojik görüntüler, klinik deney verileri, genetik veriler gibi korkutucu miktarda veri mevcuttur. Üç boyutlu görüntüler, genomik ve biyometrik sensör verileri gibi daha yeni büyük veri türleri bu miktarı üstel olarak artırmaktadır.
Sağlıkta büyük veri kaynakları dahili (elektronik tıbbi kayıtlar, klinik karar destek sistemleri, bilgisayarlı talimat girişi) ve harici (devlet kaynakları, laboratuvarlar, eczaneler, sigorta kurumları/şirketleri vs.) olabilir. Genellikle farklı formatlardadır ve farklı konumlarda bulunurlar. Veri tip ve kaynaklarına örnek olarak aşağıdaki başlıklar sunulabilir;
1. Web ve sosyal medya: Facebook, Twitter, LinkedIn, bloglar gibi kaynaklarla etkileşim. Sağlık kurumlarının web sitelerini ve akıllı telefon uygulamalarını içerebilir.
2. Makine-makine verisi: Sensörler, ölçüm aygıtları ve diğer yaşamsal bulgu cihazlarından alınan veriler.
3. Büyük işlem verisi: Sağlık provizyon talebi ve diğer faturalama kayıtları yapılandırılmış yada yapılandırılmamış (metin) şekilde bulunmaktadır.
4. Biyometrik veri: Parmak izi, genetik, el yazısı, retinal tarama, röntgen ve diğer tıbbi görüntüler, kan basıncı, nabız, puls-oksimetre okumaları vs tip veriler.
5. İnsan üretimi veriler: Elektronik sağlık kayıtları, hekim notları ve kağıt belgeler gibi yapılandırılmış yada yapılandırılmamış veriler.
Veri yönetiminde ilerlemeler, özellikle sanallaştırma ve bulut teknolojileri, büyük hacimli verilerin etkin şekilde toplanması, depolanması ve kullanımını için platformlar geliştirilmesini kolaylaştırmaktadır. Ayrıca sağlık verisinin doğası geliştikçe miktar, hız ve çeşitliliğine uygun karmaşık analitik teknikler de geliştirilmektedir.
Sağlıkta büyük veri analitiklerinin kullanım alanları:
Gelinen aşamada, tıpta öngörüsel analiz yetenekleri açısından çeşitli kategoriler bulunmaktadır;
1. Kanıta dayalı incelemelerden elde edilen klinik kurallar: Bazı elektronik sağlık kayıt sistemlerine de dahil edilerek, özellikle genel geçer olgulara ilişkin muhtemel risklerin tespiti konusunda katkı sağlayabilmektedirler. Ancak sınırlı miktardadırlar ve güncellenmesi ancak yeni kurallar eklenmesi veya mevcut olanların düzenlenmesiyle sağlanabilmektedir.
2. Kanıta dayalı çalışmalardan elde edilen istatistiksel algoritmalar: Bir hasta popülasyonundaki potansiyel riskleri işaretlemek için kullanılırlar. Bunlar hiçbir zaman değişmezler. Bağlam veya ortam ne olursa olsun aynı veriler için aynı sonuçları üretirler.
3. Makine öğrenmesi: Yeni verilerle sistemden beslenen sürekli öğrenen modeller aracılığıyla daha doğru risk tahmini yapılmasını sağlamaktadır. Fakat hastalıkların ve yan etkilerin tahmininde tek başına kullanıldıklarında, kanıta dayalı sonuçların hesaplanması için gereken klinik bağlam eksik kalmaktadır.
Büyük veri genellikle veri kümelerinin analizinde makine öğrenmesi algoritmalarının uygulanmasına karşılık gelmektedir. Makine öğrenmesi sayesinde, araştırmacılar bir hipotez geliştirip örneklemden veri toplanması yerine büyük veri setlerinden olası hipotezler araştırılabilmektedir. Veride korelasyon kümelerinin bulunması ve eşleştirilmesi, öğrenme ve geribesleme süreci ile kombine edilen kaba kuvvet (brute-force) sınıflama süreci sayesinde gerçekleştirilmektedir. Makine öğrenmesi algoritmaları genellikle oldukça basittir ve sadece farklı veri elemanları arasındaki ilişkileri ararlar. Bundan dolayı, büyük veri makine öğrenme algoritmalarının sonuçları kesin tahminlerden öte yeni hipotezler olarak algılanırlar. Araştırmacılar hipotezleri veri kümelerine bölerek veya yeni toplanmış veri kümeleri üzerinde algoritmaları yeniden çalıştırarak sınırlı ölçüde test ederler.
Bilgi ve iletişim teknolojilerine dayalı sayısal dönüşüm büyük veri kullanımı ile birleştirilirse, sağlık kurum ve kuruluşları gerçek avantajlar kazanabilir. Hastalıklara daha kolay ve ucuza tedavi edilebileceği erken dönemlerde tanı konabilir, bireysel sağlık durumu ve toplum sağlığı yönetilebilir, sağlık ödemelerinde hileler daha kolay ve etkin şekilde belirlenebilir. Çok miktarda tarihsel veri kullanılarak, hastanede kalma süresi, elektif cerrahiyi seçecek hastalar, cerrahiden fayda görmeyebilecek hastalar, komplikasyonlar, tıbbi komplikasyon riski altındaki hastalar, sepsis, metisiline dirençli staphylolococcus aureus (MRSA), clostridium difficile veya diğer edinilmiş hastane enfeksiyonları riski altındaki hastalar, hastalığın ilerleme süreci, hastalık ilerlemesine ilişkin nedensel faktörler, muhtemel komorbid durumlar vs. önceden tahmin edilebilir. Sağlıkta büyük verinin katkı sunabileceği alanlar şu şekilde sınıflanabilir:
1. Klinik işlemler: Hasta tanı ve tedavisinin daha maliyet etkin yollarını belirlemek için karşılaştırmalı etkililik araştırmaları.
2. Araştırma ve geliştirme:
- İlaç ve tıbbi aygıtlara yönelik daha uygun, daha hızlı ve yönlendirilmiş araştırma/geliştirme süreçlerinin daha az kayıpla gerçekleştirilmesi için prediktif modelleme,
- Klinik deney tasarımı ve hasta toplamayı iyileştirecek, böylece deney hatalarını azaltacak ve yeni ürünün pazara sürülmesini hızlandıracak istatiksel araç ve algoritmalar geliştirilmesi,
- Ürünler pazara verilmeden önce, endikasyonları tanımlamak ve yan etkileri belirlemek için klinik deneylerin ve hasta kayıtlarının analizi.
3. Halk sağlığı:
- Halk sağlığı takibi ve hızlı tepki oluşturmak için hastalık örüntülerinin analizi, salgın hastalıkların ve bulaşmanın takip edilmesi,
- Daha doğru şekilde hedeflenmiş aşılar geliştirilmesi (örnek olarak yıllık grip suşlarının seçimi),
- Devasa miktarda veriyi ihtiyaçların belirlenmesi, hizmetlerin sunumu ve krizlerin öngörülmesi ve önlenmesi için -özellikle toplum sağlığında kullanılabilecek- eyleme yönelik bilgiye dönüştürme.
4. Kanıta dayalı tıp: Çeşitli yapılandırılmış veya yapılandırılmamış tıbbi, finansal, operasyonel, klinik ve genomik verileri birleştirip analiz ederek sonuçlarla tedavileri eşleştirmek, hastalık veya yeniden başvuru riski taşıyan hastaların belirlenmesi ve daha verimli bakım sağlanması.
5. Genomik analitikler: Daha verimli ve maliyet etkin gen dizileme ile genom analizi gündelik tıbbi karar sürecinin parçası haline getirmek.
6. Öngörüsel hile analizi: Hile, gereksiz veya kötü kullanımı azaltmak için çok sayıda provizyon isteğini hızlı şekilde analiz etmek.
7. Uzaktan takip: Güvenlik takibi veya yan etki tahmini için hastanede veya evde bulunan aygıtlardan eş zamanlı çok ve hızlı veri almak ve analiz etmek.
8. Hasta profil analitikleri: Hasta profillerine segmentasyon ve prediktif modelleme gibi ileri analitik teknikleri uygulayarak proaktif bakım veya yaşam değişikliğinden yararlanabilecek hastaları belirleme (örnek olarak diabet gibi bir hastalığa yakalanma riski olanlardan istifade edebilecek olanlara önleyici bakım uygulanması)
Özetle, büyük veri analitikleri ile veriler ve örüntüler arasındaki ilişki ve eğilimler anlaşılarak ve keşfedilerek bilinçli kararlar verilebilir, bakım kalitesinin artırılması ve maliyetlerin azaltılması sağlanabilir. Sağlıkta büyük veri analitikleri potansiyeli için çok çeşitli senaryolar sunulabilir. Hasta özellikleri, maliyet ve bakım sonuçları analiz edilerek klinik olarak en maliyet etkin çözümler tanımlanabilir, buna yönelik analiz ve araçlar sunulabilir.
Büyük veri teknolojileri:
Büyük veri projelerindeki kavramsal çerçeve geleneksel sağlık bilişimi veya analitik projelerle hemen hemen aynıdır. Aradaki fark ise projenin nasıl yürütüleceğiyle ilgilidir. Sıradan sağlık analitiklerinde analiz bir masaüstü yada diz üstü bilgisayara yüklenen iş zekası araçları ile gerçekleştirilebilirken, büyük veride süreç çoklu işlem düğümlerine bölünerek yürütülür. Aslında dağıtık işleme kavramı yıllardır mevcuttur. Yeni olan bunun büyük veri kümelerinde daha doğru kararlara yönelik bilgiler üretmek için kullanımıdır. Hadoop/MapReduce gibi bulut ortamında mevcut açık kaynak platformları sağlık alanında büyük veri uygulamalarını teşvik etmektedir.
Geleneksel analitik araçlarla karşılaştırıldığında büyük veri analitiklerinde algoritmalar ve modeller benzeşirken, geleneksel araçların kullanıcı dostu arayüzleri büyük veri analitiklerinde tamamen farklılaşmaktadır. Büyük veri analitik araçları oldukça karmaşık, programlama yoğun ve çeşitli becerilerin uygulanmasını gerektiren araçlardır.
Büyük veri analitikleri için ilk aşama hedeflenen verilerin bir havuzda toplanmasıdır. İkinci aşamada ham veri işlenir yada dönüştürülür. Bunda da çeşitli seçenekler mevcuttur. Web servislerle (middleware) beraber servis yönelimli (service-oriented) mimari yaklaşım bir seçenektir. Burada veri hâlâ ham kalır ve servisler veriyi çağırmak ve işlemek için kullanılır. Bir diğer yaklaşım verinin farklı kaynaklardan toplanarak bütünleştirildiği ve sonra işlemeye hazır hale getirildiği veri ambarları olabilir. Bunlar da eş zamanlı olamazlar. Özümleme, dönüştürme ve yükleme (extract, transform, and load, ETL) basamakları ile farklı kaynaklardan alınan veriler temizlenir ve hazır hale getirilir. farklı kaynaklardan alınan verinin yapılandırılmış veya yapılandırılmamış olmasına göre büyük veri analitikleri platformuna farklı veri türleri girdi olabilir.
Sonrasında, veri toplama yaklaşımı, dağıtık tasarım, araç seçimi, analitik modeller açısından çeşitli kararlar alınmalıdır. Sonuçta sağlıkta büyük veri uygulamalarında sorgular, raporlar, OLAP ve veri madenciliği olarak dört tipik uygulama görülür. Görselleştirme bu dört uygulama sonrasındaki unsurdur.
Büyük veri analitiklerinde en bilinen büyük veri analitikleri platformu açık kaynak dağıtık veri işleme platformu olan Hadoop (Apachee platformu)’dur. CouchDB ve MongoDB ile beraber NoSQL teknolojileri sınıfında yer alan Hadoop potansiyel olarak çok büyük veri kümelerini çok sayıda sunucuya (düğüm) bölüştürüp burada çözülen parçaları sonuçta birleştirerek çalışmaktadır. Hem veri organizasyonu hem de analizinde iş görebilir. Avantajlarına rağmen kurulum, konfigürasyon ve yönetimi zor olabilir. AWS, Cloudera, Hortonworks ve MapR Technologies gibi çeşitli satıcılar açık kaynak Hadoop platformları dağıtmaktadır. Ayrıca IBM BigInsights gibi ticari seçenekler de mevcuttur.
Sağlıkta büyük veri metodolojisi:
Sağlıkta büyük veri metodolojisi için dört basamaklı bir çerçeve önerilmektedir.
1. Kavramsal çalışma: Öncelikle farklı disiplinlerden uzmanlardan oluşan büyük veri analitikleri takımı bir “kavramsal açıklama” geliştirir. Sağlıkta büyük veri analitikleri projesi için gerekçe veri büyüklük, hız, çeşitlilik ve doğruluğu (4V) açısından belirlenmelidir. Farklı çözümlerin birbirine göre maliyet ve etkinliği değerlendirilmelidir.
2. Öneri geliştirme: Bu aşamada kavramsal çalışmaya dayalı olarak “Çözülecek problem nedir?”, “Niçin önemli ve ilginçtir?”, “Niçin büyük veri analitikleri kullanılmalı?” gibi soruların cevapları aranır. Büyük veri analitiklerinin maliyet ve karmaşıklığı geleneksel yaklaşımlardan oldukça fazladır. Bu yüzden bu sorgulama önem taşımaktadır. Ayrıca, proje ekibi daha önce bu konuda yapılan proje ve araştırmalar hakkında da bilgi sağlamalıdır.
3. Metodoloji: Kavramsal tanımlama detaylandırılarak alt aşamalara bölünür. Bu arada bağımlı ve bağımsız değişkenler tanımlanır. Veri kaynakları belirlenir. Veriler analitik evreye hazırlanmak üzere depolanır, tanımlanır ve dönüştürülür. Bu aşamada en önemli konulardan birisi de kullanılacak platform ve araçların seçimidir. Sonrasında çeşitli bütük veri teknikleri verilere uygulanır. Bir seri analiz ve tekrardan sonra büyük veri analitiklerinden çeşitli öngörüler elde edilir. Bu öngörüler bilgiye dayalı kararın temeli olacaktır.
4. Test ve değerlendirme: Bu aşamada modeller ve bunların bulguları test edilerek değerlendirilir ve eylem için paydaşlara sunulur.
Sonuç:
Sağlıkta büyük veri ile ilgili olarak çok sayıda zorluk da söz konusudur. Öncelikle veriler çoğunlukla farklı ortamlarda dağıtık şekilde depolanmaktadır ve birbirleri ile entegre değildir. Büyük veri analitikleri kapsamında güvenlik ve mahremiyetle ilgili problemlerin doğası ve boyutu da değişmektedir. Kimliksizleştirme bir zorunluluk olarak görülmekteyse de bunun çeşitli bilgilerin elde edilmesinde (yeniden başvuru oranı gibi) problemlere yol açtığı bilinmektedir. Ayrıca pazar rekabetine ilişkin kıymetli bilgiler sağlayabildiğinden veri paylaşımı konusunda farklı paydaşlar gönülsüz davranabilmektedir. Sonuçta, çözümlerin hasta verilerinin güvenliği ile veri bütünlük ve kullanılabilirliği arasında uygun bir denge sağlaması gerekmektedir.
Yenilikçi teknolojilerin veri toplama, depolama, işleme alanlarında sağladığı teknolojik imkan ve kabiliyetler, sağlıkta bilgi üretimi ve uygulamaya dahil edilmesi süreçlerini dramatik olarak değiştirmeye adaydır. Ancak dönüşümün sadece teknolojik alt yapı olarak değil, kültür, değer, liderlik ve organizasyonel yapılanmayı da içerecek şekilde projelendirmesi gerekecektir.
Son olarak bir önceki yazımızdaki vurguyu tekrar hatırlatalım; birey, makine ve veri ilişkisini süreklilik içerisinde tesis eden dördüncü sanayi devrimi çağında, öğrenen sağlık sistemi tesis edilmeden ve “veriye dayalı” yaklaşımlarla eyleme yönelik (actionable) bilgi üreticisi olmayı beceremeden sağlık alanında rekabet edebilmek çok zor görünmektedir.
Önerilen ilave okumalar:
Dördüncü sanayi devrimi (4): Sağlık alanında fırsatlar
Öğrenen sağlık sistemi ve dördüncü sanayi devrimi
Veri bilimci nasıl olunur? [İnfografik]
Sağlıkta büyük verinin kullanımı
Kaynaklar:
1. Raghupathi, Wullianallur; Raghupathi, Viju. Big data analytics in healthcare: promise and potential. Health Information Science and Systems. 2014, 2:3. Erişim Tarihi: 18 Şubat 2016.
2. Marr, Bernard. How Big Data Is Transforming Medicine. Forbes-Tech. Yayın Tarihi: 16 Şubat 2016. Erişim Tarihi: 18 Şubat 2016.
3. Salas-Vega, Sebastian; Haimann, Adria; Mossialos, Elias. Big Data and Health Care: Challenges and Opportunities for Coordinated Policy Development in the EU. Health Systems & Reform, 2015, 1;4:285-300. Erişim Tarihi: 18 Şubat 2016.
4. White, Susan E. A review of big data in health care: challenges and opportunities. Open Access Bioinformatics. 2014:6:13-18. Erişim Tarihi: 18 Şubat 2016.
5. Hansen MM, Miron-Shatz T, Lau AY, Paton C. Big Data in Science and Healthcare: A Review of Recent Literature and Perspectives. Yearb Med Inform. 2014 Aug 15;9:21-6. Erişim Tarihi: 18 Şubat 2016.
6. Braunstein, Mark L. Health Big Data and Analytics. in: Practitioner’s Guide to Health Informatics. Springer International Publishing, Switzerland, 2015.
Yorum yapabilmek için kayıtlı kullanıcı olmanız gerekmektedir. Giriş