Sağlıkta büyük veri kullanımı toplum sağlığı, yönetim, hizmet kalite karşılaştırmaları, gelir döngüsü yönetimi, öngörüsel analitikler ve klinik karar destek gibi operasyonel ve klinik işlemlerde giderek vazgeçilmez hale gelmektedir. Büyük veri dendiğinde -ilk olarak 2001 yılında Gartner analisti Doug Laney ve sonrasında diğer araştırmacılar tarafından- üç temel özellik vurgulanmıştır; volume (miktar), velocity (hız) ve variety (çeşitlilik). Sonradan bunlara dördüncü olarak veracity (doğruluk) de eklenmiştir. Ardından bunları pek çok yeni “V” terimi takip etmiştir; value, visualization, viability, vulnerability, volatility, ve validity… Bunların herbiri büyük verinin organizasyonlar tarafından anlaşılması gereken özel bir yönünü ifade etmektedir.
Peki, sağlıkta bu “V”lerin anlamı nedir ve neye karşılık gelmektedir?
Volume (miktar): Ne kadar veri mevcut?
2014 EMC verilerine göre , 2013 yılı itibarıyla dünyada 4.4 zettabyte veri bulunmaktadır. Bunun her yıl iki kat artarak 2020’ye kadar 44 zettabyte (44 trilyon gigabyte) olması beklenmektedir. Bu verilerin çoğunluğu geçicidir ve onyılın sonuna kadar dünya veri varlığının -düzgün şekilde etiketlenip düzenlenirse- ancak %35’inin analitik işlemler için yararlı olabileceği düşünülmektedir.
Sağlık alanında klinik notlar, sigorta verileri, laboratuvar sonuçları, gen dizileri, tıbbi cihaz verileri ve görüntüleme çalışmaları gibi analitik işlemler için elverişli veriler mevcuttur ve bunlar yeni yaklaşımlarla ilişkilendirildiğinde çok daha yararlı olabilir. Bu nedenler organizasyonlar ellerindeki yüklü miktardaki verileri idare edebilmek için bulut gibi depolama teknolojileri geliştirmelidir. Ayrıca, EHR erişimi veya hizmet sağlayıcı kurumlar arası iletişim gibi önemli işlevler yavaşlatılmaksızın büyük verinin diğer “V”leriyle de uyumlu olacak şekilde bilişim altyapıları düzenlenmelidirler.
Velocity (hız): Veri ne kadar hızlı oluşturulur, taşınır veya erişilir?
IBM’e göre günde 2.5 quintillion byte (yani 2.5 milyon terabyte) veri oluşturulmaktadır. Bu 10 milyon Blu-ray disk alanını kaplar. Sağlık verileri bunların önemli bir bölümünü oluşturur ve nesnelerin interneti, tıbbi cihazlar, genomik testler, makine öğrenimi, doğal dil işleme, diğer yeni veri üretme ve işleme teknikleriyle bu miktar daha artmaya devam edecektir.
Yoğun bakım ünitesindeki yaşamsal hasta bulguları gibi bu verilerin bir kısmının bakım verilen noktada gerçek zamanlı olarak güncellenmesi ve görüntülenmesi gerekmektedir. Zira bu gibi olgularda sistemin tepki süresi hizmet verici kurumlar için önemli bir ölçüdür. Geri kabul raporları veya hasta toplama oranları gibi diğer veri kümeleri ise organizasyonda negatif bir etki oluşturmadan daha yavaş bir yol izlemeye eğilimlidir.
Her verinin akışını aşırı hızlandırmaya çalışmak kaynakların uygun kullanımını sağlamaz ve mümkün de değildir. Ancak hangi veri kaynaklarına aylar yerine günler veya haftalar içinde erişimin önemli olduğunu tanımlamak hizmet sağlayıcının kalite raporlama ve uygulama geliştirmesi açısından fırsat sunacaktır.
Variety (çeşitlilik): Kaç farklı türde kaynak vardır?
Sağlık kurumlarında çok farklı tür ve boyutta veriler üretilir, toplanır ve depolanır. Veriler ve bunlardan üretilen bilgiler ne kadar fazla ve çeşitli olursa geleceğe ilişkin öngörüler de o kadar isabetli olabilir.
Bazıları büyük verinin gerçekte miktardan çok işleme karmaşılığından kaynaklandığı ifade etmektedir. Daha önceden birbiri ile ilişkilendirilmemiş iki veyda fazla veri kümesi veya geleneksel işleme teknikleri ile işlenemeyecek derecede karmaşık veriler büyük veri kapsamında ele alınabilir.
Sağlık alanında standardize edilmemiş başıboş veri toplama ve işleme etkinlikleri ayrı yerlerde, uyumsuz formatlarda veri toplanmasına yol açmıştır. Bu veri setleri karşılaştırılamamakta, işlenerek eyleme yönelik bilgiye dönüştürülememektedir. Sağlık bilişimi geliştiricileri, bu sorunu aşmak üzere uygulama programlama arabirimleri (API) ve FHIR gibi yeni standartlardan yararlanmayı planlamaktadırlar.
Veracity (doğruluk): Veriye güven duyabilir miyiz?
Hasta bakımı söz konusu olduğunda “güven” parametresi erişime göre daha da önemli olabilir. Bir veri kümesinin doğru olup olmadığını doğrulamak zordur. Ancak hizmet sağlayıcılar eksik, önyargılı veya gürültüyle dolu verilerden türetilmiş bilgileri kullanamaz. İddialara göre veri bilimcileri, verileri kullanmadan önce temizlemek için zamanlarının %60 kadarını harcamaktadırlar. Bu süre sağlık alanındaki analistler için daha da yüksek olabilir.
Hizmet sağlayıcılar, veri bütünlüğünü ve veri kalitesini yükseltmek için sürekli uğraşmak istemezler. Pek çok sistem serbest metin veya diğer yapılandırılmamış girdilere izin verirken, analistler başarıya kolay ulaşamaz. Veri yönetişimi ve yakın bileşeni bilgi yönetişimi sağlık kuruluşlarında kilit stratejilerdir ve bunun için de verilerin temiz, eksiksiz, standart ve hazır olmasını sağlamak gerekmektedir.
Validity (geçerlilik): Veriler doğru ve hatasız mı?
“Veracity”ye benzer şekilde “validity” de klinisyen ve araştırmacılar için başlıca kaygı nedenlerinden biridir. Bir veri seti tam olabilir fakat bu gerçekten de kullanıcılar için ne anlam taşımaktadır? Veriler doğru mudur? Güncel midir? Bilgi, kabul edilmiş bilimsel protokol ve yöntemler kullanılarak mı üretilmiştir? Verilerin hazırlanmasından kimler sorumludur?
Sağlık veri setleri, verilerin ne zaman, nasıl ve kimin tarafından oluşturulduğunu açıklayan doğru meta verileri içermelidir. Meta veriler, analistlerin birbirlerini anlamalarını, analizlerin tekrarlanabilir olmasını ve gelecekteki veri bilimcilerin de verileri sorgulayıp aradıklarını bulmalarını sağlar.
Viability (uygulanabilme): Veri eldeki olguyla ilişkili midir?
İki veri seti arasında ilişki olması nedensellik bulunduğu anlamına gelmez. Güvenilir sonuçlar üretmek için hangi veri elemanlarının bağlantılı olduğunu anlamak önemlidir. Bunu yapmak için kuruluşların sahip oldukları verilerin analiz için kullanabilecek kadar sağlam olup olmadıklarını, çıkan sonuçların bilgilendirici mi yoksa sadece ilginç bir sapma mı olduğunu anlamaları gerekmektedir.
Bazı ölçümlerin veya özelliklerin uygulanabilirliğinin sağlanması muhtemelen bir deneme yanılma süreci gerektirecektir. (Twitter’daki hava kirliliği mesajları ile astımdan dolayı acil servise başvuranlar arasında bağıntı olup olmaması gibi). Birçok öngörüsel analitik projesi şu anda belirli hasta davranışlarını veya klinik sonuçları ayrıntılı bir şekilde ortaya koyan yenilikçi değişkenleri tanımlamaya odaklanmıştır. Daha fazla veri kümesi elde edildikçe bu süreç şüphesiz devam edecektir.
Volatility (öngörülemezlik): Veri ne sıklıkla değişir?
Sağlık verileri hızlı bir şekilde değişir. Bu da karşımıza verinin ne kadar süre anlamlı olacağı, hangi tarihsel metriklerin analize dahil edileceği, arşivlenmeden veya silinmeden önce ne kadar süre ile depolanacağı gibi soruları getirir.
Verilerin miktarı günlük olarak büyümeye devam ederken, bu kararlar artarak önem kazanacaktır. Veri depolamanın maliyeti, çoğu sağlık bilişimi bölümü için bir kaygı unsurudur, zira hizmet sağlayıcıları tarafından HIPAA gereği belirli hasta verilerinin en az altı yıl süreyle tutulması gerekmektedir. Sağlık alanında yüksek devir hızlı ve az kullanılabilirliği olan analitiklerden ziyade genomik test sonuçları gibi çok uzun süreler boyunca kararlı ve tekrar kullanılabilir verileri kullanmak daha uygun olabilir.
Vulnerability (zarar görebilirlik): Veriyi güvenli tutabilir miyiz?
Son yıllarda sağlık alanında yaşanan güvenlik ihlalleri oldukça sık olarak gündeme gelmeye başlamıştır. Özellikle depoların bulut ortamına taşındığı, organizasyonlar arasında veri değişiminin arttığı günümüzde güvenlik, sağlık sanayi için öncelikli bir konuma yükselmiştir.
2016 yılında ABD’de hastanelerin yaklaşık üçte biri, bir önceki yıla göre veri güvenliği için daha fazla para harcadıklarını ifade etmişlerdir-ki bu da WannaCry gibi büyük ölçekli saldırılardan önceydi. Veri güvenliğinden endişe duyan kuruluşlar, verileri mahrem ve güvenli tutma konusunda çalışanlarını düzenli olarak eğitmeli, sağlık alanındaki katı mahremiyet ve güvenlik kurallarına uymaları için iş ortakları ile mevzuat doğrultusunda iş ortaklığı sözleşmeleri imzalamalıdırlar.
Visualization (görselleştirme): Veri kullanıcıya nasıl sunulabilir?
Yoğun acil bölümünde veya telaşlı bir yoğun bakım biriminde verileri açık ve sezgisel şekilde görselleştirmek, bu öngörüleri kullanmak veya görmezden gelmek arasındaki farkı oluşturabilir. Klinisyenler elektronik sağlık kayıt arayüzlerinin kullanışlı olmasını isterler. Çok fazla tıklama, çok fazla uyarı ve her şeyin yapılabilmesi için yeterli zaman olmadığında şikayetçi olurlar. Yoğun ve anlaşılması zor raporlar sunarak, bir klinisyenin günlük iş akışının bir parçası olan bilgi işleme sürecini daha da karmaşıklaştırmak yalnızca kullanıcıların sistemden daha da uzaklaşmasına yol açar.
Geliştiriciler, okuyucuyu rakamlara boğmadan, önemli kısımları vurgulayacak şekilde renkli grafikler kullanarak görselleştirme yapmalıdır. Verileri anlamlı şekilde filtrelemek aşırı bilgi yüklemeyi önlemeye ve klinisyenlerdeki tükenmişlik hissini hafifletmeye yardımcı olabilir.
Etkileşimli gösterge tabloları son kullanıcılara finansal, operasyonel veya klinik ölçütleri sunmak için başka bir seçenektir. Masaüstü bilgisayarlar, tabletler ve hatta akıllı telefonlar için geliştirilen yeni uygulamalar kullanıcılara anlamlı etkileşim imkanı sağlarken, çevrimiçi haritalama araçları yerel ve ulusal düzeyde halk sağlığı problemlerini veya teknoloji kabul oranlarını görselleştirmede giderek popüler hale gelmektedir.
Value (değer): Bu veriler anlamlı yatırım getirisi (return of investment) üretir mi?
Nihayetinde analitiklerle uğraşmanın nedeni eldeki bilgilere bir miktar değer katmaktır. Bu değer ister daha iyi sonuç, ister gelişmiş iş verimliliği veya daha akıllı stratejik karar verme olsun, sağlık kuruluşları büyük verilerle ilgili “son zamanlarda ne işime yaradı?” sorusunu görmezden gelemezler. En küçük sağlık kuruluşu için bile veriler yeterince çok boyutlu ve karmaşık olacağından, analitikten değer elde etmek için işe özel kullanım örneklerini tanımlamak başlanacaktır.
Diyabetik bir popülasyonu tanımlama, sepsisi öngörme, finansal performansı raporlama, bir sağlık sisteminde gelir kaybını belirleme veya kanser hastasına en son hassas ilaç tedavisi önerme vs., bunların hepsi büyük veri analitikleri ile erişilebilecek, net yatırım getirisi sağlayan önemli görevlerdir.
Birçok sağlık kuruluşu, bu hedeflere ulaşmayı sağlayacak becerilerin geliştirilmesinin ilk aşamalarındadır ve gerçek dünyadaki problemlere uygulanabilecek “eyleme yönelik” bilgiler üretmek karmaşık ve zor bir görevdir. Burada değer ayrıca güçlü veri yönetimi ilkeleri, sağlam bilişim mimari altyapısı, güvenilir nitelikli veri bilimcileri ve son kullanıcılara kadar anlayış yayan yaklaşımları benimseyenler olacaktır. Sağlıkta büyük verinin V’leri gelecekte daha da artabilir. Ancak şüphesiz “değer” parametresi, veriye dayalı karar verme sürecinde izlenen en önemli metrik olmaya devam edecektir.
Kaynaklar:
Jennifer Bresnick. Understanding the Many V’s of Healthcare Big Data Analytics. HealthITAnalytics, 05 Haziran 2017. Erişim tarihi: 19 Aralık 2017.
Yorum yapabilmek için kayıtlı kullanıcı olmanız gerekmektedir. Giriş