Izvori velikih podataka u medicini

by Kevin Hwang, MD, MPH; Recenzirao Richard N. Fogoros, MD

Jednostavna definicija velikih podataka u medicini je "ukupan podatak koji se odnosi na zdravlje i blagostanje pacijenata" (Raghupathi 2014). Ali koje su to vrste podataka i odakle dolaze?

Slijedi širi pregled vrsta i izvora velikih podataka od interesa za pružaoce zdravstvenih usluga, istraživače, obveznike, kreere politike i industriju.

Ove kategorije se međusobno ne isključuju, jer isti podaci mogu poteknuti iz različitih izvora.

Niti ova lista nije iscrpna, jer će praktična primena velike analize podataka svakako nastaviti da se širi.

Klinički informacioni sistemi

To su tradicionalni izvori kliničkih podataka koje su zdravstveni radnici navikli na pregled.

Elektronski zdravstveni rekordi (EHR) prikupljaju, čuvaju i prikazuju informacije kao što su demografski podaci, prošlost medicinske istorije, aktivni medicinski problemi, imunizacije, alergije, lijekovi, vitalni znaci, rezultati laboratorijskih i radioloških testova, izvještaji o patologiji, provajdera i administrativnih i finansijskih dokumenata
Elektronski medicinski podaci (EMR) nisu identični EHR-u i obično se odnose na podatke koji se čuvaju kod određenog lekara.
Razmjena informacija o zdravlju služi kao čvorišta između različitih kliničkih informacionih sistema

Registra pacijenata, koju zdravstvene organizacije održavaju svojim pacijentima, često su povezana sa EHR. Ostali registri pratiti imunizaciju, karcinom, traumu i druga pitanja javnog zdravstva na širem geografskom nivou.

Portali pacijenata omogućavaju pacijentima pristup ličnim zdravstvenim informacijama uskladištenim u EHR zdravstvene organizacije. Neki portali za pacijente takođe omogućavaju korisnicima da zatraže punjenje na recept i razmene sigurne elektronske poruke sa timom za zdravstvenu zaštitu.

Kliničko skladište podataka agregira podatke na nivou pacijenta iz više kliničkih informacionih sistema, kao što su EHR i drugi izvori navedeni gore

Potražuje podatke od obveznika

Javni obveznici (npr. Medicare) i privatni obveznici imaju velike zbirke podataka o potraživanjima svojih korisnika. Neki zdravstveni osiguranika sada takođe pružaju podsticaje za podjelu vaših zdravstvenih podataka.

Istraživačke studije

Istraživačke baze podataka sadrže informacije o učesnicima u studiji, eksperimentalnim tretmanima i kliničkim rezultatima. Velike studije obično sponzorišu farmaceutske kompanije ili vladine agencije. Aplikacija personalizovane medicine je da odgovara pojedinačnim pacijentima efikasnim tretmanima, na osnovu obrasca u podacima kliničkog ispitivanja.

Ovaj pristup se kreće izvan primene principa medicine zasnovanih na dokazima, pomoću kojih zdravstveni radnik utvrđuje da li pacijent deli široke karakteristike (npr. Starost, pol, rasa, klinički status) sa učesnicima u suđenju. Uz pomoć velike analize podataka, moguće je odabrati tretman zasnovan na mnogo granularnijim informacijama, kao što je genetski profil pacijentovog karcinoma (pogledajte dole).

Klinički sistemi za podršku odlučivanju (CDSS) takođe se brzo razvijaju i sada predstavljaju veliki dio veštačke inteligencije (AI) u medicini.

Oni koriste podatke o pacijentu kako bi pomogli kliničarima u njihovom donošenju odluka i često su kombinovani sa EHR.

Genetske baze podataka

Skladište ljudskih genetskih informacija i dalje se nagomilava brzim tempom. S obzirom da je Projekat ljudskog genoma završen 2003. godine, troškovi sekvenciranja ljudskih DNK su smanjeni za milion puta. Projekat ličnog genoma (PGP), započet 2005. godine od strane Harvardove medicinske škole, traži da redovno i objavljuje kompletne genome od 100.000 volontera iz celog sveta. Sama PGP je sjajan primer velikog projekta podataka, zahvaljujući velikom obimu i raznolikosti podataka.

Lični genom sadrži oko 100 gigabajta podataka. Osim sekvenciranja genoma, PGP takođe prikuplja podatke iz EHR-ova, anketa i profila mikrobioma.

Veliki broj kompanija nudi genetske sekvencioniranje direktno-potrošačima za zdravlje, lične osobine i farmakogenetiku na komercijalnoj osnovi.

Ove lične informacije mogu biti podređene velikoj analizi podataka. Na primjer, 23and mi je prestao da ponudi zdravstvene genetske izvještaje novim kupcima od 22. novembra 2013. godine, da bi se pridržavala američke administracije za hranu i liječenje. Međutim, u 2015. godini kompanija je ponovo počela da ponudi određene zdravstvene komponente svog testa genetske pljuvačke, ovoga puta uz odobrenje FDA-e.

Public Records

Vlada vodi detaljne podatke o događajima vezanim za zdravlje, kao što su imigracija, brak, rođenje i smrt. Popis Sjedinjenih Američkih Država je prikupio ogromne količine informacija svakih 10 godina od 1790. godine. Popisna statistička internet prezentacija imala je 370 milijardi ćelija od 2013. godine, sa dodatnih 11 milijardi više godišnje.

Web pretraga

Informacije za pretraživanje putem Interneta koje su sakupljale Google i drugi provajderi za pretraživanje weba mogu pružiti uvid u realnom vremenu vezano za zdravlje stanovništva. Međutim, vrednost velikih podataka iz web pretraživanja može se poboljšati kombinovanjem sa tradicionalnim izvorima podataka o zdravlju.

Društveni mediji

Facebook, Twitter i druge platforme društvenih medija generišu bogat izbor podataka za sat vremena, dajući pogled na lokacije, zdravstveno ponašanje, emocije i društvene interakcije korisnika. Primena velikih podataka društvenih medija na javno zdravlje nazvano je kao otkrivanje digitalnih bolesti ili digitalna epidemiologija. Na primjer, Twitter se koristi za analizu epidemije gripe među opštom populacijom.

Svetski projekat blagostanja koji je započeo na Univerzitetu u Pensilvaniji je još jedan primer proučavanja društvenih medija da bolje razumeju iskustva i zdravlje ljudi. Projekat okuplja psihologe, statističare i računovođe koji analiziraju jezik koji se koristi prilikom interakcije na mreži, na primer, prilikom pisanja statusnih ispravki na Facebooku i Twitteru. Naučnici posmatraju kako se jezik korisnika odnosi na njihovo zdravlje i sreću. Napredak u obradi prirodnog jezika i mašinskom učenju pomažu u njihovim naporima. Nedavna publikacija sa Univerziteta u Pensilvaniji istražila je načine predvidjanja mentalnih bolesti analizom društvenih medija. Izgleda da se simptomi depresije i drugi mentalno-zdravstveni uslovi mogu otkriti proučavajući našu upotrebu interneta. Naučnici se nadaju da će u budućnosti ove metode biti u stanju da bolje identifikuju i pomognu pojedincima iz rizika.

Internet stvari (IoT)

Veliki podaci o zdravstvenim informacijama se takođe prikupljaju i čuvaju na mobilnim i kućnim uređajima .

Smartphone : Hiljade mHealth aplikacija prikuplja informacije o fizičkoj aktivnosti korisnika, unosu u ishrani, uzorcima spavanja, emocijama i drugim parametrima. Prirodne aplikacije za mobitele (npr. GPS, e-pošta, slanje tekstova) takođe mogu dati zaključke o zdravstvenom stanju pojedinca.
Nosivi monitori i uređaji: pedometri, akcelerometri, čaše, satovi i čipovi ugrađeni pod kožu takođe prikupljaju informacije vezane za zdravlje i mogu ih poslati u oblak.
Telemedicinski uređaji omogućavaju pružateljima zdravstvene zaštite da prate parametre pacijenata kao što su krvni pritisak, otkucaj srca, brzina disanja, oksigenacija, temperatura, EKG tracings i težina.

Finansijske transakcije

Transakcije kreditnih kartica pacijenata uključene su u prediktivne modele koje koristi sistem Carolinas HealthCare za identifikaciju pacijenata koji su pod visokim rizikom da bi bili ponovo dopušteni u bolnicu. Zdravstveni službenik iz Šarlotte koristi velike podatke da podeli pacijente u razne grupe, na primjer, na osnovu bolesti i geografske lokacije.

Etičke i privatne implikacije

Treba istaknuti da u nekim slučajevima mogu biti važne etičke i privatne implikacije prilikom prikupljanja i pristupa podacima u zdravstvenoj zaštiti. Novi izvori velikih podataka mogu poboljšati naše razumijevanje uticaja pojedinaca i zdravlja stanovništva, međutim, različiti rizici treba pažljivo razmatrati i pratiti. Sada je takođe priznato da podaci koji su ranije smatrani anonimnim mogu se ponovo identifikovati. Na primer, profesor Latanya Sweeney iz Harvardovog Data Privacy Lab-a pregledala je 1.130 volontera uključenih u Projekat ličnog genoma. Ona i njen tim su uspeli da ispravno imenuju 42 posto učesnika na osnovu informacija koje su dijelili (poštanski broj, datum rođenja, pol). Ovo znanje može povećati svijest o potencijalnim rizicima i pomoći nam da donosimo bolje odluke o dijeljenju podataka.

> Izvori:

> Conway M, O'Connor D. Socijalni mediji, veliki podaci i mentalno zdravlje: aktuelni napredak i etičke implikacije. Sadašnje mišljenje u psihologiji 2016; 9: 77-82.

> Fernandes L, O'Connor M, Weaver V. Veliki podaci, veći ishodi. Časopis Američkog udruženja za upravljanje zdravstvenim informacijama 2012; 83 (10): 38-43

> Guntuku S, Yaden D, Kern M, Ungar L, Eichstaedt J. Otkrivanje depresije i mentalnih bolesti na društvenim mrežama: integrativni pregled . Aktuelno mišljenje o bihevioralnim naukama 2017; 18: 43-49.

> Lazer D, Kennedy R, King G, Vespignani A. Parabola Google gripa: pasti u velikoj analizi podataka . Nauka 2014; 343 (6176): 1203-1205.

> Raghupathi W, Raghupathi V. Velika analiza podataka u zdravstvu: obećanje i potenti al. Zdravstvene informacione nauke i sistemi 2014; 2: 3.

> Sweeney L, Abu A, Winn J. Prepoznavanje učesnika u projektu ličnog genoma po imenu . Univerzitet Harvard. Data Privacy Lab. Bijeli papir 1021-1. 24. aprila 2013. godine.