Källor till stora data i medicin

Källor till stora data i medicin

En enkel definition av stora data i medicin är "totalt antal data relaterade till patienthälsovård och välbefinnande" (Raghupathi 2014). Men vad exakt är dessa typer av data, och var kommer de ifrån?

Nedan följer en bred översikt över typer och källor till stora data av intresse för vårdgivare, forskare, betalare, policymakers och industrin.

Dessa kategorier utesluter inte varandra, eftersom samma data kan härröra från olika källor.

Inte heller är denna lista uttömmande, eftersom den praktiska tillämpningen av stor dataanalys säkert kommer att fortsätta att expandera.

Kliniska informationssystem

Dessa är traditionella källor till kliniska data som vårdgivare är vana vid visning.

Kravsuppgifter från betalare

Offentliga betalare (t.ex. Medicare) och privata betalare har stora förvar av fordonsuppgifter på sina mottagare. Vissa sjukförsäkringsgivare erbjuder nu incitament för att dela dina hälsodata.

Forskningsstudier

Forskningsdatabaser innehåller information om studiedeltagare, experimentella behandlingar och kliniska resultat. Stora studier sponsras vanligtvis av läkemedelsföretag eller myndigheter. En tillämpning av personlig medicin är att matcha enskilda patienter med effektiva behandlingar, baserade på mönster i kliniska prövningsdata.

Detta synsätt sträcker sig bortom att använda bevisbaserade medicinprinciper, genom vilka en vårdgivare bestämmer om en patient delar breda egenskaper (t.ex. ålder, kön, ras, klinisk status) med försöksdeltagare. Med stor dataanalys är det möjligt att välja en behandling baserad på mycket mer granulär information, såsom den genetiska profilen hos en patients cancer (se nedan).

Kliniska beslutsstödssystem (CDSS) har också utvecklats snabbt och utgör nu en stor del av artificiell intelligens (AI) inom medicin.

De använder patientdata för att hjälpa kliniker med sitt beslutsfattande och kombineras ofta med europeiska forskningscentra.

Genetiska databaser

Förvaret för mänsklig genetisk information fortsätter att ackumuleras i snabb takt. Sedan Human Genome Project avslutades 2003 har kostnaden för human DNA-sekvensering minskats med en miljon gånger. Personalgenomprojektet (PGP), som lanserades 2005 av Harvard Medical School, syftar till att sekvensera och publicera de fullständiga genomerna av 100 000 volontärer från hela världen. PGP själv är ett utmärkt exempel på stort dataprojekt på grund av den stora volymen och olika data.

Ett personligt genom innehåller cirka 100 gigabyte data. Förutom sekvenseringsgener samlar PGP också data från EHR, undersökningar och mikrobiom profiler.

Ett antal företag erbjuder genetisk sekvensering för direkt till konsument för hälsa, personliga egenskaper och farmakogenetik på kommersiell basis.

Denna personliga information kan underkastas stor dataanalys. Till exempel, 23andMe slutade erbjuda hälsorelaterade genetiska rapporter till nya kunder per 22 november 2013, för att följa amerikanska Food and Drug Administration. Men år 2015 började företaget erbjuda vissa hälsokomponenter av deras genetiska salivtest igen, den här gången med FDA: s godkännande.

Offentliga poster

Regeringen håller detaljerade register över händelser relaterade till hälsa, som invandring, äktenskap, födelse och död. USA: s folkräkning har samlat stora mängder information vart tionde år sedan 1790. Folkräkningens statistikwebbplats hade 370 miljarder celler från och med 2013, med cirka 11 miljarder fler årligen.

Webbsökningar

Websökningsinformation som samlats in av Google och andra webbsökleverantörer kan ge realtidsinsikt relaterad till befolkningens hälsa. Värdet av stora data från webbsökningsmönster kan dock förbättras genom att kombinera det med traditionella hälsodata.

Sociala media

Facebook, Twitter och andra sociala medier plattformar genererar en mängd olika data dygnet runt, vilket ger en bild av användarnas placeringar, hälsorelaterade känslor och sociala interaktioner. Användningen av sociala medier stora data för folkhälsan har kallats digital sjukdomsdetektering eller digital epidemiologi. Twitter har till exempel använts för att analysera influensapidemier bland befolkningen i allmänhet.

Världen Välbefinnande Projektet som startade vid University of Pennsylvania är ett annat exempel på att studera sociala medier för att förstå människors erfarenhet och hälsa bättre. Projektet samlar psykologer, statistiker och datavetenskapare som analyserar språk som används vid interaktion online, till exempel när du skriver statusuppdateringar på Facebook och Twitter. Forskare observerar hur användarnas språk relaterar till deras hälsa och lycka. Förskott i naturligt språkbearbetning och maskininlärning hjälper till med sina ansträngningar. En ny publikation från University of Pennsylvania tittade på sätt att förutsäga psykisk sjukdom genom att analysera sociala medier. Det verkar som om symptom på depression och andra psykiska hälsotillstånd kan upptäckas genom att studera vår användning av Internet. Forskare hoppas i framtiden att dessa metoder kommer att kunna bättre identifiera och bistå riskförekomster.

Dina Internet (IoT)

Massiva trosor av hälsorelaterad information samlas också in och lagras på mobila enheter och hemutrustning .

Finansiella transaktioner

Patienternas kreditkortstransaktioner ingår i de prediktiva modellerna som används av Carolinas HealthCare System för att identifiera patienter som är i hög risk för att bli återtagna till sjukhuset. Den Charlotte-baserade vårdgivaren använder stora data för att dela patienter i olika grupper, till exempel baserat på sjukdom och geografisk plats.

Etiska och integritetseffekter

Det måste framhävas att det i vissa fall kan finnas viktiga etiska och integritetsrelaterade konsekvenser vid samla och komma åt data i vården. Nya källor till stora data kan förbättra vår förståelse för vilka konsekvenser individer och befolkningshälsa behöver, men olika risker måste noggrant övervägas och övervakas. Det har nu också erkänts att uppgifter som tidigare ansågs anonyma, kan identifieras igen. Till exempel har professor Latanya Sweeney i Harvards datasäkerhetslaboratorium granskat 1.130 volontärer involverade i persongenomprojektet. Hon och hennes team kunde korrekt namnge 42 procent av deltagarna utifrån informationen de delade (postnummer, födelsedatum, kön). Denna kunskap kan öka vår medvetenhet om potentiella risker och hjälpa oss att fatta bättre beslut om delning av data.

> Källor:

> Conway M, O'Connor D. Sociala medier, stora data och mental hälsa: nuvarande framsteg och etiska konsekvenser. Nuvarande yttrande i psykologi 2016; 9: 77-82.

> Fernandes L, O'Connor M, Weaver V. Stora data, större resultat. Journal of American Health Information Management Association 2012; 83 (10): 38-43

> Guntuku S, Yaden D, Kern M, Ungar L, Eichstaedt J. Upptäckte depression och psykisk sjukdom på sociala medier: en integrerad granskning . Nuvarande yttrande i beteendevetenskaper 2017; 18: 43-49.

> Lazer D, Kennedy R, King G, Vespignani A. Lika för Google-influensa: Fällor i stor dataanalys . Science 2014; 343 (6176): 1203-1205.

> Raghupathi W, Raghupathi V. Stor dataanalys i vården: Löfte och potenti al. Hälsoinformationsvetenskap och system 2014; 2: 3.

> Sweeney L, Abu A, Winn J. Identifiera deltagare i det personliga genomprojektet med namn . Harvard Universitet. Data Privacy Lab. Vitbok 1021-1. 24 april 2013.