San Francisco, USA. «Medisinsk forskning beveger seg like sakte som en isbre, i sammenligning med det jeg er vant til fra internett», sier Brin til teknologibladet Wired.
Nå ønsker han å bruke sin ekspertise innen avanserte algoritmer for å analysere data, sammen med dagens enorme databehandlingskapasitet, til å finne en kur for Parkinsons sykdom. Før han selv blir rammet av sykdommen.
For snevert. Der tradisjonell medisinsk forskning starter med en hypotese som så blir testet, vil Brin begynne med innsamling av data. Store mengder data. Disse dataene vil så bli analysert for å finne mulige hypoteser, eller for å teste hypoteser som andre har kommet frem til. Som da Brin bidro med over 20 millioner kroner til et prosjekt i regi av hans hustrus selskap, gentestingselskapet «23andme». De samler inn genetisk og annen informasjon hos mange tusen Parkinsons-pasienter, for å finne mulige sammenhenger. Da et vanlig medisinsk forskningsprosjekt kom frem til en sammenheng mellom Parkinson og en annen genetisk sykdom, Gauchers sykdom, gjorde Brins gruppe et raskt søk i «23andme» sin database, og kom frem til det samme resultatet.
«Det spennende med denne typen forskning er den bredden av muligheter det tester. Mange medisinske oppdagelser har kommet mer tilfeldig, små ting som har skjedd som folk oppdaget. Det kan ha vært tiøringen de så under gatelyset. Men hvis du hadde lyst opp hele gaten, ville du kanskje sett at det er tiøringer overalt. Du vet bare ikke om det. Dette er et forsøk på å lyse opp hele gaten», sa Brin til Wired.
Revolusjon. Leder for The Parkinsons Institute i Sunnyvale, Dr J. William Langston, mener databasert forskning kan være begynnelsen på en ny tidsalder innen medisinsk forskning.
«Vi som jobber innen medisin, har ligget langt bak i bruken av store datasett, blant annet fordi data har vært vanskelig å få tak i», sier Langston.
The Parkinsons Institute er én av organisasjonene som har fått støtte fra Sergey Brin, en annen er The Michael J. Fox Foundation.
«Da jeg begynte i nevrologi, var det gjerne bare 10–20 testobjekter. Det tallet har gradvis gått opp, til 100, 500 og sogar 1000. Men med moderne genetikk og datamaskiner er disse tallene små», sier Langston.
Han viser til den enorme databasen til NHS, Storbritannias nasjonale helsetjeneste, som et eksempel på prosjekter som allerede har, og bruker store mengder data til analyse.
«Jeg tror dette kan være begynnelsen på et fjerde paradigme innen forskning. At dette er noe vi ikke har hatt før, og ikke ennå kjenner rekkevidden av. Vi kan kartlegge og sekvensere det menneskelige genomet, eller arvematerialet, nå, men ikke uten superdatamaskiner.»
Farene. Andre erfarne medisinske forskere er skeptiske til Brins tilnærming til medisinsk forskning, og påpeker at vi kan ende opp med en rekke falske sammenhenger hvis data samles inn før en har en hypotese. Feilslutningen om presisjonsskytteren fra Texas, hvor skytteren skjøt på låvedøren først, og så tegnet på målskiven etterpå slik at flest mulig skudd traff innertier, blir trukket frem som et mulig varsku. Et annet problemområde er at slike store datasett blir sett på som rotete, og at det er for mye informasjon til å kunne trekke slutninger.
«Jeg tror vi kan håndtere rotete data så lenge tallene er store nok», sier Langston.
Han mener at antallet forskningsobjekter gjør at en reduserer faren for å komme frem til feilaktige sammenhenger. Og at de store datasettene ikke bare vil bli brukt til å komme opp med nye hypoteser, men også vil kunne brukes til å teste tidligere hypoteser, som i tilfellet med prosjektet til «23andme».
Innsamlingsproblemet. Datainnsamling er et av de store problemene innen medisinsk forskning i dag, da det er vanskelig å få folk til å delta.
«Selv om en aldri kan være sikker på at folk vil delta, så er vår erfaring med datainnsamling via internett oppmuntrende. Blant de pasientstøttegruppene vi har med å gjøre, er det vanligste spørsmålet folk stiller; hvordan kan jeg delta for å fremme forskning på min sykdom? Ved å gjøre ting på nettet, senkes terskelen slik at alle kan delta», sier Langston.
Slike skjemaer kan også være lærerike for den som fyller ut skjemaet, fordi en kan legge inn lenker til informasjon i tilknytning til spørsmålene, på en måte som ikke vil være mulig på papir. I tillegg vil det være betydelig rimeligere enn å sende folk rundt med spørreskjemaer, og gir større mulighet for langvarige studier som i dag blir sett på som for dyre.
At den informasjonen folk kommer med selv ikke er like pålitelig som hvis den kom fra medisinsk personell, vil også være et mindre problem så lenge det er nok forskningsobjekter.
Uante muligheter. Bruken av stadig større databehandlingskapasitet vil også kunne skape en ny hverdag innen andre medisinske områder. Et eksempel er operasjoner ved hjerteflimmer. I dag kan en ved hjelp av MRI simulere hvordan hjertet til en bestemt pasient fungerer, og hvilken effekt ablasjon (der en brenner en del av hjertet som forårsaker flimmeret) vil ha, og hvor det vil ha best effekt.
Problemet er at det i dag tar altfor lang tid å gjøre denne simuleringen detaljert nok. Det er så mange variabler knyttet til en simulering av hjertet, at det tar hundrevis av timer å simulere ett enkelt slag nøyaktig på en superdatamaskin, og dermed vil det ta måneder før en har funnet ut nøyaktig hvor en skal gjennomføre ablasjonen. Ettersom databehandlingen vil gå stadig raskere, håper forskere at det etter hvert vil være mulig å gjøre dette i løpet av noen få dager.
Sergey Brins håp er at det vil skje en datarevolusjon innen den medisinske forskningen før han eventuelt utvikler Parkinsons selv.
I mellomtiden forebygger han sykdommen med daglig trening og et sunt kosthold.