Arbetsflöde

Mål och status

Det övergripande målet för Human Protein Atlas projektet är att genom antikroppsbaserad proteomik i kombination med genomik och transkriptomik, kartlägga proteinuttrycket av människans runt 20.000 proteinkodande gener i en stor mängd normala vävnader, cancerformer och celltyper. Den strategi som används för att uppnå målet involverar storskalig framställning och validering av antikroppar mot minst en isoform av samtliga proteinkodande gener. Dessa antikroppar används därefter i en mängd olika analyser, inklusive immunhistokemisk färgning av mänskliga vävnader och cancerprover, immunofluorescens i cellinjer samt för Western blot. Denna kartläggning av det mänskliga proteomet kan ses som en naturlig fortsättning på kartläggningen av det mänskliga genomet och projektet baseras i mycket hög grad på den information som vi redan har om människans arvsmassa.

Human Protein Atlas-projektet initierades 2003 och finansieras i huvudsak av Knut och Alice Wallenbergs stiftelse. Den första online-versionen av Atlasen blev publikt tillgänglig 2005. Den innehöll då data från strax över 700 antikroppar. I den senaste versionen av the Human Protein Atlas (v.19, släppt i september 2019) har proteinuttrycket från mer än 17.000 mänskliga gener analyserats med över 26.000 antikroppar, vilket motsvarar 87% av människans protein-kodande genom.

Antigen och antikroppar

Human Protein Atlas-projektet har producerat sammanlagt mer än 50,000 polyklonala antikroppar specifika mot en stor mängd olika humana rekombinant framställda proteinfragment (100-150 aminosyror), så kallade PrEST:ar (Protein Epitope Signature Tags). Samtliga antikroppar affinitetsrenas med hjälp av de proteinspecifika PrEST-fragmenten för att säkerställa att alla antikroppar binder till målproteinet. Utöver de egenproducerade antikropparna, har Human Protein Atlas även tillgång till mer än 12,000 antikroppar från över 100 olika kommersiella aktörer, tillhandahållna genom samarbeten.

Framställning av data till Tissue Atlas, Pathology Atlas och övriga sub-atlas

Alla antikroppar som godkänts för kartläggning av proteinuttryck färgas på en serie bestående av 8 olika tissue microarrays (TMAs) som innehåller sammanlagt 44 olika normala vävnader (i triplikat) och 20 olika former av cancer (vanligen 12 patienter per cancer, i duplikat). För varje antikropp färgas totalt 576 olika prov som därefter skannas in som högupplösta digitala bilder. Vävnadsbilderna annoteras manuellt av specialutbildad personal för att kartlägga antikropparnas färgningsmönster.

Efter annoteringssteget utvärderas kvalité och samstämmighet bland all tillgänglig data kopplad till en specifik gens uttryck, vilket mynnar ut i en trovärdighets-rankning (reliability score) av proteinuttryckets kartläggning. Följande data utvärderas:

  • Annoterade färgningsmönster hos de antikroppar som är riktade mot det korresponderande proteinet.

  • Normaliserade mRNA-uttrycksvärden (NX) för samtliga vävnader/organ.

  • Tillgänglig genrelaterad forskningslitteratur.

Slutligen publiceras kartläggningen tillsammans med alla vävnadsbilder, antikroppsannoteringsdata och övrig antikroppsrelaterad information i den nästföljande versionen av The Human Protein Atlas (www.proteinatlas.org).

Figur 1: Arbetsflödet i Human Protein Atlas Uppsala-grupp.

Senaste åren har stora mängder transkriptomik-data genererats och importerats till Human Protein Atlas. Uttrycksnivåer för mRNA från tre olika projekt (HPA, GTEx, FANTOM5) i de flesta organ- och vävnadstyper för samtliga proteinkodande gener finns nu tillgängligt på Tissue Atlas. Datat från projekten har även slagits samman för att bilda en normaliserad uttrycksnivå, så kallad Consensus Normalized eXpression (NX). Med hjälp av de NX-baserade mRNA-nivåerna har varje gens mRNA-uttryck kategoriserats enligt grad av specificitet och distribution i kroppens olika organ, vävnader och celltyper. 

I Pathology Atlas återfinns mRNA-uttrycksdata för varje gen i vävnader från 17 olika cancerformer importerat från The Cancer Genome Atlas (TCGA). Varje gens cancer-relaterade mRNA-uttryck kategoriseras enligt grad av specificitet. Utöver analys av mRNA-uttryckets specificitet för olika cancrar, finns även prognostiska analyser av mRNA-uttryckets association med överlevnad visualiserat i Kaplan-Meier-diagram. Varje gen kategoriseras sedan som gynnsam eller ogynnsam för de cancerformer där associationen når statistisk säkerhet (p<0.001). I övriga cancrar kategoriseras genuttrycket som icke-prognostiskt.

Parallellt med den immunhistokemiska analysen i vävnader, utförs även en analys av antikroppens subcellulära inbindningsmönster med hjälp av immunfluorescens och konfokalmikroskopi med 64 olika cellinjer som utgångspunkt. Den subcellulära lokaliteten annoteras manuellt i tre utvalda cellinjer och datat och bilderna publiceras i Cell Atlas.

I Brain Atlas kombineras mRNA-uttrycksdata och antikroppsbaserad analys av proteinuttryck för att kartlägga genuttrycket i däggdjurshjärnans olika delar. Transkriptomikdata för varje gen i 10 olika hjärnregioner i människa, gris och mus, kombineras med högupplöst spatiell antikroppsbaserad proteinuttrycksdata i mushjärna (hela hjärnsnitt) och människohjärna (människovävnad från Tissue Atlas).

Olika typer av analyser har kombinerats för att utforska genuttrycket i blodceller, proteinkoncentrationer i blodplasma och det humana sekretomet. Resultatet från kartläggningen presenteras i Blood Atlas. Transkriptomikdata från tre olika projekt (HPA, DICE, Monaco) för mRNA-uttryck i olika blodcelltyper har genererats med hjälp av en kombination av cellsortering och RNA-seq. Blodcellsdatat kompletteras med proteomikdata i form av proteinkoncentrationer i plasma och blod som tagits fram med hjälp av masspektrometri och/eller antikroppsbaserad immunanalys. Utöver analys av blodets celler och plasmaprotein-koncentration, har även människans distribution av utsöndrade protein, “The Human Secretome”, kartlagts och publicerats i Blood Atlas. Slutdestinationen för utsöndrade protein har annoterats för 2641 kandidater med hjälp av tillgänglig forskningslitteratur.

Metabolic Atlas är en tillbyggnad till Tissue Atlas, importerad från metabolicatlas.org för att utforska genuttryck och proteiners funktion i förhållande till de molekylära nätverken inom människans metabolism. Över 120 olika manuellt kurerade kartor över metaboliska nätverk har importerats. För varje gen i Tissue Atlas tillhandahålls eventuell metabol information i form av en sammanfattande text och samtliga metabola nätverk, reaktioner och subcellulära lokaler kopplade till det korresponderade proteinet. Varje metabolt nätverk kan i sin tur utforskas i sin helhet tillsammans med mRNA-uttrycket (NX) för samtliga ingående gener i 37 olika vävnader.

Hemsidan

Allt data görs fritt tillgängligt gratis på The Human Protein Atlas hemsida (www.proteinatlas.org), en databas med över 150,000 unika besökare per månad och som uppdateras årligen med nya data och funktioner. Data angående det önskade proteinet hittas genom en sökning. Möjliga söktermer inkluderar namnet på det protein man är intresserad av (enkel sökning), men även avancerade sökningar med filtrering på uttryck bland vävnader, celltyper, cellinjer, proteinklasser, subcellulär lokalisation, med mera. En sökning (Figur 2A) leder till en sida där matchande gener listas och summeras med de viktigaste resultaten från kartläggningen av det korresponderande proteinuttrycket (Figur 2B). Genom att klicka på en gen i listan, kommer man till en gen-centrisk sammanfattnings-sida, som ger en bred överblick över hur proteinet uttrycks på mRNA- och proteinnivå. Från sammanfattningssidan kan man sedan göra djupare efterforskning i de specifika uttrycksmönstren i normala vävnader (Tissue Atlas), cancrar (Pathology Atlas) och celler (Cell Atlas), samt navigera bland de bilder som ligger till grund för annoteringen, som om man arbetade i ett virtuellt mikroskop. I tillägg, finns det även uttrycksdata på mRNA- och proteinnivå gällande plasman och olika celler i blodet (Blood Atlas), olika hjärnregioner i däggdjuren människa, gris och mus (Brain Atlas), samt ämnesomsättningsdata för gener involverade i metabolismen (i Metabolic Atlas).

I tillägg till sökfunktionen, är det även möjligt att navigera igenom Human Protein Atlas-webbsidans data via kunskapssidor som innehåller omfattande sammanfattningar, t.ex. celltyps- eller organspecifika proteom (Figur 2C), klickbara diagram eller exempel. Databasen bidrar även med över 20 olika nerladdningsbara dataset till storskaliga bioinformatiska analyser, samt programmatisk tillgång till allt Human Protein Atlas-data.

Figur 2: Illustration av proteinutforskning på Human Protein Atlas webbsida.

Läs mer:

Tillbaka till huvudsidan