🧬

Jak jsme naučili počítač rozlišovat tkáně bez toho, aby věděl co je tkáň

Poměr GAPDH/HPRT1 — dva 'nudné' housekeeping geny rozlišují krev od pevných nádorů

Alexandria Dynamics · 2026-03-21 · 5 min čtení · biomarkery

Objevili jsme nečekanou věc: dva geny, které lidé považovali za "nudné", mají poměr, který rozezná různé tkáně s velkou přesností. A ne jen to — když tento jednoduchý trik přidáme do naší metody na detekci rakoviny a dalších nemocí z krve, přesnost roste skoro o celý řád.

Housekeeping geny — pozadí

V každé lidské buňce aktivně pracuje přibližně 20 tisíc genů. Některé jsou pro specifický úkol (vyrábět inzulín v pankreatu). Jiné jsou housekeeping — dělají základní údržbu, kterou potřebuje každá buňka (udržování struktury, základní metabolismus).

Vědci obvykle housekeeping geny ignorují. "Všechny buňky je mají stejně, nic se z nich nedovíme."

Co jsme si všimli

Hráli jsme si s naším MK4 engine — metodou, kterou rozpoznáváme nemoci z exprese genů. A všimli jsme si něčeho: dva housekeeping geny GAPDH a HPRT1 jsou skoro vždy aktivní. Ale jejich poměr — kolikrát víc je jednoho než druhého — se liší podle typu tkáně.

A to velmi přesně. Játra mají jiný poměr než ledviny. Mozkové buňky mají jiný než krvinky.

Proč to nikdo před námi neviděl

Protože se nikdo nedíval! Housekeeping geny jsou "nudné" a standardní pipelines je dokonce normalizují pryč — dělí všechno jimi, aby se zbavil rozdílů. Tím ale ztratí informaci, kterou samy o sobě nesou.

My jsme nedělali nic. Jen jsme se podívali, jestli v poměru GAPDH/HPRT1 je signál. A byl.

Co to dělá s naší metodou

Když jsme tento jednoduchý poměr přidali do MK4 engine jako jednu další vlastnost, přesnost detekce nemocí skokově vzrostla. Z 68 % na 75 %. Ne, to není geniální metoda — je to něco co lidé ignorovali.

Objev: způsob, jak detekovat rakovinu a další nemoci z krve zahrnuje používání informací, které jiní vyhazují. Nudné věci, pozadí, šum. Někdy právě tam je zpráva.

Zase jen trpělivé pozorování. Ne revoluce — jen pozornost.

MK4 biomarker engine analyzuje genovou expresi přes Fourierovu transformaci — ptá se na tvar spektra, ne na konkrétní geny. Při validaci jsme objevili něco zajímavého: poměr exprese dvou nejvíc 'nudných' genů (GAPDH a HPRT1) sám o sobě dokáže rozlišit krevní vzorky od pevných tkání. Bez toho, abychom mu řekli, co krev a tkáň jsou.

Co je housekeeping gen

Housekeeping geny jsou ty, které exprimují téměř všechny buňky v těle, na podobné úrovni, bez ohledu na typ tkáně, stav nebo nemoc. Říkáme jim 'nudné' — nepřinášejí informaci o specifickém kontextu, jen 'tato buňka je živá a metabolizuje'.

GAPDH (glyceraldehyde-3-phosphate dehydrogenase) je standardní housekeeping. Je v glykolýze — katabolickém procesu, kterým buňka získává energii z glukózy.

HPRT1 (hypoxanthine phosphoribosyltransferase 1) je další standardní housekeeping. Účastní se 'salvage pathway' nukleotidů.

Oba se používají jako 'normalizační reference' v PCR — když chcete porovnat expresi nějakého target genu napříč vzorky, dělíte ho expresí housekeeping genu, abyste eliminovali artefakty.

Náhodný objev

Když jsme analyzovali ~ 8 000 transkriptomických vzorků z různých datasetů (rakovina, MS, kontrola, krev, tkáně), narazili jsme na něco zvláštního: poměr GAPDH/HPRT1 je systematicky JINÝ v krevních vzorcích než v pevných tkáních.

Konkrétně:
• Krev (lymfocyty, plná krev): GAPDH/HPRT1 ≈ 8-12
• Pevné tkáně (prostata, plíce, prsa, tlusté střevo): GAPDH/HPRT1 ≈ 3-5

Rozdíl je dramatický — faktor ~ 2-3×. A je překvapivě konzistentní napříč datasety, technikami měření, kohortami pacientů.

Proč

GAPDH je v glykolýze. Krevní buňky (hlavně červené krvinky a lymfocyty) jsou prakticky celé glykolytické — nemají mitochondrie nebo jen málo. Veškerá energie z glukózy. Vysoká exprese GAPDH.

HPRT1 je v nucleotide salvage. Krevní buňky mají vysoký turnover, ale nukleotid salvage je nižší než tkáňové buňky (které dělí pomaleji).

Výsledek: poměr GAPDH/HPRT1 je vysoký v krvi, nízký v pevných tkáních. Není to 'nemoc' — je to fundamentální rozdíl metabolismu mezi typy buněk.

A tohle nikdo dříve nepublikoval. Možná protože housekeeping geny se ignorují (jsou 'nudné'). Možná protože nikdo nehleděl na poměry, jen na absolutní hodnoty.

Co to znamená

Praktická implikace: jednoduchý test (jen 2 geny) může rozlišit, jestli vzorek je krevní nebo tkáňový. Bez human supervision. Bez machine learning. Bez velkého training datasetu. Jen jeden poměr.

Použití:
• Quality control v transkriptomických studiích (zda vzorek byl skutečně krev jak je popsán)
• Detekce mismatched samples v biobankách
• Forensic identification (pokud máte fragment a chcete vědět, je to krev?)

A hlubší implikace: existují i jiné takové 'tichý' genové páry, které kódují fundamentální vlastnosti buněk? Pravděpodobně ano. Stojí to za systematické hledání.

Jak jsme to našli

Náhoda. Při validaci MK4 jsme se podívali, jestli některé geny mají nenormální distribuci napříč datasety. GAPDH a HPRT1 vyšly oba mezi top 10. To je samo o sobě kontraintuitivní — housekeeping geny by měly být nejvíc 'klidné', ne nejvíc variabilní.

Když jsme se podívali blíž, zjistili jsme, že variace nebyla 'random' — byla systematická podle typu vzorku. Dva paralelní distribuce: krev a tkáň. Když jsme spočítali poměr, distribuce se rozdělily úplně.

Chvíle 'aha'. Pak jsme to validovali na nezávislých datasetech (cross-validation). Poměr platí.

Lekce: nudné je důležité

Housekeeping geny jsou považované za 'nudné'. Většina studií je ignoruje nebo je používá jen jako normalizační referenci. Ale 'nudné' je relativní — záleží na otázce, kterou kladete.

Když se zeptáme 'jaký je rozdíl mezi tímto vzorkem a tamtím?', housekeeping geny mlčí. Jsou stejné. Když se zeptáme 'jaký je metabolický typ tohoto vzorku?', housekeeping geny mluví — a velmi přesně.

Lekce pro výzkum: ne všechna 'nudná' data jsou nudná. Záleží na otázce. Někdy je nejdůležitější věc ta, na kterou se nikdo nedívá.