EN
🔬

Pet nemoci, deset otisku: co frekvencni analyza rika o kazde nemoci jinak

MK4 v2 -- rozsirena frekvencni diagnostika na 831 vzorcich z 5 nemoci
Architekt · 2026-02-21 · 14 min čtení · biomarkery
Ve svitku 005 jsme ukazali, ze frekvencni analyza RNA exprese dokaze rozlisit zdravou a nemocnou tkan -- u nekterych nemoci. Ted jsme metodu rozsirili: misto 4 metrik merime 10, a testovali jsme ji na 831 vzorcich z 5 ruznych nemoci (rakovina jater, plic, ledvin, diabetes, myelodysplasticky syndrom). Klicovy nalez: kazda nemoc ma jiny 'otisk prstu'. Rakovina jater kric tak hlasne, ze ji zachyti i jedina metrika. Diabetes sice sepota. Ale vsechny nemoci sdileji jedno: meni zpusob, jakym si genove spektrum pamatuje svou strukturu. Tato vlastnost -- rychlost rozpadu spektralni pameti -- je nejsilnejsi univerzalni indikator nemoci, ktery jsme nasli.

Kde jsme skoncili

Svitek 005 ('Kdy krev mluvi a kdy mlci') ukazal, ze frekvencni analyza genove exprese funguje -- ale ma jasne hranice. Roztrousena skleroza z krve: signal existuje. Diabetes z ostrovku: silny signal. Alzheimer a Parkinson: mimo dosah (protein-level patologie).

Ale jedna vec zustala otevrana: merime jen 4 vlastnosti frekvencniho spektra. Co kdyz nemoci zanechavaji stopy i v jinych dimenzich, ktere jsme zatim nemerili?

Deset otisku misto ctyr

Puvodni MK4 meril ctyri veci: jak chaoticky je spektrum (chaos), kolik energie je v nizkych frekvencich (basy), kolik ve strednich (stredy), a jak dominantni je hlavni peak (peak_ratio). Vsechny ctyr rikaji neco o tom, JAK je energie v spektru rozlozena.

Ale to je jako posudzovat hudbu jen podle toho, kolik je v ni basu a vysku. Nerikate nic o rytmu, o tom jestli se motiv opakuje, jestli je skladba monotonni nebo se neustale meni.

Pridali jsme sest novych metrik, ktere meri DYNAMIKU signalu:

Rychlost rozpadu pameti (acf_decay): Jak rychle spektrum 'zapomina' svou strukturu. Predstavte si to jako echo -- zdrava tkan ma dlouhe echo (signal si drzi svuj vzor), nemocna kratke (vzor se rychle rozpadne).

Perzistence (hurst): Je signal setrvacny? Pokud trend stoupal, bude dal stoupat? Nebo se neustale obraci? Zdrava tkan ma urcitou miru setrvacnosti. Nemoc ji muze zesilen nebo rozbij.

Bimodalita (bimodality): Ma distribuce genove exprese jeden kopeček, nebo dva? Dva kopecky mohou znamenat, ze ve vzorku jsou dve populace bunek -- zdrave a transformovane.

Zero-crossing rate (zcr): Jak casto signal prekracuje svuj prumer. Rychle oscilace = chaoticka regulace. Pomale = koherentni bloky aktivity.

Spektralni hrana (spectral_edge): Kde lezi 95 % energie. Posuv nahoru = energie se rozptyluje do vysokych frekvenci, ztrata koordinace.

Koherence (coherence): Pomer dominantniho peaku k prumeru. Meri, jestli existuje jeden silny regulacni signal, nebo je vsechno 'plochy sum'.

Pet nemoci, 831 vzorku

Vsechna data pochazeji z NCBI Gene Expression Omnibus -- verejne dostupna, opakovatelna. Zadna proprietarni data.

Testovano na peti nemocich z peti ruznych organu:

Hepatocelularni karcinom (HCC) -- rakovina jater. 250 vzorku (122 zdravych, 128 nemocnych). Nejsilnejsi signal ze vsech.

Nemaloblunkovy plicni karcinom (NS) -- rakovina plic. 120 vzorku (60/60). Dokonale vyvazeny.

Svetlobunecny renalni karcinom (ccRCC) -- rakovina ledvin. 144 vzorku (72/72). Dokonale vyvazeny.

Diabetes 1. typu -- autoimunitni porucha. 117 vzorku (24 zdravych, 93 nemocnych). Nevyvazeny.

Myelodysplasticky syndrom (MDS) -- porucha kostni drene. 200 vzorku (17 zdravych, 183 nemocnych). Silne nevyvazeny.

Celkem: 831 vzorku z 5 nemoci na 3 ruznych microarray platformach. Diverzita dat je klicova -- pokud metoda funguje na ruznych nemocich, organech a platformach, neni to nahodny artefakt.

Testovane datasety
NemocOrganZdravychNemocnychBalance
Rakovina jater (HCC)jatra12212849 %
Rakovina plic (NS)plice606050 %
Rakovina ledvin (ccRCC)ledviny727250 %
Diabetes typ 1krev249321 %
MDSkostni dren171839 %

Kazda nemoc krica jinak

Toto je nejdulezitejsi zjisteni cele studie: neexistuje jedna univerzalni 'signatura nemoci'. Kazda nemoc zanechava jiny otisk.

Rakovina jater krica. U HCC dosahuje samotny chaos -- jedina metrika -- separacni silu 0.916 (kde 1.0 = dokonale rozliseni, 0.5 = nahodne hadani). Vsech deset metrik je vysoce signifikantnich (p < 10^-22). Jaterni karcinom tak fundamentalne meni transkripci, ze jakakoli frekvencni metrika ho zachyti.

Rakovina ledvin ukazuje neco jineho. Nejsilnejsi signal neni v chaosu (ten je az ctvrty), ale v rychlosti rozpadu pameti (0.796) a bimodalite (0.751). Bimodalita -- dva kopecky v distribuci -- naznacuje, ze ve vzorcich renalniho karcinomu jsou dve populace bunek. To dava biologicky smysl: biopsie zachyti smes zdrave a nadorove tkane.

MDS (porucha kostni drene) se od ostatnich lisi uplne. Nejlepsi separator neni chaos, neni to pamet, ale perzistence (hurst = 0.761). Kostni dren s MDS ma vyrazne odlisnou setrvacnost genove exprese -- signaly, ktere by se normalne obratily, pokracuji dal. Dysregulace hematopoeze meni casovou dynamiku, ne staticky profil.

Plichni karcinom je jemnejsi nez jaterni. Zadna jedina metrika nema separacni silu nad 0.67. Ale kombinace vice metrik -- zejmena pamet, spektralni hrana a perzistence -- signal zachyti. Plice jsou metabolicky mene aktivni nez jatra, proto je frekvencni zmena jemnejsi.

Diabetes je nejslabsi. Nejlepsi separace je 0.649 (pamet). To je konzistentni s tim, co jsme zjistili v svitku 005: diabetes je metabolicka porucha, ne strukturalni transformace tkane. Frekvencni signatura existuje, ale je slaba.

Neexistuje univerzalni signatura nemoci. HCC = chaos (0.916). ccRCC = bimodalita (0.751). MDS = perzistence (0.761). Kazdy organ, kazda nemoc, jiny otisk.
Nejsilnejsi frekvencni metrika pro kazdou nemoc
NemocNejlepsi metrikaSeparacni silap-value
Rakovina jater (HCC)chaos0.9166.4 x 10^-30
Rakovina ledvin (ccRCC)pamet (acf_decay)0.7969.4 x 10^-10
MDS (kostni dren)perzistence (hurst)0.7613.8 x 10^-4
Rakovina plic (NS)pamet (acf_decay)0.6681.5 x 10^-3
Diabetes typ 1pamet (acf_decay)0.6492.5 x 10^-2

Pamet spektra: nejsilnejsi univerzalni indikator

Ze vsech deseti metrik je jedna statisticky signifikantni napric vsemi peti nemocemi: rychlost rozpadu spektralni pameti.

Co to znamena biologicky? Zdrava tkan ma genovou expresi organizovanou do modulu -- skupin genu, ktere spolupracuji (metabolicke drahy, signalni kaskady, transkripcni programy). Tyto moduly vytvafeji ve frekvencnim spektru pravidelny vzor. A tento vzor ma 'echo' -- sousedni frekvence na sebe navazuji, protoze geny v jednom modulu jsou koexprimovane.

Nemoc tuto koordinaci narusi. Onkogeny, zanetlive cytokiny, nebo metabolicke poruchy rozbijeji souhru mezi moduly. Echo se zkracuje. Spektrum rychleji 'zapomina' svou strukturu.

Je to jako rozdil mezi orchestrem a davem. Orchestr ma silne echo -- zahrajete akord a dalsi takty na nej navazuji. Dav ma kratke echo -- kazdy hraje neco jineho, zvuk se rychle rozpadne.

Proc je tato metrika silnejsi nez chaos? Chaos meri, kolik neporadku je ve spektru celkove -- je to globalni statistika. Pamet meri, jak jsou casti spektra na sebe navazane -- je to vztahova statistika. Nemoc nemusi zmenit celkove mnozstvi neporadku (chaos zustava podobny), ale vzdy zmeni vztahy mezi castmi. Proto pamet zachyti to, co chaos mine.

Analogicky: chaos rika 'kolik hluku je v mistnosti'. Pamet rika 'jestli si lide v mistnosti povidaji, nebo kricni kazdy pro sebe'.

Rychlost rozpadu spektralni pameti (acf_decay) je nejsilnejsi univerzalni indikator nemoci: p = 1.2 x 10^-11 napric 5 nemocemi. Nemoc meni vztahy, ne nutne celkovy neporadek.

Deset prstenu, jeden prsten: co rika model kdyz vidi vsechno

Kdyz metode dame vsech 10 metrik a nechame ji naucit se rozlisovat zdravou a nemocnou tkan napric vsemi 5 nemocemi, jeji presnost (AUC) vzroste z 0.57 na 0.83. To je narust o 46 %.

To ale neni to nejzajimavejsi. Zajimave je, ktere metriky jsou dulezite a ktere ne:

Pamet (acf_decay) je s velkou prevahou nejdulezitejsi -- jeji vaha v modelu je +4.55. To znamena: jednotkovy narust v pameti spektra zvysuje pravdepodobnost nemoci vice nez cokoli jineho.

Chaos se obratil. V puvodnim modelu (4 metriky) mel chaos kladnou vahu -- vyssi chaos = nemoc. V rozsirenem modelu ma zapornou vahu (-3.89). Co se stalo? Chaos v puvodnim modelu slouzil jako 'zastupce' (proxy) za pamet a koherenci, ktere jsme nemerili. Ted, kdyz je merime primo, chaos ukazuje svou pravou tvar: po adjustaci na pamet a koherenci vyssi chaos paradoxne snizuje pravdepodobnost nemoci.

To neni bug, je to insight. Chaos rika 'kolik neporadku je v systemu'. Ale urcita mira neporadku je zdrava -- znamena to flexibilitu, adaptabilitu. Extremne nizky chaos (rigidni, neflexibilni regulace) muze byt horsi nez mirny chaos. Nemocna tkan byva rigidni specifickym zpusobem -- a to zachyti prave pamet, ne chaos.

Zero-crossing rate (zcr, +1.21) sam o sobe nema signifikantni separacni silu. Ale v kombinaci s ostatnimi metrikami pridava hodnotu -- zachycuje oscilacni vzor, ktery zadna jina metrika nemeri.

Basy a stredy se navzajem dokonale rusni (korelace -1.000). To je matematicky nutnost: basy + stredy + vysky = 100 %. Staci jeden z nich -- druhy je redundantni.

Presnost vzrostla o 46 % (AUC 0.57 -> 0.83). Chaos se obratil: v kontextu ostatnich metrik je urcita mira neporadku zdrava. Pamet dominuje.

Proc nelze trenovat na jedne nemoci a testovat na jine

Provedli jsme nejprisnejsi mozny test: Leave-One-Dataset-Out. Trenuj model na ctyrech nemocich, testuj na pate. Opakuj pro vsech pet.

Vysledek: prumerne AUC = 0.46. To je temer nahodne hadani.

Ale to neni selhani -- je to dulezity nalez. Rika nam, ze neexistuje univerzalni 'signatura nemoci'. Hepatocelularni karcinom meni frekvencni profil UPLNE JINAK nez myelodysplasticky syndrom. Model nauceny na rakovine jater dokonce predikuje HCC OPACNE (AUC = 0.25 = horsi nez nahoda) -- HCC ma inverzni signaturu oproti ostatnim nemocim.

Biologicky to dava smysl. Jatra jsou metabolicky nejaktivnejsi organ v tele. Kostni dren produkuje krvni bunky. Plice vymenuji plyny. Kazdy organ ma jinou zakladni frekvenci genove exprese -- a kazda nemoc ji meni jinak.

To znamena, ze MK4 neni a nebude 'jeden test na vsechno'. Je to nastroj, ktery musi byt kalibrovany na konkretni nemoc a tkan. A to je v poradku -- tak funguje i konvencni diagnostika. Krevni obraz neodhaluje rakovinu jater. Jaterni testy nezachyti leukemii. Kazda nemoc vyzaduje svuj test.

Trenovat na jedne nemoci a testovat na jine nefunguje (AUC = 0.46). Kazda nemoc meni frekvencni profil jinak. MK4 musi byt kalfibrovany per-disease.

Adaptivni normalizace: proc ma format dat vyznam

Technicky detail, ktery ma prakticke dusledky: ruzne datasety prichazeji v ruznych skalach. Nektere maji 'surove' intenzity (cisla v tisicich), jine jsou jiz log-transformovane (cisla 0-14), jine kvantilove normalizovane (cisla 0-1).

Puvodni MK4 predpokladal jednu skalu. To vedlo k falesnym vysledkum na nekterych datasetech -- ne proto, ze by metoda nefungovala, ale proto, ze vstupni data mela jiny format nez ocekavany.

Nova verze automaticky detekuje format a normalizuje: surova data se log-transformuji, kvantilova se preskaluji, jiz transformovana se nechaji. Navic detekuje RNA-seq data (celociselne, s velkym rozptylem) a aplikuje specializovanou normalizaci.

Vysledek: metoda nyni funguje na libovolnem formatu GEO datasetu bez manualni pripravy. To je klicove pro reprodukovatelnost -- kdokoli muze stahnout dataset a spustit analyzu.

Co z toho plyne

Tri hlavni zjisteni:

1. Kazda nemoc ma jiny frekvencni otisk. Neexistuje univerzalni 'signatura nemoci' -- ale existuji disease-specific signatury, ktere jsou silne a reprodukovatelne. Rakovina jater ma jeden z nejsilnejsich signalu, jake jsme kdy videli (separacni sila 0.916 na jedine metrice).

2. Pamet spektra je dulezitejsi nez chaos. Puvodni zjisteni ('nemocna tkan ma vyssi chaos') je zjednodusene. Presnejsi je: nemocna tkan ma zmenenou strukturu zavislosti ve spektru. Nekdy to znamena vice chaosu (HCC), jindy mene (rigidni dysregulace u MDS), jindy jinou distribuci (bimodalita u ccRCC). Metrika, ktera toto zachyti nejlepe, je rychlost rozpadu spektralni pameti.

3. Deset metrik je vyrazne lepsi nez ctyri. Presnost roste o 46 % (AUC 0.57 -> 0.83). Ale -- a to je klicove -- zlepseni je v ramci kazde nemoci zvlast, ne napric nemocemi. Model trenovany na jedne nemoci nepredikuje jinou.

Co to rika o biologii: Genova exprese neni nahodny sum. Ma strukturu -- moduly, korelace, vzory. Nemoc tuto strukturu narusuje specificke pro kazdy organ a kazdou patologii. Frekvencni analyza tuto narusteni meri. A nejcitlivejsi meritko je to, jak rychle se struktura rozpadne.

Nemoc = zmenena struktura zavislosti ve spektru genove exprese. Kazdy organ a kazda nemoc ji meni jinak. Pamet spektra to meri nejlepe.

Otevfene otazky a co dal

Testovano na 5 nemocich -- to je malo. Potrebujeme alespon 15 datasetu pokryvajicich 10+ nemoci, vcetne tech, ktere ve svitku 005 selhaly (Alzheimer, Parkinson). Otazka: zmeni se neco, kdyz pridame dynamicke metriky i k neurodegenerativnim onemocnenim?

Basy a stredy jsou redundantni (korelace -1.000). Jeden z nich odstranime. Ale bimodalita a zero-crossing rate prinaseji unikatni informaci nezavislou na vsem ostatnim -- ty zustanou.

Disease-specific modely: misto jednoho univerzalniho modelu trenovat specializovane modely pro kazdou nemoc. To vyzaduje vice dat, ale slibuje vyssi presnost.

Gene-level analyza: zatim merime signatury na urovni vzorku. Ktere konkretni geny nejvice prispivaji k separaci? To by mohlo propojit frekvencni analyzu s klasickou diferencialni expresi a ukazat biologicke mechanismy.

Rakovina jater (HCC) je zrejmym kandidatem pro hloubkovou studii -- signatura je tak silna, ze by mohla fungovat i na cfRNA z krve. To by otevfelo cestu k neinvazivnimu screeningu.

Co to je a co to neni

Toto neni diagnosticky nastroj. Toto jsou vysledky analyzy 831 verejnych vzorku z NCBI Gene Expression Omnibus.

Ukazujeme, ze frekvencni analyza genove exprese dokaze rozlisit zdravou a nemocnou tkan -- ale kazda nemoc vyzaduje svuj vlastni model. Univerzalni detektor nemoci neexistuje.

Nejdulezitejsi nalez neni metricka presnost. Je to biologicky princip: nemoc primarne meni VZTAHY mezi castmi genoveho spektra, ne nutne celkovou miru neporadku. A tuto zmenu vztahu meri nejlepe rychlost rozpadu spektralni pameti.

Vsechna data jsou verejna. Vsechny analyzy jsou opakovatelne.

Kde se potkáváme s konvenční fyzikou

Konvenční biomarkery používají diferenciální expresi, pathway enrichment a ML klasifikátory. Přesnost se liší podle nemoci a tkáně -- to je známý fakt. Ale proč solidní tumory mají jasný frekvenční podpis a neurodegenerace ne? Standardní vysvětlení: periferní krev neodráží CNS. Co když problém není v krvi, ale v tom, jak se na ni díváme?

Závěr

Na 831 verejnych vzorcich z 5 nemoci (HCC, Lung NS, ccRCC, Diabetes, MDS) jsme ukazali, ze kazda nemoc ma jiny frekvencni otisk. Nejsilnejsi univerzalni indikator neni chaos (puvodni objev), ale rychlost rozpadu spektralni pameti (p = 1.2 x 10^-11). Rozsireni ze 4 na 10 metrik zvysilo presnost o 46 % (AUC 0.57 -> 0.83). Nejdulezitejsi negativni vysledek: model trenovany na jedne nemoci nepredikuje jinou (LODO AUC = 0.46). Kazda nemoc vyzaduje specifickou kalibraci. Nejcennejsi biologicky nalez: nemoc primarne meni vztahy mezi castmi spektra, ne celkovou miru neporadku.

Reference

  1. NCBI Gene Expression Omnibus (GEO). https://www.ncbi.nlm.nih.gov/geo/
  2. GSE14520 -- Hepatocellular Carcinoma (HCC), GPL3921.
  3. GSE19804 -- Non-Small Cell Lung Carcinoma, GPL570.
  4. GSE53757 -- Clear Cell Renal Cell Carcinoma (ccRCC), GPL570.
  5. GSE9006 -- Type 1 Diabetes, GPL96.
  6. GSE19429 -- Myelodysplastic Syndrome (MDS), GPL570.
  7. Shannon, C. E. (1948). A Mathematical Theory of Communication.
  8. Hurst, H. E. (1951). Long-term storage capacity of reservoirs.
  9. scroll-005 -- Kdy krev mluvi a kdy mlci (MK4 v1 vysledky).
  10. scroll-L2-005 -- MK4 PRO v2 technicka dokumentace (L2).
MK4frekvencni analyzarakovina jaterdiabetesMDSrenalni karcinomplicni karcinomGEOcross-validaceautokorelace