Pasaulio DNR
Technologija

Pasaulio DNR

Nojus, šešerių metų berniukas iš Kanados, serga liga, kuri neturi pavadinimo. Gydytojai MRT apžiūri susitraukiančią smegenų dalį, vadinamą smegenėlėmis. Jie įtaria, kad tarp milijonų žodžių, parašytų Nojaus genetinio kodo raidėmis, yra rašybos klaida. Taigi jie siunčia berniuko DNR į pasaulį internetu, tikėdamiesi rasti tą pačią klaidą pas ką nors kitą.

Defektą galima nustatyti, jei ta pati klaida randama kažkur naudojant tinklo įrankius. Todėl kūrėjai iš Toronto 2016 metų pradžioje pradėjo testuoti genetinės informacijos mainų tarp sveikatos priežiūros įstaigų sistemą. Šiuo metu tinklą sudaro ligoninės iš Kanados, JAV ir JK. „MatchMaker Exchange“ sistemos tikslas – automatizuoti ir globalizuoti DNR palyginimo procedūras. Projekte dirbančių kompiuterių mokslininkų tikslas – priartinti genų sekos nustatymo metodus prie šiuolaikinių telekomunikacijų technologijų. Pasaulyje jų jau yra apie 200 XNUMX. žmonių, kurių genomai buvo sekvenuoti. Netrukus jų skaičius gali siekti milijonus.

Kanados „MatchMaker“ kūrėjas Davidas Haussleris, bioinformatikos mokslininkas iš Kalifornijos universiteto Santa Kruze, 2013 m. kartu su grupe kitų įkūrė Pasaulinį genomikos ir sveikatos aljansą GA4GH, kurį dažnai lygina su Interneto standartų organizacija. . W3C. Daugeliui žinomų veikėjų ir ištisų įmonių, tokių kaip „Google“, pavyko prisijungti prie naujos organizacijos – „Global DNR“ sėklos. GA4GH yra įsipareigojusi tobulinti protokolus, kurti programavimo sąsajas (API) ir failų formatus genetiniams duomenims perduoti tinkle.

Vienas iš argumentų, palaikančių tokio „genetinio“ interneto kūrimą, yra sparčiai augantis laboratorijose generuojamų duomenų kiekis. Didžiausi ir efektyviausi centrai sekvenuoja žmogaus genomus dviejų genomų per valandą greičiu (pirmojo žmogaus seka užtruko trylika metų). Skaičiuojama, kad šiais metais visame pasaulyje bus sukurta 85 petabaitai duomenų. 2019 metais jų turėtų būti dvigubai daugiau. Ir visa tai – nebent bus sukurtas pasaulinis tinklas ir galimybė ieškoti – bus izoliuotose, sunkiai pasiekiamose duomenų bazėse. Tokiomis sąlygomis neįmanoma, pavyzdžiui, patikrinti visų panašių mutacijų, kurios sukelia tam tikros rūšies vėžį, palyginti su naudojamais vaistais ir gydymo būdais. O galimybė palyginti pasaulinėje duomenų bazėje būtų puiki priemonė gydytojams. Taigi Haussleris sukūrė genetinę paieškos programą, pavadintą „Beacon“, kuri ieškojo dvidešimtyje viešų DNR duomenų bazių ir įdiegė GA4GH protokolus. Ieškovas gali užduoti klausimus apie genetinių „raidžių“ padėtis atskirose genomų chromosomose duomenų bazėje. Nepaisant to, kad pripažįstama plačios prieigos prie sekvenuotos DNR svarba medicinos pažangai, visuomenėje, taip pat tarp gydytojų ir tyrėjų kyla didelis pasipriešinimas keitimuisi tokiais duomenimis. Idėja įdėti žmogaus genomus į internetą daugeliui atrodo prieštaringa. Siekdama išvengti privatumo pažeidimų, GA4GH siūlo lygiaverčio interneto modelį.

Duomenys amžinose grandinėse

Viena vertus, mes siekiame sukurti internetą su DNR duomenimis – kita vertus, DNR pradeda reprezentuoti įdomią alternatyvą kompiuteriniam duomenų registravimui. Prieš kelis mėnesius Šveicarijos mokslininkų grupė iš Ciuricho technologijos instituto pristatė techniką, leidžiančią užkoduoti duomenis DNR grandinėse taip, kad jie būtų saugomi be žalos ir klaidų iki dviejų tūkstančių metų! Jokia kita žinoma žmogaus duomenų įrašymo technologija negali prilygti tokiam patvarumui. Žinoma, pastabus žmogus iš karto paklaus, kaip buvo galima vienu pristatymu įrodyti tūkstantmečių ilgaamžiškumą. Pasirodo, šveicarai sukūrė tokio ilgo laikotarpio modeliavimą, gautas DNR grandines apkapsuliuodami į silikonines sferas ir kaitindami iki maždaug 72 °C temperatūros. Mokslininkų teigimu, savaitė buvimo tokioje temperatūroje prilygsta 2. metams 10°C temperatūroje. Vien po tokio modeliavimo įrašymo klaidų nepastebėta. Tyrėjai taip pat pabrėžia kitus DNR spiralės, kaip laikmenos, pranašumus, palyginti su standžiaisiais diskais ar magnetinėmis juostomis. Pavyzdžiui, penkių terabaitų knygos dydžio diske tokį duomenų kiekį optimaliomis sąlygomis galima saugoti iki penkiasdešimties metų. Įrašas DNR kode nebus dvejetainis, o bus pagrįstas keturių nukleotidų raidžių A, C, T ir G naudojimu. Kalbėdamas apie šveicarų pasiekimus, New Scientist pateikė tokį skaičiavimą: vienas gramas molekulinės DNR. grandinės gali užkoduoti 455 eksabaitus informacijos, o bendrovės „EMC Computer“ skaičiavimais 2011 metais bendras Žemėje surinktų duomenų kiekis siekė 1,8 zettabaitų. Vienas zetabaitas lygus 1 tūkst. Eksabaitų, taigi, norint įrašyti 2011 m. duomenis, reikia apie 4 gramus DNR. Žinoma, nuo 2011 metų pasaulinės informacijos apimtis šiek tiek išaugo ir galbūt reikėtų pridėti tris gramus.

genetinė informatika

klesti Taip pat verta prisiminti, kad jau yra DNR programavimo kalba. Pastaraisiais metais jį sukūrė mokslininkų grupė iš Vašingtono universiteto JAV. Spėjama, kad jis valdo „cheminio kompiuterio“ – vadinamųjų sistemų, naudojamų DNR sintezei, veikimą. Idėja yra ne tik kontroliuoti chemines reakcijas, tokias kaip automatika, robotai ir kt., bet ir kontroliuoti vaistų dozavimą. Kompiuterinių algoritmų, leidžiančių, pavyzdžiui, pritaikyti dirbtines DNR molekules prie gyvų audinių, kuriuose jos turi funkcionuoti, aplinkos sukūrimas yra rimta užduotis. Biologinis pasaulis yra daug sudėtingesnis ir netaisyklingesnis nei mašinų pasaulis. Tačiau sunku nereiškia, kad neįmanoma. „Mūsų idėja yra sukurti universalią kalbą, kurią būtų galima naudoti daugeliui skirtingų užduočių“, – paaiškino Georgas Zeligas iš DNR programavimo kalbų komandos. Ši technologija ilgainiui bus panaudota, be kita ko, programuojant ląstelėse susirenkančias molekules arba kuriant biojutiklius, stebinčius organizmo būklę ląstelių lygiu. DNR sekos nustatymo algoritmas taip pat gali padėti apsisaugoti nuo internetą užplūstančio šlamšto, t.y. šiukšlių. Programa, pavadinta Chung Kwei (iš kinų feng shui talismano, saugančio namus nuo piktųjų dvasių), veikia beveik 97 proc. Jis buvo pagrįstas ankstesniu Tiresias algoritmu (Tiresias yra mitinis graikų pranašas), kurį sukūrė IBM Thomaso J. Watsono tyrimų centro Niujorke bioinformatikai, dirbantys su DNR sekos nustatymu. Ši programa genetinio kodo įrašuose ieškojo pasikartojančių sekų, kurios paprastai pateikia svarbią informaciją. Vietoj genomo mokslininkai išanalizavo 65 duomenis naudodami algoritmą. dažniausiai pasitaikantys šiukšlių pavyzdžiai. Kiekvienas el. laiškas buvo traktuojamas kaip DNR eilutė. Mums pavyko rasti 6 milijonus pasikartojančių (daugiau nei vieną el. laišką) raidžių ir skaičių sekų. Tada buvo išanalizuota nemaža dalis įprastos korespondencijos (kartais vadinama kumpiu - „kumpiu“, o ne šlamštu - „pusryčiai“). Panaikintos sekos, kurios pasikartojo kumpio ir šlamšto pranešimuose. Vėliau buvo analizuojama gaunama korespondencija. Kuo didesnis įprastų „spamo sekų“ skaičius viename kilobaite el. laiško, tuo tikresnis yra el. Tik vienas iš 65 įprastų el. laiškų buvo per klaidą sustabdytas, o šiukšlių atpažinimo rodiklis siekė 96,56%.

Добавить комментарий