Genomic variability of SARS-CoV-2

Abstract:

In the past years, emerging and reappearing pathogens have become a significant challenge for global public health. A recent example of this phenomenon is zoonotic pandemics that occur after transmitting animal viruses to the human population, as is the case of the acute respiratory syndrome coronavirus 2 (SARS-CoV-2). Coronaviruses are the most significant encapsulated RNA viruses widely distributed among mammals, birds, and humans. They cause mainly respiratory diseases but also enteric, hepatic and neurological diseases. Currently, seven species of coronaviruses capable of infecting humans are known. Four of them cause mild clinical symptoms – 229E, OC43, NL63 and HKU1, similar to a cold; and three other strains – severe acute respiratory syndrome coronavirus (SARS-CoV), Middle East respiratory syndrome-related coronavirus (MERS-CoV) and the newly identified severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2), which are lethal and have led to three pandemics in the 21st century. Knowledge of the SARS-CoV-2 virus sequence is a key to its characterization, and an early sharing of its genetic data allows rapid development of diagnostics. Analysis of the SARS CoV 2 genome continually shows new genome mutations. The main focus of the current research on the SARS-CoV-2 genome is to determine whether any of these mutations can significantly alter the essential viral properties that could affect the manifestation of the disease or its transmission rate.

Keywords: coronaviruses, SARS-Cov-2, COVID-19, genomic variability, variants, sequencing

*A rare case of autochthonous human dirofilariasis with the manifestation of pseudotumor of the epididymis caused by helminth Dirofilaria repens

Varianty vírusu SARS-CoV-2

Mutácie sú jeden z najdôležitejších mechanizmov evolúcie RNA vírusov. Podobne ako iné RNA vírusy, aj koronavírusy rutinne akumulujú mutácie a zmeny vo svojej genómovej sekvencii v dôsledku nepresnosti polymerázy(1). SARS-CoV-2 však obsahuje RdRp s proof-reading aktivitou, ktorá má za úlohu minimalizovať výskyt nukleotidových mutácií(2). Genetická diverzita je však rozhodujúca pre jeho fitnes, prežitie aj patogenézu. Bolo vykonané veľké množstvo štúdií na detekciu genómových variácií SARS-CoV-2, čo viedlo k nájdeniu bohatých genetických variácií rôznych typov vrátane nesynonymných, synonymných, inzercií, delécií a nekódujúcich mutácií. Monitorovanie (obrázok 1) a charakterizácia mutácií a variabilných oblastí je rozhodujúca najmä pre ich dôsledky, ako napríklad vplyv na rýchlosť šírenia infekcie alebo schopnosť spôsobiť vážnejší priebeh ochorenia.

Mutácie môžu spôsobovať neschopnosť detekcie vírusu pomocou špecifických diagnostických testov alebo znížiť náchylnosť na terapeutické látky, ako sú monoklonálne protilátky, či vyhnúť sa prirodzenej imunite alebo imunite vyvolanej očkovaním. S najväčšou pravdepodobnosťou sa budú prenášať mutácie, ktoré buď posilnia infekčnosť, alebo replikáciu vírusu, alebo tie, ktoré nevplývajú negatívne na funkciu vírusu. Keďže sa zvýšil prenos a globálne šírenie SARS-CoV-2, v súčasnosti pozorujeme veľké množstvo akumulovaných mutácií. Podľa údajov získaných z verejnej databázy Global Initiative on Sharing All Influenza Data (GISAID) mal na začiatku pandémie vírus SARS-CoV-2 mieru mutácií asi 1,12 x 10–3 nukleotidov/genóm za rok(3). Zatiaľ čo sekvencie SARS-CoV-2 z Wu-chanu a okolitých oblastí provincie Chu-pej sa líšili iba niekoľkými nukleotidovými zmenami, ďalšia analýza genómových sekvencií z databázy GISAID odhalila, že počet a výskyt mutácií je v Európe a Severnej Amerike v porovnaní s Áziou výrazne vyšší(4). Napriek tomu, že SARS-CoV-2 vykazuje sezónny pokles, perzistencia pandémie môže umožniť akumuláciu imunologicky relevantných mutácií v populácii. Proteíny SARS-CoV-2 mutujú rôznymi rýchlosťami, pričom väčšina vírusových proteínov vykazuje malú mutačnú variabilitu. Niektoré proteíny, ako napríklad Spike, sa zdajú náchylnejšie na mutácie, pravdepodobne pre svoju kľúčovú úlohu pri vstupe do hostiteľských buniek a zmenu infekčnosti(5).

Významnú pozornosť získala mutácia D614G v S proteíne, keďže sa stala v polovici roku 2020 prevládajúcou formou SARS-CoV-2 na celom svete vrátane Európy. Ide o substitúciu vedúcu k nahradeniu kyseliny asparágovej glycínom v polohe 614 v S proteíne(7). Doteraz nie sú dôkazy o tom, že by infekcia SARS-CoV-2 obsahujúca tento variant viedla k závažnejšiemu priebehu ochorenia a nemení ani účinnosť existujúcich laboratórnych diagnostík, terapeutík, vakcín alebo preventívnych opatrení v oblasti verejného zdravia. Mutácia však pravdepodobne zvýšila afinitu vírusu na ľudský receptor ACE2, čo má za následok jeho vyššiu infekčnosť a rýchlosť prenosu(8). Je preukázané, že infikovaní pacienti s D614G mali vyššiu hladinu vírusovej RNA, nezistili sa však rozdiely v potrebe hospitalizácie(7). Ďalšia bežná mutácia v polohe 314 v ORF1b ovplyvňuje komplex RdRp, ktorý je kódovaný nsp12. Mutácie v RdRp sú zriedka životaschopné, pretože RdRp je zodpovedný za transkripčné procesy a jeho štruktúra je preto vysoko zachovávaná. Mutácia vedie k zmene aminokyseliny prolín na leucín a bolo pozorované, že zvyšuje rýchlosť výskytu mutácií(9). Prolín je spojený s flexibilitou a leucín so stabilizáciou v proteínoch. Zvýšená rigidita v štruktúre RdRp v dôsledku zavedenia leucínu vedie k vyššej miere transkripčnej chyby(10). Vznik mutácie RdRp vo februári 2020 viedol k zvýšeniu tvorby mutácií vrátane mutácií v S a N proteínoch(4).

Na konci jesene 2020 viaceré krajiny hlásili, že detegujú varianty SARS-CoV-2 s veľkým počtom mutácií, ktoré sa šíria efektívnejšie. Nový variant B.1. 1. 7 s veľkým počtom mutácií identifikovali na jeseň 2020 v Británii(11). Následne bola ohlásená línia B.1.351 v Južnej Afrike(12). Nedávno boli identifikované ďalšie varianty, a to B.1. 1. 28 označovaný ako P.1 v Brazílii(13) a B.1.526 vyskytujúci sa najmä v New Yorku(14). V súčasnosti tieto varianty SARS-CoV-2 predstavujú najväčšiu hrozbu. O funkčných a evolučných významoch väčšiny mutácií SARS CoV-2 sa stále diskutuje.

 

Línia B.1.1.7

B.1. 1. 7 rodová línia, alias 20I/501Y.V1 Variant of Concern (VOC) 202012/01. Patrí do skupiny Nextstrain – 20 B, GISAID klad GR. Rodová línia B.1. 1. 7 nesie väčší počet genetických zmien vírusu, ako bolo obvyklé(11). Ako a kde vznikol, je zatiaľ nejasné. Predpokladaný vznik neobvyklej genetickej divergencie línie B.1. 1. 7 je v imunodeficientných alebo imunosuprimovaných pacientoch, ktorí sú chronicky infikovaní SARS-CoV-2(15). V takýchto prípadoch evolučná dynamika a selektívne tlaky na populáciu vírusov medzi pacientmi sú veľmi odlišné od tých, ktoré sa vyskytujú pri typickej infekcii. Odhaduje sa, že variant sa objavil v juhovýchodnej časti Veľkej Británie v septembri 2020, pričom nie je fylogeneticky príbuzný s vírusom SARS-CoV-2 cirkulujúcim v Spojenom kráľovstve v čase zistenia variantu(16).

Nukleotidové zmeny sú prevažne pozmeňujúce aminokyseliny, pričom nastalo až 14 nesynonymných mutácií a 3 delécie (obrázok 2). V línii sa pozoruje aj 6 synonymných mutácií. Množstvo genetických zmien je najmä v proteíne Spike vrátane delécie šiestich nukleotidov, čo vedie k delécii 2 aminokyselín v pozíciách 69 a 70 – del69–70. Táto mutácia sa spontánne vyvinula aj v iných variantoch SARS-CoV-2 a pred- pokladá sa, že zvyšuje prenosnosť. Významnou mutáciou je aj zmena, ktorá vedie k zmene aminokyseliny z asparagínu na tyrozín v polohe 501 – N501Y v doméne viažucej receptor proteínu Spike. Ukázalo sa, že zvyšuje pevnosť väzby Spike proteínu koronavírusu na enzým konvertujúci angiotenzín 2 – ACE2, ktorý sprostredkúva vstup vírusu do ľudských buniek. Potenciálne biologické účinky môže mať aj zmena prolínu na aminokyselinu histidínu v polohe 681 v S proteíne – P681H, ktorá bezprostredne susedí s miestom štiepenia furínom(11).

Doterajšie analýzy ukázali, že variant B.1. 1. 7 sa prenáša efektívnejšie v porovnaní s inými variantmi SARS-CoV-2, ktoré kolujú vo Veľkej Británii, keďže regióny Spojeného kráľovstva s vyšším podielom sekvencií B.1. 1. 7 mali rýchlejší epidemický rast ako iné oblasti. Odhaduje sa, že prenosnosť tohto kmeňa sa mohla zvýšiť až o 56 % a primárne reprodukčné číslo šírenia sa zvýšilo o 0,4 – 0,7(17). V januári 2021 bola publikovaná správa, v ktorej vedci naznačili, že variant B.1. 1. 7 môže byť spojený so zvýšeným rizikom úmrtia v porovnaní s inými variantmi(18). Na potvrdenie tohto zistenia sú potrebné ďalšie štúdie. Počas posledných týždňov pomer prípadov B.1. 1. 7 medzi všetkými detegovanými prípadmi výrazne stúpa každý deň, čo naznačuje, že tento variant sa stáva dominantným, minimálne v EÚ vrátane Slovenska.

Ukázalo sa, že sa vyskytol aj variant B.1. 1. 7, ktorý obsahoval navyše významnú mutáciu E484K, pri ktorej sa preukázalo, že redukuje neutralizáciu rekonvalescentnými sérami a monoklonálnymi protilátkami. Ide o klaster s označením VOC 202102/02 a obsahuje všetky mutácie opísané pre líniu B.1. 1. 7 s ďalšími mutáciami E484K v S proteíne, L730F v ORF1ab aj A173V a A398T v proteíne N. Nezávislé štúdie dospeli k záveru, že E484K najmä v kombinácii s N501Y má medzi jednotlivými mutáciami najväčší vplyv na antigénne zmeny a je spojený aj so zvýšenou väzbou na ľudský ACE2. Mutácia E484K bola nezávisle opísaná vo viacerých variantoch vrátane B.1.351 v Južnej Afrike, ale aj pri variante P1 v Brazílii(19).

 

Línia B 1.351

B.1.351 rodová línia, známa ako 20H/501Y.V2 (predtým 20C/501Y.V2), VOC – 202012/02 patrí do triedy Nextstrain – 20C, GISAID klad GH a línia PANGO B.1.351. Podobne ako predchádzajúca B1. 1. 7 patrí k líniám s veľkým množstvom mutácií (obrázok 3), pričom prvýkrát bola opísaná v októbri v Južnej Afrike(12). Variant je definovaný viacerými nesynonymnými aminokyselinovými zámenami v S proteíne. Napríklad v N-koncovej doméne S proteínu sa nachádza delécia 242-244del a aminokyselinová zámena arginínu za izoleucín – R246I. V RBD sa vyskytujú tri mutácie K417N, E484K a N501Y a jedna mutácia A701V je lokalizovaná v blízkosti miesta štiepenia furínom (12). Mutácia N501Y, ktorá je rovnaká aj v prípade variantu B.1. 1. 7, pravdepodobne spôsobuje zvýšenú vírusovú záťaž, a teda aj prenosnosť obidvoch variantov. Obzvlášť dôležitá je mutácia E484K v RBD, ktorá je považovaná za mutáciu, ktorej výsledkom je schopnosť vyhnúť sa monoklonálnym a sérovým protilátkovým odpovediam. Viac ako 90 % prípadov sekvenovaných v Južnej Afrike od konca novembra bolo spôsobených týmto variantom(12). Infekcie týmto variantom boli nedávno hlásené z Rakúska a rýchly nárast prípadov je pozorovaný aj vo Francúzsku(21). Prvé sporadické prípady sú zachytené aj na Slovensku.

 

Línia P1

Línia P.1, známa ako 20 J/501Y.V3, patrí do triedy Nextstrain – 20 B, GISAID klad GR a línia PANGO P.1. Dňa 12. januára 2021 bol definovaný ďalší variant SARS-CoV-2 v severnej Brazílii. Líniu P.1 definuje 17 aminokyselinových zmien, 3 delécie, 4 synonymné mutácie a jedna 4-nukleotidová inzercia (obrázok 4). Z tohto počtu sa 10 mutácií nachádza v S proteíne. Má však množstvo jedinečných mutácií definujúcich líniu vrátane niekoľkých totožných mutácií s líniou B. 1.351 známeho biologického významu, ako sú E484K, K417T a N501Y(13).

 

Línia B.1.526

Línia B.1.526 patrí do triedy Nextstrain – 20C a línia PAN- GO B.1.526. Analýza sekvencií vírusu nedávno identifikovala nový variant B.1.526, ktorý sa veľmi rýchlo rozšíril v oblasti New Yorku. Línia má päť charakteristických aminokyselinových substitúcií v Spike proteíne L5F, T95I, D253G, D614G a A701V. Mutácia D253G nastala práve v jednom z dvoch kľúčových zvyškov N-terminálnej domény Spike proteínu. V druhom aminokyselinovom zvyšku R246 sa pozorovala mutácia v línii B.1.351, ktorá pravdepodobne prispela k úniku pred neutralizačnými protilátkami. Predpokladá sa, že mutácia D253G môže mať podobný efekt(14). Navyše boli identifikované dve verzie variantu s mutáciou E484K alebo S477N vo väzbovej doméne pre receptor. Práve s kombináciou mutácie D253G vyvolávajú obavy z možnej rezistencie proti terapeutickým a vakcínami vyvolaným protilátkam(22).

 

Línia B.1.617

Súčasný (datované k aprílu 2021) drastický nárast počtu prípadov na ochorenie COVID-19 je zapríčinený z veľkej časti líniou B.1.617. Táto mutácia sa vyskytuje najmä v Indii a je označovaná ako „dvojitá mutácia“, keďže okrem línií charakteristických mutácií sa v RBD Spike proteínu nachádzajú dve významné aminokyselinové substitúcie E484Q a L452R, ktoré boli detegované vo dvoch známych líniách(23). Obe mutácie majú zvýšenú pevnosť väzby na ACE2 receptory(24). Vedci sa obávajú, že práve línia B1.617 by mohla zvýšiť pravdepodobnosť reinfekcií.

 

Záver

Vo viacerých známych líniách môžeme pozorovať prelínanie rovnakých mutácií. Napríklad mutácia E484K je pozorovaná v líniách P.1, B.1.351 a B.1.525. V líniách B.1. 1. 7,

B.1.351 aj P1 sa vyskytujú mutácie N501Y a delécia ORF1b del11288–11296. Súbor mutácií či delécií medzi líniami sa však javí ako úplne samostatný a predpokladá sa, že súvisí s rýchlym nárastom prípadov v lokalitách výskytu. Vzhľadom na súčasnú situáciu je preto nevyhnutné vírus naďalej skúmať a odhaľovať prípadné nové línie vírusu. Na základe sekvenčných analýz odhaľujúcich mutačné správanie vírusu SARS-CoV-2 existujú určité obavy týkajúce sa stále novoobjavujúcich sa mutácií, ktoré môžu významne ovplyvniť cielené terapie a, čo je dôležitejšie, práve vývoj vakcín. Preto veľká časť vedeckej komunity upriamila pozornosť na pochopenie vírusu, keďže práve vývoj účinnej a bezpečnej vakcíny môže zabrániť závažnosti ochorenia a znížiť úmrtnosť spojenú s týmto ochorením.

 

Poďakovanie

Táto publikácia vznikla vďaka podpore v rámci operačného programu Integrovaná infraštruktúra ITMS:313011ATL7, ktorý je spolufinancovaný zo zdrojov Európskeho fondu regionálneho rozvoja a s podporou Agentúry na podporu výskumu a vývoja na základe Zmluvy č. PP-COVID-20-0051.

 

LITERATÚRA

  1. Sanjuán R, Nebot MR, Chirico N, et al. Viral mutation rates. J Virol. 2010;84(19):9733-9748.
  2. Hillen HS, Kokic G, Farnung L, et Structure of replicating SARS- CoV-2 polymerase. Nature. 2020;584(7819):154-156.
  3. Koyama T, Platt D, Parida L. Variant analysis of SARS-CoV-2 Bull World Health Organ. 2020;98(7):495-504.
  1. Pachetti M, Marini B, Benedetti F, et Emerging SARS-CoV-2 mutation hot spots include a novel RNA-dependent-RNA polymerase variant. J Transl Med. 2020;18(1):179.
  2. Vilar S, Isom One Year of SARS-CoV-2: How Much Has the Virus Changed? Biology. 2021;10(2):91. doi:10.3390/biology10020091
  3. Hadfield J, Megill C, Bell SM, et al. Nextstrain: real-time tracking of pathogen Bioinformatics. 2018;34(23):4121-4123.
  4. Volz E, Hill V, McCrone JT, et Evaluating the Effects of SARS- CoV-2 Spike Mutation D614G on Transmissibility and Pathogenicity. Cell. 2021;184(1):64-75.e11.
  5. Baric RS. Emergence of a Highly Fit SARS-CoV-2 Variant. N Engl J Med. 2020;383(27):2684-2686.
  6. Eskier D, Karakülah G, Suner A, Oktay Y. RdRp mutations are associat- ed with SARS-CoV-2 genome PeerJ. 2020;8:e9587.
  7. Begum F, Mukherjee D, Das S, et Specific mutations in SARS- CoV2 RNA dependent RNA polymerase and helicase alter protein structure, dynamics and thus function: Effect on viral RNA replication. doi:10.1101/2020.04.26.063024
  8. Preliminary genomic characterisation of an emergent SARS-CoV-2 lineage in the UK defined by a novel set of spike Published December 18, 2020. Accessed February 22, 2021. https://virological.org/t/ preliminary-genomic-characterisation-of-an-emergent-sars-cov-2-line- age-in-the-uk-defined-by-a-novel-set-of-spike-mutations/563
  9. Tegally H, Wilkinson E, Giovanetti M, et Emergence and rapid spread of a new severe acute respiratory syndrome-related coronavirus 2 (SARS- CoV-2) lineage with multiple spike mutations in South Africa. bioRxiv. Published online December 22, 2020. doi:10.1101/2020.12.21.20248640
  10. Genomic characterisation of an emergent SARS-CoV-2 line- age in  Manaus:  preliminary  findings.  Published  January  12,  2021. Accessed    February    23,    2021.    https://virological.org/t/genom- ic-characterisation-of-an-emergent-sars-cov-2-lineage-in-manaus-prelim- inary-findings/586
  11. Lasek-Nesselquist E, Lapierre P, Schneider E, et . The localized rise of a B.1.526 SARS-CoV-2 variant containing an E484K mutation in New York State. Published online March 1, 2021. doi:10.1101/2021.02.26.21251868
  12. Kemp SA, Collier DA, Datir R, et Neutralising antibodies in Spike mediated SARS-CoV-2 adaptation. medRxiv. Published online December 29, 2020. doi:10.1101/2020.12.05.20241927
  13. WHO | SARS-CoV-2 V Published online January 22, 2021. Accessed February 22, 2021. https://www.who.int/csr/don/31-december- 2020-sars-cov2-variants/en/
  14. Volz E, Mishra S, Chand M, et Transmission of SARS-CoV-2 Lineage B.1.1.7 in England: Insights from linking epidemiological and genetic data. doi:10.1101/2020.12.30.20249034
  15. Horby P, Huntley C, Davies N, et NERVTAG note on B. 1.1. 7 severity. New & Emerging Threats Advisory Group, Jan. 2021;21.
  16. Chand M, Others. Investigation of novel SARS-COV-2 variant: Variant of Concern 202012/01 (PDF). Public Health England PHE. Published online
  17. Corum J, Zimmer Coronavirus Variants and Mutations. The New York Times. https://www.nytimes.com/interactive/2021/health/corona- virus-variant-tracker.html. Published March 22, 2021. Accessed April 20, 2021.
  18. COVID-19: point épidémiologique à Mayotte du 11 février 2021.  Accessed  February  22,  2021.  https://www.santepublique- france.fr/regions/ocean-indien/documents/bulletin-regional/2021/cov- id-19-point-epidemiologique-a-mayotte-du-11-fevrier-2021
  19. Zhou H, Dcosta BM, Samanovic MI, Mulligan MJ, Landau NR, Tada B.1.526 SARS-CoV-2 variants identified in New York City are neutralized by vaccine-elicited and therapeutic monoclonal antibodies. bioRxiv. Pub- lished online March 24, 2021. doi:10.1101/2021.03.24.436620
  20. Yadav PD, Sapkal GN, Abraham P, et Neutralization of variant under investigation B.1.617 with sera of BBV152 vaccinees. bioRxiv. Published online April 23, 2021:2021.04.23.441101. doi:10.1101/2021.04.23.441101
  21. Tchesnokova V, Kulakesara H, Larson L, et Acquisition of the L452R mutation in the ACE2-binding interface of Spike protein triggers recent massive expansion of SARS-Cov-2 variants. bioRxiv. Published online March 11, 2021. doi:10.1101/2021.02.22.432189