12 April 2020


Stranie asemănare cu virusul HIV. Este improbabil ca noul virus să fi apărut pe cale naturală – susține studiul de mai jos. Traducere integrală

După un studiu care susține că n-a fost creat în laborator, iată altul care sugerează contrariul:

„Această asemănare nefirească [uncanny] a noilor inserții din proteina spike a virusului 2019-nCoV cu HIV-1 gp120 și Gag este improbabil să fie întâmplătoare.

Mai mult, modelarea 3D sugerează că cel puțin 3 inserții din glicoproteina spike a 2019-nCoV converg spre a constitui componente-cheie ale sitului legării de receptor.
De observat, toate cele 4 inserții au valori pI care ar putea facilita interacțiunile virus-gazdăLuate laolaltă, constatările noastre sugerează o evoluție neconvențională a lui 2019-nCoV.”


Pre-print bioRxiv, postat online pe 31 ian. 2020; doi: http://dx.doi.org/10.1101/2020.01.30.927871Deținătorul drepturilor de autor pentru acest preprint, care nu a fost revizuit de cercetători omologi (peer-reviewed), este autorul/finanțatorul care a acordat bioRxiv licență să ofere preprint-ul în perpetuitate. El este disponibil pe baza unei licențe internaționale CC-BY-NC-ND 4.0

O asemănare nefirească [uncanny] a unor inserturi unice
în proteina spike a virusului 2019-nCoV 
cu HIV-1 gp120 și Gag

Autori: Prashant Pradhan$1,2, Ashutosh Kumar Pandey$1, Akhilesh Mishra$1, Parul Gupta1, Praveen Kumar Tripathi1, Manoj Balakrishnan Menon1, James Gomes1, Perumal Vivekanandan*1, Bishwajit Kundu*1

1 Kusuma School of Biological Sciences, Indian Institute of Technology, New Delhi-110016, India
2 Acharya Narendra Dev College, University of Delhi, New Delhi-110019, India
$ Contribuții egale
* Autori pentru corespondență – email: bkundu@bioschool.iitd.ac.in, vperumal@bioschool.iitd.ac.in

Traducere în limba română de Andrei Dîrlău

Abstract:
Asistăm în prezent la o epidemie majoră cauzată de noul coronavirus 2019-nCoV. Evoluția lui 2019-nCoV rămâne greu de stabilit. Noi am găsit 4 inserții în glicoproteina spike (S) care sunt unice virusului 2019-nCoV și nu sunt prezente în alți coronaviruși. Este important că reziduurile de aminoacizi din toate cele 4 inserții prezintă o identitate sau similaritate cu cele din HIV-1 gp120 sau HIV-1 Gag. Interesant este că, în ciuda faptului că inserțiile sunt discontinue pe secvența primară de aminoacid, modelarea 3D a lui 2019-nCoV sugerează că ele converg pentru a constitui situl legării de receptor. Este improbabil ca găsirea a 4 inserții unice în 2019-nCoV, toate prezentând identitate / similaritate cu reziduurile aminoacizi din proteinele structurale-cheie ale virusului HIV-1, să fie de natură accidentală [fortuitous] [s.n.]. Prezentul studiu oferă o abordare încă necunoscută a lui 2019-nCoV și aruncă lumină asupra evoluției și patogenității acestui virus, cu implicații importante în diagnosticarea lui.

Introducere
Coronavirușii (CoV) sunt viruși cu ARN de lanț unic sens pozitiv, care infectează animale și oameni. Ei se clasifică în 4 genuri pe baza specificității gazdei lor: Alfa-coronaviruși, Beta-coronaviruși, Gamma-coronaviruși și Delta-coronaviruși (Snijder et al., 2006). Există șapte tipuri cunoscute de CoV care includ 229E și NL63 (Genul Alfa-coronavirus), OC43, HKU1, MERS și SARS (Genul Beta-coronavirus). Dacă 229E, NL63, OC43 și HKU1 infectează de obicei oameni, epidemiile SARS și MERS au izbucnit în 2002 și respectiv  2012 când virusul a făcut saltul de la animale la oameni cauzând o mortalitate semnificativă (J. Chan et al., f.d.; J. F. W. Chan et al., 2015). În decembrie 2019 s-a raportat o altă epidemie de coronavirus în Wuhan, China, care de asemenea s-a transmis de la animale la oameni. Acest nou virus a primit de la OMS numele provizoriu de 2019-noul Coronavirus (2019-nCoV) (J. F.-W. Chan et al., 2020; Zhu et al., 2020). Există mai multe ipoteze despre originea lui 2019-nCoV, dar sursa acestei epidemii rămâne încă necunoscută.

Tiparul transmiterii lui 2019-nCoV este asemănător cu tiparele de transmitere documentate pentru epidemii anterioare, inclusiv prin contact corporal sau cu aerosoli de la persoanele infectate cu virusul.
S-au raportat din Wuhan cazuri, cauzate de infecție, de îmbolnăvire de la ușoară la severă și decese. Această epidemie s-a răspândit rapid în țări îndepărtate de China, precum Franța, Australia, SUA etc. Numărul de cazuri crește abrupt. Actualele noastre cunoștințe se limitează la secvențe din genomul virusului și date epidemiologice și clinice modeste. Analize comprehensive ale secvențelor disponibile de 2019-nCoV ar putea furniza indicii importante care să ajute la progrese în actuala noastră înțelegere privind modul în care să gestionăm epidemia în curs.

Glicoproteina spinului [spike] (S) a corononavirusului este despărțită în două subunități (S1 și S2). Subunitatea S1 ajută la legarea [binding] de receptor, iar subunitatea S2 facilitează fuziunea membranei (Bosch et al., 2003; Li, 2016). Glicoproteinele spinului coronovirușilor sunt factori importanți care determină tropismul țesuturilor și varietatea gazdelor. În plus, glicoproteinele spinului sunt țintele critice ale producerii unui vaccin (Du et al., 2013). Din acest motiv, proteinele spinului reprezintă partea cea mai amplu studiată a coronavirușilor. De aceea ne-am străduit să cercetăm glicoproteina spinului virusului 2019-nCoV, pentru a-i înțelege evoluția, secvențierea noilor trăsături și trăsăturile structurale, folosind instrumente computaționale.

Metodologia

Accesarea [retrieval] și alinierea secvențelor de acizi nucleici și proteine

Am accesat [retrieved] toate secvențele de coronavirus disponibile (n=55) din baza de date cu genomuri virale NCBI (https://www.ncbi.nlm.nih.gov/) și am folosit sistemul GISAID (Elbe & Buckland-Merrett, 2017) [https://www.gisaid.org/] pentru a accesa toate secvențele de lungime completă (n=28) ale virusului 2019-nCoV disponibile la  27 ianuarie 2020. S-a realizat alinierea secvențelor multiple ale tuturor genomurilor de coronaviruși, folosind software-ul MUSCLE (Edgar, 2004) bazat pe metoda joncțiunii între vecini [neighbour joining]. Din 55 genomuri de coronaviruși, s-au folosit 32 de genomuri reprezentative ale tuturor categoriilor pentru dezvoltarea arborelui filogenetic folosind software-ul MEGAX (Kumar et al., 2018). Cel mai apropiat virus înrudit s-a găsit a fi SARS CoV. Regiunea glicoproteinei lui SARS CoV și a lui 2019-nCoV au fost aliniate și vizualizate folosind software-ul Multalin (Corpet, 1988). Secvențele de amino-acid și nucleotide identificate au fost aliniate cu întreaga bază de date cu genomuri virale folosind BLASTp și BLASTn. S-a prezentat conservarea motivelor de nucleotide și amino-acizi în 28 variante clinice ale genomului 2019-nCoV prin realizarea alinierii de secvențe multiple folosind software-ul MEGAX. Structura tri-dimensională a glicoproteinei de 2019-nCoV a fost generată folosind serverul online SWISS-MODEL (Biasini et al., 2014), iar structura a fost marcată și vizualizată folosind PyMol (DeLano, 2002).

Rezultate

O asemănare nefirească / stranie [uncanny] a unor noi inserturi în proteina spinului virusului 2019-nCoV cu virușii HIV-1 gp120 și Gag

Arborele filogenetic al coronavirușilor de lungime completă [full-length] pe care i-am studiat sugerează că 2019-nCoV este strâns înrudit cu SARS CoV [Fig.1]. În plus și alte studii recente fac legătura între 2019-nCoV și SARS CoV. De aceea am comparat secvențele glicoproteinei spinului lui 2019-nCoV cu cea a virusului SARS CoV (Număr accesare NCBI: AY390556.1). La examinarea atentă a alinierii secvențelor am constatat că glicoproteina spinului 2019-nCoV conține 4 inserții [Fig.2]. În scopul de a investiga mai departe dacă aceste inserții sunt prezente și la alți coronaviruși, am realizat o aliniere de secvențe multiple ale secvențelor aminoacizilor glicoproteinei spinului tuturor coronavirușilor disponibili (n=55) [referință la Tabelul S.File1] din NCBI refseq (ncbi.nlm.nih.gov); aceasta include o secvență de 2019-nCoV [Fig.S1]. Am constatat că aceste 4 inserții [inserțiile 1, 2, 3 și 4] sunt unice lui 2019-nCoV și nu sunt prezente la alți coronaviruși analizați. Alt grup din China a documentat trei inserții comparând mai puține secvențe de glicoproteine de spin de coronaviruși (Zhou et al., 2020).


Figura 1: Genealogia maximei probabilități arată evoluția lui 2019- nCoV: s-a dedus istoria evolutivă folosind metoda Maximei Probabilități și modelul bazat pe matricea JTT. Este prezentat arborele cu cea mai mare valoare a logaritmului probabilității (12458.88). Arborele (arborii) inițial(i) pentru căutarea euristică s-a(u) obținut automat aplicând algoritmii Joncțiunii Vecinilor [Neighbor-Join] și BioNJ unei matrici de perechi de distanțe estimate folosind un model JTT, iar apoi selectând topologia cu valoarea superioară a logaritmului probabilității. Această analiză a implicat 5 secvențe de aminoacizi. În setul de date final au existat în total 1387 de poziții. Analizele evolutive s-au realizat în MEGA X.

 Figura 2: Alinierea secvențelor multiple între proteinele spinului virușilor 2019-nCoV și SARS. Secvențele proteinelor spinilor 2019-nCoV (Wuhan-HU-1, accesare NC_045512) și SARS CoV (GZ02, accesare AY390556) au fost aliniate folosind software-ul MultiAlin. Siturile diferențelor sunt evidențiate în căsuțe.

Am analizat apoi toate secvențele de lungime completă (n=28) ale lui 2019-nCoV în GISAID (Elbe & Buckland-Merrett, 2017) disponibile la 27 ianuarie 2020 pentru prezența acestor inserții. Întrucât majoritatea acestor secvențe nu sunt adnotate, am comparat secvențele de nucleotide ale glicoproteinei spike a tuturor secvențelor de 2019-nCoV disponibile, folosind BLASTp. În mod interesant, toate cele 4 inserții s-au conservat în absolut (100%) toate secvențele 2019-nCoV disponibile analizate [Fig.S2, Fig.S3].

Apoi am tradus genomul aliniat și am constatat că aceste inserții sunt prezente în toți virușii Wuhan 2019-nCoV cu excepția virusului 2019-nCoV cu liliacul ca gazdă [Fig.S4]. Intrigați de cele 4 inserții extrem de bine conservate unice virusului 2019-nCoV, am dorit să înțelegem care este originea lor. În acest scop am folosit alinierea locală 2019-nCoV cu fiecare inserție drept interogare [query] în raport cu toate genomurile de viruși, considerând drept potriviri [hits] secvențele cu acoperire 100%.
Surprinzător, fiecare dintre cele patru inserții s-au aliniat cu segmente scurte de proteine ale Virusului Imunodeficienței Umane-1 (HIV-1). Pozițiile aminoacizilor inserțiilor din 2019-nCoV și ale reziduurilor corespondente din HIV-1 gp120 și HIV-1 Gag sunt arătate în Tabelul 1. Primele 3 inserții (inserțiile 1, 2 și 3 aliniate la scurte segmente de reziduuri de aminoacizi în HIV-1 gp120, inserția 4 aliniată la HIV-1 Gag. Inserția 1 (6 reziduuri de aminoacizi) și inserția 2 (6 reziduuri de aminoacizi) din glicoproteina spike a lui 2019-nCoV sunt 100% identice cu reziduurile cartografiate / mapate [mapped to] pe HIV-1 gp120. Inserția 3 (12 reziduuri de aminoacizi) din 2019-nCoV e cartografiată / mapată [maps tope HIV-1 gp120 cu lacune [vezi Tabelul 1]. Inserția 4 (8 reziduuri de aminoacizi) e cartografiată / mapată [maps tope HIV-1 Gag cu lacune [gaps].

Deși cele 4 inserții reprezintă segmente scurte ne-contigue de aminoacizi din glicoproteina spike a lui 2019-nCoV, faptul că toate trei au în comun aminoacizi identici sau asemănători cu HIV-1 gp120 și HIV-1 Gag (dintre toate proteinele de viruși adnotați) sugerează că aceasta nu este o constatare întâmplătoare. Cu alte cuvinte, ne putem aștepta la o corespondență [match] sporadică pentru un segment [stretch] de 6-12 reziduuri contigue de aminoacizi într-o proteină neînrudită. Totuși, este improbabil ca toate cele 4 inserții din glicoproteina spike a lui 2019-nCoV să se potrivească din întâmplare cu 2 proteine structurale-cheie ale unui virus neînrudit (HIV-1). [s.n.]

Reziduurile de aminoacizi ale inserțiilor 1, 2 și 3 ale glicoproteinei spike a lui 2019-nCoV care s-au mapat / suprapus cartografic [mapped tocu HIV-1 făceau parte din domeniile V4, V5 și respectiv V1 din gp120 [Tabelul 1]. Întrucât inserțiile 2019-nCoV s-au mapat / suprapus cartografic [mapped tope regiuni variabile din HIV-1, ele nu au fost ubicue în HIV-1 gp120, dar au fost limitate la secvențele selectate de HIV-1 [referire la S.File1] în primul rând din Asia și Africa.

Proteina HIV-1 Gag permite interacțiunea virusului cu suprafața încărcată negativ a gazdei (Murakami, 2008), iar o încărcare pozitivă înaltă pe proteina Gag este o trăsătură-cheie a interacțiunii dintre gazdă și virus. Analizând valorile pI pentru fiecare dintre aceste 4 inserții pe 2019-nCoV și segmentele corespunzătoare de reziduuri de aminoacizi din proteine de HIV-1, am constatat că: a) valorile pI erau foarte asemănătoare pentru fiecare pereche analizată; b) majoritatea acestor valori pI erau 10±2 [Referire la Tabelul 1] . Desigur, în ciuda lacunelor din inserțiile 3 și 4, valorile pI au fost comparabile. Această uniformitate a valorilor pI pentru toate cele 4 inserții merită a fi cercetate în continuare.

Deoarece nici una dintre aceste 4 inserții nu sunt prezente în nici un alt coronavirus, regiunea genomică care codează aceste inserții reprezintă candidații ideali pentru a proiecta primari [primers] care să-l poată distinge pe 2019-nCoV de alți coronaviruși.
Tabelul 1: Secvențele aliniate ale lui 2019-nCoV și proteina gp120 a lui HIV-1 cu pozițiile lor în secvența primară a proteinei. Toate aceste inserții au o mare densitate de reziduuri încărcate pozitiv. Fragmentele șterse din inserțiile 3 și 4 măresc raportul dintre încărcătura [charge] pozitivă și aria suprafeței. *a se vedea Tabelul suplimentar 1 pentru cifrele de accesare.

Noile inserții fac parte din situl de legare [binding] la receptor al virusului 2019-nCoV

Pentru a obține informații structurale și a înțelege rolul acestor inserții în glicoproteina lui 2019-nCoV, i-am modelat structura pe baza structurii disponibile a glicoproteinei spike a virusului SARS (PDB: 6ACD.1.A). Compararea structurii modelate dezvăluie că, deși inserțiile 1, 2 și 3 se află în locații non-contigue din secvența primară a proteinei, ele se pliază [fold] pentru a constitui partea din situl de legare al glicoproteinei care recunoaște receptorul gazdei (Kirchdoerfer et al., 2016) (Figura 4). Inserția 1 corespunde cu NTD (N-terminal domain), iar inserțiile 2 și 3 corespund cu CTD (C-terminal domain) al subunității S1 din glicoproteina spike a 2019-nCoV. Inserția 4 este la joncțiunea SD1 (sub-domeniul 1) cu SD2 (sub-domeniul 2) al subunității S1 (Ou et al., 2017). Putem specula că aceste inserții conferă o flexibilitate suplimentară sitului de legare a glicoproteinei, formând o buclă hidrofilică în structura proteinei care poate facilita sau augmenta interacțiunile dintre virus și gazdă. [s.n.]
Figura 3. Glicoproteina spike modelată homo-trimer a virusului 2019-nCoV. Inserțiile din proteina anvelopei virusului HIV sunt reprezentate prin biluțe colorate, prezente la situl de legare [binding] al proteinei.

Analiza evolutivă a virusului 2019-nCoV

S-a speculat că virusul 2019-nCoV ar fi o variantă de Coronavirus derivată dintr-o sursă animală care s-a transmis la om. Considerând schimbarea specificității gazdei, am decis să studiem secvențele de glicoproteină spike (proteină S) a virusului. Proteinele S sunt proteine de suprafață care ajută virusul la recunoașterea gazdei și atașarea de ea. Astfel, o schimbare a acestor proteine se poate reflecta într-o schimbare a specificității gazdei virusului. Pentru a afla care sunt alterările genei proteinei S a virusului 2019-nCoV și consecințele lor asupra re-aranjărilor structurale, am făcut analiza in-sillico a virusului 2019-nCoV în raport cu toți ceilalți viruși. Alinierea secvențelor multiple între secvențele aminoacizilor proteinei S a virușilor 2019-nCoV, Bat-SARS-Like, SARS-GZ02 și MERS, a dezvăluit că proteina S a evoluat cu diversitatea semnificativă cea mai apropiată din virusul SARS-GZ02 (Figura 1).

Inserții în regiunea proteinei spike a virusului 2019-nCoV

Deoarece proteina S a lui 2019-nCoV are cel mai apropiat strămoș comun cu SARS GZ02, codarea secvențelor pentru proteinele spike ale acestor doi viruși a fost comparată folosind software-ul MultiAlin. Am constatat patru inserții noi în proteina lui 2019-nCoV – „GTNGTKR” (IS1), „HKNNKS” (IS2), „GDSSSG” (IS3) și „QTNSPRRA” (IS4) (Figura 2). Spre surprinderea noastră, aceste inserții în secvențe nu numai că erau absente în proteina S a virusului SARS, dar nici n-au fost observate în nici un alt membru al familiei Coronaviridae (Figura suplimentară). Acest lucru este uimitor [startling] deoarece este foarte improbabil [quite unlikely] ca un virus să dobândească inserții atât de unice pe cale naturală într-o perioadă scurtă de timp [s.n.]

Inserțiile au în comun asemănări cu HIV

Inserțiile s-au observat a fi prezente în toate secvențele genomice ale virusului 2019-nCoV disponibile din izolările clinice [clinical isolates] recente (Figura suplimentară 1). Pentru a afla sursa acestor inserții în 2019-nCoV, s-a realizat o aliniere locală cu BLASTp, folosind aceste inserții drept interogare a întregului genom viral. În mod neașteptat, toate inserțiile s-au aliniat cu Virusul Imunodeficienței Umane-1 (HIV-1) [s.n.]. Analizarea în continuare a dezvăluit că secvențele HIV-1 aliniate cu 2019-nCoV au fost derivate din glicoproteina de suprafață gp120 (poziții secvențe aminoacizi: 404-409, 462-467, 136-150) și din proteina Gag (amino-acid 366-384) (Tabel 1). Proteina Gag a virusului HIV este implicată în legarea [binding] de membrana gazdei, împachetarea virusului și formarea de particule asemănătoare cu virușii. Gp120 joacă un rol crucial în recunoașterea celulei gazdă prin legarea de receptorul primar CD4. Această legare induce re-aranjări structurale în GP120, creând un sit de legare cu înaltă afinitate pentru un co-receptor chemokinic precum CXCR4 și/sau CCR5.

Discuție

Actuala epidemie de 2019-nCoV justifică o temeinică cercetare și înțelegere a capacității lui de a infecta oamenii. Având în vedere că a avut loc o schimbare clară a preferinței pentru gazdă a acestui virus în raport cu coronavirușii precedenți, am studiat schimbarea din proteina spike produsă la 2019-nCoV față de alți viruși. Am găsit patru noi inserții în proteina S a lui 2019-nCoV când l-am comparat cu ruda lui cea mai apropiată, SARS CoV. Secvența genomică din cele 28 izolări clinice recente a arătat că, pentru aceste inserții, codarea secvențelor se conservă la toate acele izolate. Aceasta indică faptul că aceste inserții au fost dobândite cu preferință [preferably] de 2019-nCoV, conferindu-i un avantaj suplimentar de supraviețuire și infecțiozitate. [s.n.]

Mergând și mai în profunzime, am constatat că aceste inserții erau similare cu HIV-1. Rezultatele noastre evidențiază o relație uimitoare între proteina gp120 și Gag a virusului HIV cu glicoproteina spike a virusului 2019-nCoV. Aceste proteine sunt critice pentru ca virușii să identifice și să se prindă de celulele gazdei și pentru agregarea virală (Beniac et al., 2006). Deoarece proteinele de suprafață sunt responsabile de tropismul gazdei, schimbările din aceste proteine implică o schimbare a specificității gazdei virusului. Potrivit relatărilor din China, s-a produs o creștere a specificității gazdei în cazul lui 2019-nCoV, întrucât se știe că la origine virusul infecta animale și nu oameni, dar după mutații el a dobândit un tropism și pentru oameni. [s.n.]

Mergând mai departe, modelarea 3D a structurii proteinei a scos la iveală faptul că aceste inserții sunt prezente în situl de legare [binding] al lui 2019-nCoV. Din cauza prezenței de motive [motifs] gp120 în glicoproteina spike a lui 2019-nCoV la domeniul lui de legare, noi propunem ideea că aceste inserții de motive i-au putut conferi o afinitate mărită față de receptorii celulei gazdă [s.n.]. Mai mult, această schimbare structurală ar fi putut de asemenea crește varietatea de celule-gazdă pe care le poate infecta 2019-nCoV. Din câte știm, funcția acestor motive [motifs] încă nu este clară în cazul HIV și e nevoie ca ea să fie explorată. Schimbul de material genetic între viruși este binecunoscut și asemenea schimburi critice evidențiază riscul și necesitatea de a se investiga relațiile între familii de viruși aparent neînrudite între ele.

Concluzii

Analiza pe care am făcut-o glicoproteinei spike a virusului 2019-nCoV a dezvăluit mai multe elemente interesante: În primul rând, am identificat 4 inserții unice în glicoproteina spike a 2019-nCoV care nu sunt prezente în nici un alt coronavirus găsit până acum. Spre surpriza noastră, toate cele 4 inserții din 2019-nCoV s-au suprapus cartografic [mapped] pe scurte segmente de aminoacizi din HIV-1 gp120 și Gag printre toate proteinele virușilor adnotați din baza de date NCBI. Această asemănare nefirească [uncanny] a noilor inserții din proteina spike a lui 2019-nCoV cu HIV-1 gp120 și Gag este improbabil să fie întâmplătoare [s.n.]. Mai mult, modelarea 3D sugerează că cel puțin 3 dintre inserțiile unice care sunt non-contigue în secvența proteinei primare a glicoproteinei spike a 2019-nCoV converg spre a constitui componente-cheie ale sitului legării de receptor [s.n.]. De observat că toate cele 4 inserții au valori pI în jurul numărului „10” care ar putea facilita interacțiunile virus-gazdă [s.n.]. Luate laolaltă, constatările noastre sugerează o evoluție neconvențională [s.n.] a lui 2019-nCoV care justifică investigarea în continuare. Lucrarea noastră evidențiază noile aspecte evolutive ale lui 2019-nCoV și are implicații asupra patogenezei și diagnosticării acestui virus.

Referințe 
-       Beniac, D. R., Andonov, A., Grudeski, E., & Booth, T. F. (2006). Architecture of the SARS coronavirus prefusion spike. Nature Structural and Molecular Biology, 13(8), 751–752. https://doi.org/10.1038/nsmb1123
-       Biasini, M., Bienert, S., Waterhouse, A., Arnold, K., Studer, G., Schmidt, T., Kiefer, F., Cassarino, T. G., Bertoni, M., Bordoli, L., & Schwede, T. (2014). SWISS-MODEL: Modelling protein tertiary and quaternary structure using evolutionary information. Nucleic Acids Research. https://doi.org/10.1093/nar/gku340
-       Bosch, B. J., van der Zee, R., de Haan, C. A. M., & Rottier, P. J. M. (2003). The Coronavirus Spike Protein Is a Class I Virus Fusion Protein: Structural and Functional Characterization of the Fusion Core Complex. Journal of Virology, 77(16), 8801–8811. https://doi.org/10.1128/jvi.77.16.8801-8811.2003
-       Chan, J. F.-W., Kok, K.-H., Zhu, Z., Chu, H., To, K. K.-W., Yuan, S., & Yuen, K.-Y. (2020). Genomic characterization of the 2019 novel human-pathogenic coronavirus isolated from a patient with atypical pneumonia after visiting Wuhan. Emerging Microbes & Infections, 9(1), 221–236. https://doi.org/10.1080/22221751.2020.1719902
-       Chan, J. F. W., Lau, S. K. P., To, K. K. W., Cheng, V. C. C., Woo, P. C. Y., & Yuen, K.-Y. (2015). Middle East Respiratory Syndrome Coronavirus: Another Zoonotic Betacoronavirus Causing SARS-Like Disease. https://doi.org/10.1128/CMR.00102-14
-       Chan, J., To, K., Tse, H., Jin, D., microbiology, K. Y.-T. in, & 2013, undefined. (n.d.). Interspecies transmission and emergence of novel viruses: lessons from bats and birds. Elsevier.
-       Corpet, F. (1988). Multiple sequence alignment with hierarchical clustering. Nucleic Acids Research. https://doi.org/10.1093/nar/16.22.10881
-       DeLano, W. L. (2002). The PyMOL Molecular Graphics System, Version 1.1. Schr{ö}dinger LLC. https://doi.org/10.1038/hr.2014.17
-       Du, L., Zhao, G., Kou, Z., Ma, C., Sun, S., Poon, V. K. M., Lu, L., Wang, L., Debnath, A. K., Zheng, B.-J., Zhou, Y., & Jiang, S. (2013). Identification of a Receptor-Binding Domain in the S Protein of the Novel Human Coronavirus Middle East Respiratory Syndrome Coronavirus as an Essential Target for Vaccine Development. Journal of Virology, 87(17), 9939–9942. https://doi.org/10.1128/jvi.01048-13
-       Edgar, R. C. (2004). MUSCLE: Multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Research. https://doi.org/10.1093/nar/gkh340
-       Elbe, S., & Buckland-Merrett, G. (2017). Data, disease and diplomacy: GISAID’s innovative contribution to global health. Global Challenges. https://doi.org/10.1002/gch2.1018
-       Kirchdoerfer, R. N., Cottrell, C. A., Wang, N., Pallesen, J., Yassine, H. M., Turner, H. L., Corbett, K. S., Graham, B. S., McLellan, J. S., & Ward, A. B. (2016). Pre-fusion structure of a human coronavirus spike protein. Nature. https://doi.org/10.1038/nature17200
-       Kumar, S., Stecher, G., Li, M., Knyaz, C., & Tamura, K. (2018). MEGA X: Molecular evolutionary genetics analysis across computing platforms. Molecular Biology and Evolution. https://doi.org/10.1093/molbev/msy096
-       Li, F. (2016). Structure, Function, and Evolution of Coronavirus Spike Proteins. Annual Review of Virology, 3(1), 237–261. https://doi.org/10.1146/annurev-virology-110615-042301
-       Murakami, T. (2008). Roles of the interactions between Env and Gag proteins in the HIV-1 replication cycle. Microbiology and Immunology, 52(5), 287–295. https://doi.org/10.1111/j.1348-0421.2008.00008.x
-       Ou, X., Guan, H., Qin, B., Mu, Z., Wojdyla, J. A., Wang, M., Dominguez, S. R., Qian, Z., & Cui, S. (2017). Crystal structure of the receptor binding domain of the spike glycoprotein of human betacoronavirus HKU1. Nature Communications. https://doi.org/10.1038/ncomms15216
-       Snijder, E. J., van der Meer, Y., Zevenhoven-Dobbe, J., Onderwater, J. J. M., van der Meulen, J., Koerten, H. K., & Mommaas, A. M. (2006). Ultrastructure and origin of membrane vesicles associated with the severe acute respiratory syndrome coronavirus replication complex. Journal of Virology, 80(12), 5927–5940. https://doi.org/10.1128/JVI.02501-05
-       Zhou, P., Yang, X.-L., Wang, X.-G., Hu, B., Zhang, L., Zhang, W., Si, H.-R., Zhu, Y., Li, B., Huang, C.-L., Chen, H.-D., Chen, J., Luo, Y., Guo, H., Jiang, R.-D., Liu, M.-Q., Chen, Y., Shen, X.-R., Wang, X., … Shi, Z.-L. (2020). Discovery of a novel coronavirus associated with the recent pneumonia outbreak in humans and its potential bat origin. BioRxiv. https://doi.org/10.1101/2020.01.22.914952
-       Zhu, N., Zhang, D., Wang, W., Li, X., Yang, B., Song, J., Zhao, X., Huang, B., Shi, W., Lu, R., Niu, P., Zhan, F., Ma, X., Wang, D., Xu, W., Wu, G., Gao, G. F., & Tan, W. (2020). A Novel Coronavirus from Patients with Pneumonia in China, 2019. New England Journal of Medicine, NEJMoa2001017. https://doi.org/10.1056/NEJMoa2001017 
Fig. S1 Alinierea secvențelor multiple de glicoproteine a familiei coronaviridae, reprezentând toate patru inserțiile.
Fig. S2: Toate patru inserțiile sunt prezente în cele 28 de genomuri aliniate ale virusului Wuhan 2019-nCoV obținute din GISAID. Lacuna din CoV de tipul SARS-de-liliac din ultimul rând arată că inserțiile 1 și 4 sunt foarte unice virusului 2019-nCoV din Wuhan.
Fig. S3 Arborele filogenetic al genomului celor 28 isolate clinice de 2019-nCoV, inclusiv unul având liliacul drept gazdă.

Fig 4 suplimentară. Aliniere a genomului familiei Coronaviridae. Secvențele evidențiate cu negru sunt inserții reprezentate aici.

No comments:

Post a Comment