摘要:剑桥论文欲作证,全面视角莫偏差。即使剑桥是牛校,论文还要多思考。盲目崇信不可取,数据全面是基础。羡慕作者一家亲,吾辈拼命无场景。今生不知何处归,只愿临终不后悔。
目录:
1、辟谣或分析列表
2、波动与起伏
3、剑桥大学的一篇论文
4、作者一家的信息
5、北京市政府网站404
6、抗疫进行时
7、日常记录
8、论文原文及翻译
9、相关文字
今天会有一篇论文引用,进行一些翻译和科普工作,目前感觉这篇论文应该没什么问题,但是研究中出现偏差和失误是很常见的,众多的数据中查找出真正有用的数据信息也很复杂,人的判定总是有出错的可能的,因此,我并不能保证这篇论文是100%正确的,只能认为这篇论文代表着科研中针对这次新冠病毒的一个研究认知。详情请看第3、4、8三节。
1、辟谣或分析列表
先列出一个后续需要辟谣或者科普的问题列表,今后一个一个写,写完一个删掉一个,有问题再拉回来讨论一个的方式推进:
1.1、人工智能与动物中自我意识的冲突,谈人工智能的未来威胁风险;
1.2、纳米技术的真假;
1.3、石墨烯技术鉴真伪(已解答,见:《武汉坚守第七十一天——正式辟谣石墨烯,美国也有跳大神》及《武汉坚守第七十二天——软通动力真卑鄙,盈科律所有讼棍!》);
1.4、定位技术的用途和用法——谈谈目前定位类产品的缺点和问题以及如何改进;(已解答,见:《武汉坚守第五十四天——胖人容易被感染,荷兰分析有数据》)
1.5、去人化记录技术——如何保障数据真实有效;(已解答,见:《武汉坚守第五十三天——生前有心多尽孝,死后不必去嚎丧》)
1.6、星链计划与5G的关系;(已解答,见:《武汉坚守第五十二天——莫名其妙不明了,抗疫遭遇网贷坑》,实际应该是:武汉坚守第五十天——半百之时转瞬到,解惑星链计划时——已阵亡)
1.7、传统医学(中医,西医),当代医学(中医/西医+当代科技手段);(已解答,见:《武汉坚守第三十七天——幸存者偏差,双盲测试与生命科学》)
朋友们也可以留言提出来,然后,青润看看自己能否解答,不能解答的,就找朋友来支持解答。
2、波动与起伏
昨天的文字发表以后,大家有了一些讨论,不过,直接骂我的人好像没有出现,也许是因为我刻意避开了一些不友善的群,也退出了一些群。
但是,昨天看到的最让人不舒服的言辞就在这张图上,唉,我只能说,良知,其他的就不评价了。
我更想说一句话,看看这样的图,最大的价值也许就是治疗颈椎病!
进行这样恶毒诬陷的人,我不知道他们是不是真的是拿钱干活的。攻击钟院士之后,又来攻击张主任,干脆三个一勺烩,这是彻底的对中国抗疫过程的医学界的黑。
随后今天早上,看到了一篇论文,我特地去查了一下,下载了原文,还找了一些资料,不太全,就放到下面。
3、剑桥大学的一篇论文
论文的原文比较难读,就放在最后第8节,大家可以自己去查看,复制然后自行翻译。文中用了网络翻译软件,翻译的结果还不错,应该都能看懂。
为了进行合适的翻译,我没有选择国内的翻译工具,用的是google的翻译(这个功能在国内一直可以使用,其实翻译的准确度不是最高的)。
翻译的结果可以看第8节的内容,同时我也把论文的原文放在了上面。
同时基于科学研究的惯例,需要强调一下,这篇论文代表一部分的研究成果,是不是代表全部,目前无法判断,只能等待专业的科研人员进行后续的研究和分析,相信相关的论文在近期甚至一到两年内都会有一个集中的爆发。
因为研究的时间和数据有了一定的积累了,这不是新冠病毒爆发之初的情况了。另外,也不要因此就认为病毒是美国人人造的,这也是一种错误,即使论文中提到了如下观点:
在对160个完整的人类严重急性呼吸系统综合症冠状病毒2(SARS-Cov-2)基因组进行的系统进化网络分析中,我们发现了三个主要的变异体,它们的氨基酸变化不同,我们将其命名为A,B和C,其中A为根据蝙蝠的外祖先型冠状病毒。A和C类型在东亚以外地区(即欧洲人和美国人中)的比例很高。相比之下,B型是东亚最常见的类型,其祖先基因组似乎没有先突变成衍生的B型就不会扩散到东亚以外,这表明在亚洲以外对该类型的创始人具有影响力或免疫或环境抵抗力。该网络忠实地竞争记录在案的冠状病毒病2019(COVID-19)病例的感染途径,这表明同种异体性网络同样可以成功地用于帮助追踪未记录的COVID-19感染源,然后可以对其进行隔离以防止疾病的再次传播全世界。
我们仍然应该客观的认为,文中并没有指出病毒是蓄意传播的,A型病毒有可能传播能力没有B型那么强。所以,才会在武汉尤其是我国国民卫生保护能力较弱的范围内出现较大范围的传播,随后变异体进入了各个国家。
另外,160个完整的病毒基因组,不知道是否真的覆盖完整了,也许还需要更多的数据,科研就是这样的,数据越多,准确性越高,数据越少,争议越多。
一句话,专业的事情交给专业的人去做,不懂的人,不要瞎猜,最后搞乱了所有的事情。
前几天还看到有人在黑青岛援鄂医疗队去世的那位医生,说这就是新冠肺炎感染。我真想骂他,然后直接选择了拉黑,不理会,因为和这种人你是没法讲道理的,因为他本来就是什么都不懂的。还就会拿着鲁迅先生的那句话来表示自己是个文化人,我是不惮以最坏的恶意揣测中国人的。
估计除了这句话,他什么都不懂。
4、作者一家的信息
为了防止不必要的争议,还特地找朋友查询了作者一家人的信息,以避免是国人伪造,因此查到了下面的信息:
看起来不像是中国大陆捐助的科研人员,如果有更多的信息,欢迎朋友们给我留言或者单独发送给我。
5、北京市政府网站404
今天是4月份,应该提交北京市的企业补贴,于是重新回到北京市政府网站,结果扫码进去以后,出来的是404.
第一页:
第二页:
6、抗疫进行时
需要做一个说明,支付宝的绿码也可以使用,所以小区门口是两个二维码,一个是微信的,一个是支付宝的,这个前天的文字有个疏漏,今天做个补充。
7、日常记录
昨天下午下雨,于是一不小心午休过了时间,就没有去超市,出去取了两个快递,现在我已经可以出去了。
另外,发布一些物价信息:
京东的面粉价格又有了波动,今天贴一下。
其他的物价信息如下:
最后这个榴莲千层,价格应该是很合适的,可惜,我母亲不能吃,我就尽量不让她馋了。
8、论文原文及翻译
In aphylogenetic network analysis of 160 complete human severe acute respiratorysyndrome coronavirus 2 (SARS-Cov-2) genomes, we find three central variantsdistinguished by amino acid changes, which we have named A, B, and C, with Abeing the ancestral type according to the bat outgroup coronavirus. The A and Ctypes are found in significant proportions outside East Asia, that is, inEuropeans and Americans. In contrast, the B type is the most common type inEast Asia, and its ancestral genome appears not to have spread outside EastAsia without first mutating into derived B types, pointing to founder effectsor immunological or environmental resistance against this type outside Asia.The network faithfully traces routes of infections for documented coronavirusdisease 2019 (COVID-19) cases, indicating that phylogenetic networks canlikewise be successfully used to help trace undocumented COVID-19 infectionsources, which can then be quarantined to prevent recurrent spread of thedisease worldwide.
SARS-CoV-2evolution | subtype | ancestral type The search for human origins seemed totake a step forward with the publication of the global human mitochondrial DNA tree(1). It soon turned out, however, that the tree-building method did not facilitatean unambiguous interpretation of the data. This motivated the development, inthe early 1990s, of phylogenetic network methods which are capable of enablingthe visualization of a multitude of optimal trees (2, 3). This network approach,based on mitochondrial and Y chromosomal data, allowed us to reconstruct theprehistoric population movements which colonized the planet (4, 5). Thephylogenetic network approach from 2003 onward then found application in thereconstruction of language prehistory (6). It is now timely to apply thephylogenetic network approach to virological data to explore how this methodcan contribute to an understanding of coronavirus evolution.
Inearly March 2020, the GISAID database (https://www. gisaid.org/) contained acompilation of 253 severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2)complete and partial genomes contributed by clinicians and researchers from acrossthe world since December 2019. To understand the evolution of this virus withinhumans, and to assist in tracing infection pathways and designing preventivestrategies, we here present a phylogenetic network of 160 largely completeSARS-Cov-2 genomes (Fig. 1).
Zhouet al. (7) recently reported a closely related bat coronavirus, with 96.2%sequence similarity to the human virus. We use this bat virus as an outgroup,resulting in the root of the network being placed in a cluster of lineageswhich we have labeled ¡°A.¡± Overall, the network, as expected in an ongoing outbreak,shows ancestral viral genomes existing alongside their newly mutated daughtergenomes.
Thereare two subclusters of A which are distinguished by the synonymous mutationT29095C. In the T-allele subcluster, four Chinese individuals (from thesouthern coastal Chinese province of Guangdong) carry the ancestral genome,while three Japanese and two American patients differ from it by a number ofmutations. These American patients are reported to have had a history ofresidence in the presumed source of the outbreak in Wuhan.
TheC-allele subcluster sports relatively long mutational branches and includesfive individuals from Wuhan, two of which are represented in the ancestralnode, and eight other East Asians from China and adjacent countries. It is noteworthythat nearly half (15/33) of the types in this subcluster, however, are found outsideEast Asia, mainly in the United States and Australia.
Twoderived network nodes are striking in terms of the number of individualsincluded in the nodal type and in mutational branches radiating from thesenodes. We have labeled these phylogenetic clusters B and C.
Fortype B, all but 19 of the 93 type B genomes were sampled in Wuhan (n = 22), inother parts of eastern China (n = 31), and, sporadically, in adjacent Asiancountries (n = 21). Outside of East Asia, 10 B-types were found in viralgenomes from the United States and Canada, one in Mexico, four in France, twoin Germany, and one each in Italy and Australia. Node B is derived from A bytwo mutations: the synonymous mutation T8782C and the nonsynonymous mutationC28144T changing a leucine to a serine. Cluster B is striking with regard tomutational branch lengths: While the ancestral B type is monopolized (26/26genomes) by East Asians, every single (19/19) B-type genome outside of Asia hasevolved mutations. This phenomenon does not appear to be due to the month-longtime lag and concomitant mutation rate acting on the viral genome before itspread outside of China (Dataset S1, Supplementary Table 2). A complex founderscenario is one possibility, and a different explanation worth considering isthat the ancestral Wuhan B-type virus is immunologically or environmentallyadapted to a large p of the East Asian population, and may need to mutateto overcome resistance outside East Asia.
Significance
Thisis a phylogenetic network of SARS-CoV-2 genomes sampled from across the world.These genomes are closely related and under evolutionary selection in theirhuman hosts, sometimes with parallel evolution events, that is, the same virus mutationemerges in two different human hosts. This makes character-based phylogeneticnetworks the method of choice for reconstructing their evolutionary paths andtheir ancestral genome in the human host. The network method has been used inaround 10,000 phylogenetic studies of diverse organisms, and is mostly knownfor reconstructing the prehistoric population movements of humans and forecological studies, but is less commonly employed in the field of virology.
Authorcontributions: P.F. and M.F. performed research; P.F., L.F., and M.F. analyzeddata; P.F. and M.F. performed statistical analyses; P.F., C.R., and M.F. wrotethe paper; and C.R. wrote the Introduction.
Reviewers:T.K., Katholieke Universiteit Leuven; and C.S., University Medical Center Hamburg-Eppendorf.
Theauthors declare no competing interest.
Thisopen access article is distributed under Creative Commons Attribution License4.0 (CC BY).
1Towhom correspondence may be addressed. Email: [email protected] or [email protected] ac.uk.
Thisarticle contains supporting information online athttps://www.pnas.org/lookup/suppl/ doi:10.1073/pnas.2004999117/-/DCSupplemental.
Type Cdiffers from its parent type B by the nonsynonymous mutation G26144T whichchanges a glycine to a valine. In the dataset, this is the major European type(n = 11), with representatives in France, Italy, Sweden, and England, and inCalifornia and Brazil. It is absent in the mainland Chinese sample, but evidentin Singapore (n = 5) and also found in Hong Kong, Taiwan, and South Korea.
Onepractical application of the phylogenetic network is to reconstruct infectionpaths where they are unknown and pose a public health risk. The following caseswhere the infection history is well documented may serve as illustrations (SIAppendix).
On 25February 2020, the first Brazilian was reported to have been infected followinga visit to Italy, and the network algorithm reflects this with a mutationallink between an Italian and his Brazilian viral genome in cluster C (SIAppendix, Fig. S1). In another case, a man from Ontario had traveled from Wuhanin central China to Guangdong in southern China and then returned to Canada,where he fell ill and was conclusively diagnosed with coronavirus disease 2019(COVID-19) on 27 January 2020. In the phylogenetic network (SI Appendix, Fig.S2), his virus genome branches from a reconstructed ancestral node, withderived virus variants in Foshan and Shenzhen (both in Guangdong province), inagreement with his travel history. His virus genome now coexists with those ofother infected North Americans (one Canadian and two Californians) whoevidently share a common viral genealogy. The case of the single Mexican viralgenome in the network is a documented infection diagnosed on 28 February 2020in a Mexican traveler to Italy. Not only does the network confirm the Italianorigin of the Mexican virus (SI Appendix, Fig. S3), but it also implies thatthis Italian virus derives from the first documented German infection on 27January 2020 in an employee working for the Webasto company inMunich, who, inturn, had contracted the infection from a Chinese colleague in Shanghai who hadreceived a visit by her parents from Wuhan. This viral journey from Wuhan toMexico, lasting a month, is documented by 10 mutations in the phylogeneticnetwork.
Thisviral network is a snapshot of the early stages of an epidemic before thephylogeny becomes obscured by subsequent migration and mutation. The questionmay be asked whether the rooting of the viral evolution can be achieved at thisearly stage by using the oldest available sampled genome as a root. As SI Appendix,Fig. S4 shows, however, the first virus genome that was sampled on 24 December2019 already is distant from the root type according to the bat coronavirusoutgroup rooting.
Thedescribed core mutations have been confirmed by a variety of contributinglaboratories and sequencing platforms and can be considered reliable. Thephylogeographic patterns in the network are potentially affected by distinctivemigratory histories, founder events, and sample size. Nevertheless, it would beprudent to consider the possibility that mutational variants might modulate theclinical presentation and spread of the disease. The phylogeneticclassification provided here may be used to rule out or confirm such effectswhen evaluating clinical and epidemiological outcomes of SARS-CoV-2 infection,and when designing treatment and, eventually, vaccines.
Materialsand Methods
TheGlobal Initiative on Sharing Avian Influenza Data (GISAID) was founded in 2006,and, since 2010, has been hosted by the German Federal Ministry of Food,Agriculture and Consumer Protection. GISAID has also become a coronavirusrepository since December 2019. As of 4 March 2020, the cutoff point for ourphylogenetic analysis, the GISAID database (https://www.gisaid. org/) hadcompiled 254 coronavirus genomes, isolated from 244 humans, nine Chinesepangolins, and one bat Rhinolophus affinis (BatCoVRaTG13 from Yunnan Province,China). The sequences have been deposited by 82 laboratories listed in DatasetS1, Supplementary Table 1. Although SARS-CoV-2 is an RNA virus, the depositedsequences, by convention, are in DNA format.
Ourinitial alignment confirmed an earlier report by Zhou et al. (7) that the pangolincoronavirus sequences are poorly conserved with respect to the human SARS-CoV-2virus, while the bat coronavirus yielded a sequence similarity of 96.2% in ouranalysis, in agreement with the 96.2%published by Zhou et al.
Wediscarded partial sequences, and used only the most complete genomes that wealigned to the full reference genome by Wu et al. (8) comprising 29,903nucleotides. Finally, to ensure comparability, we truncated the flanks of allsequences to the consensus range 56 to 29,797, with nucleotide position numberingaccording to the Wuhan 1 reference sequence (8). The laboratory codes of theresulting 160 sequences and the bat coronavirus sequences are listed in DatasetS1, Supplementary Table 2 (Coronavirus Isolate Labels).
The160 human coronavirus sequences comprised exactly 100 different types. We addedto the data the bat coronavirus as an outgroup to determine the root within thephylogeny. Phylogenetic network analyses were performed with the Network 5011CSpackage, which includes, among other algorithms, the median joining networkalgorithm (3) and a Steiner tree algorithm to identify most-parsimonious treeswithin complex networks (9).
Wecoded gaps of adjacent nucleotides as single deletion events (these deletionsbeing rare, up to 24 nucleotides long, and mostly in the amino acid readingframe) and ran the data with the epsilon parameter set to zero, and performedan exploratory run by setting the epsilon parameter to 10. Both settingsyielded a low-complexity network. The Steiner tree algorithm was then run onboth networks and provided the identical result that the mostparsimonious treeswithin the network were of length 229 mutations. The structures of bothnetworks were very similar, with the epsilon 10 setting providing an additionalrectangle between the A and B clusters. The network output was annotated usingthe Network Publisher option to indicate geographic regions, sample collectiontimes, and cluster nomenclature.
DataAvailability. The nucleotide sequences of the SARS-CoV-2 genomes used in thisanalysis are available, upon free registration, from the GISAID database (https://www.gisaid.org/).The Network5011 software package and coronavirus network files are available asshareware on the Fluxus Technology website(https://www.fluxus-engineering.com/).
ACKNOWLEDGMENTS.We gratefully acknowledge the authors and originating and submittinglaboratories of the sequences from GISAID¡¯s EpiFlu(TM) Database on which thisresearch is based. We are grateful to Trevor Bedford (GISAID) for providinginstructions and advice on the database. A table of the contributors isavailable in Dataset S1, Supplementary Table 1. We thank Arne R?hl forassessing the network.
截图版本:
在对160个完整的人类严重急性呼吸系统综合症冠状病毒2(SARS-Cov-2)基因组进行的系统进化网络分析中,我们发现了三个主要的变异体,它们的氨基酸变化不同,我们将其命名为A,B和C,其中A为根据蝙蝠的外祖先型冠状病毒。A和C类型在东亚以外地区(即欧洲人和美国人中)的比例很高。相比之下,B型是东亚最常见的类型,其祖先基因组似乎没有先突变成衍生的B型就不会扩散到东亚以外,这表明在亚洲以外对该类型的创始人具有影响力或免疫或环境抵抗力。该网络忠实地跟踪了记录在案的冠状病毒病2019(COVID-19)病例的感染途径,这表明系统发育网络同样可以成功地用于帮助跟踪未记录的COVID-19感染源,然后可以对其进行隔离以防止疾病的再次传播全世界。
SARS-CoV-2进化|亚型|祖先类型随着全球人类线粒体DNA树的发表(1),寻找人类起源似乎迈出了一步。但是,很快发现,树构建方法并不能促进对数据的明确解释。这推动了1990年代初期系统进化网络方法的发展,这种方法能够可视化众多最佳树木(2,3)。这种基于线粒体和Y染色体数据的网络方法使我们能够重建殖民地球的史前种群运动(4、5)。从2003年开始的系统进化网络方法在语言史前史的重建中得到了应用(6)。现在应该将系统进化网络方法应用于病毒学数据,以探索该方法如何有助于理解冠状病毒的进化。
2020年3月上旬,GISAID数据库(https://www.gisaid.org/)包含253种严重急性呼吸综合征冠状病毒2(SARS-CoV-2)的汇编,该基因组由来自全球各地的临床医生和研究人员提供自2019年12月以来已成为全球。为了解这种病毒在人体内的进化,并协助追踪感染途径和设计预防策略,我们在这里提出了一个由160个基本完整的SARS-Cov-2基因组组成的系统进化网络(图1)。
周等。[7]最近报道了一种与蝙蝠冠状病毒密切相关的蝙蝠冠状病毒,与人类病毒的序列相似性为96.2%。我们将此蝙蝠病毒作为外群,导致网络的根部放置在我们标记为“ A”的谱系簇中。总体而言,该网络如正在进行的爆发一样显示出祖先病毒基因组的存在。以及他们新突变的子代基因组。
A的两个子群以同义突变T29095C区分。在T-等位基因亚群中,有四个中国人(来自中国南方沿海省份广东省)带有祖传基因组,而三名日本人和两名美国病人则有许多突变。据报道,这些美国患者在推测的武汉疫情中曾有居住史。
C-等位基因亚簇具有相对较长的突变分支,包括来自武汉的五个人,其中两个代表祖先,以及来自中国和邻近国家的其他八位东亚人。值得注意的是,该子集群中将近一半(15/33)类型位于东亚以外地区,主要位于美国和澳大利亚。
就节点类型和从这些节点辐射的突变分支中包含的个体数量而言,两个派生的网络节点引人注目。我们已将这些系统发育簇标记为B和C。
对于B型,在武汉(n = 22),中国东部其他地区(n = 31)以及偶发地在邻近的亚洲国家(n = 21)中,对93个B型基因组中的19个进行了采样。在东亚以外地区,在美国和加拿大的病毒基因组中发现了10种B型,墨西哥一种,法国四种,德国两种,德国和意大利和澳大利亚各一种。节点B通过两个突变从A派生:同义突变T8782C和非同义突变C28144T,将亮氨酸变为丝氨酸。关于突变分支长度,簇B引人注目:虽然祖先的B型被东亚人独占(26/26个基因组),但亚洲以外的每个(19/19)B型基因组都进化出了突变。这种现象似乎不是由于病毒基因组在中国传播之前长达一个月的时间滞后和伴随的突变率所致(数据集S1,补充表2)。复杂的创建者情况是一种可能性,值得考虑的另一种解释是,祖传的武汉B型病毒在免疫或环境上适合东亚大部分人口,并且可能需要变异以克服东亚以外地区的抵抗。
意义
这是从世界各地采样的SARS-CoV-2基因组的系统发育网络。这些基因组是密切相关的,并且在其人类宿主中处于进化选择之下,有时具有平行的进化事件,也就是说,相同的病毒突变出现在两个不同的人类宿主中。这使得基于字符的系统进化网络成为在人类宿主中重建其进化路径和祖先基因组的选择方法。网络方法已在大约10,000种不同生物的系统发育研究中使用,并且主要用于重建人类的史前种群运动和生态研究,但在病毒学领域使用较少。
作者贡献:P.F.和M.F.进行研究;P.F.,L.F。和M.F.分析数据;P.F.和M.F.进行统计分析;P.F.,C.R。和M.F.写了纸C.R.撰写了导言。
审稿人:鲁汶凯瑟里克大学T.K .;和汉堡埃彭多夫大学医学中心的理学硕士。
作者宣称没有竞争利益。
此开放式访问文章是根据知识共享署名许可4.0(CC BY)分发的。
1可以与之联系的人。电子邮件:[email protected]或acr10 @ cam。ac.uk。
本文包含在线支持信息,网址为https://www.pnas.org/lookup/suppl/ doi:10.1073 / pnas.2004999117 /-/ DCSupplemental。
C型与其母体B型的区别在于非同义突变G26144T,该突变将甘氨酸转变为缬氨酸。在数据集中,这是主要的欧洲类型(n = 11),在法国,意大利,瑞典和英国以及加利福尼亚和巴西都有代表。它在中国大陆的样本中不存在,但在新加坡(n = 5)中很明显,在香港,台湾和韩国也有。
系统发育网络的一种实际应用是在未知的感染路径并造成公共健康风险的情况下重建感染路径。以下有充分记录感染史的病例可以作为例证(SI附录)。
2020年2月25日,据报道,第一个巴西人是在访问意大利后感染的,该网络算法通过C群中意大利人和他的巴西病毒基因组之间的突变链接反映了这种情况(SI附录,图S1)。在另一起案件中,一名来自安大略省的男子从中国中部的武汉前往中国南部的广东,然后返回加拿大,病倒并于2020年1月27日被确诊为2019年冠状病毒病(COVID-19)。系统进化网络(SI附录,图S2)表明,他的病毒基因组是从一个祖先重建的节点分支而来的,在佛山和深圳(均为广东省)都有衍生的病毒变体,这与他的旅行史相符。现在,他的病毒基因组与其他感染北美人(一个加拿大人和两个加利福尼亚人)的基因组共存,这些人显然具有共同的病毒谱系。网络中单个墨西哥病毒基因组的病例是有记录的感染,该感染于2020年2月28日在墨西哥的意大利旅行者中被诊断出。该网络不仅确认了墨西哥病毒的意大利起源(SI附录,图S3),而且还暗示该意大利病毒源自2020年1月27日在慕尼黑Webasto公司工作的一名员工的第一次有记载的德国感染。后来又感染了上海一位中国同事的感染,她的父母从武汉来了她的探视。系统发育网络中的10个突变记录了这种从武汉到墨西哥的病毒之旅,历时一个月。
该病毒网络是流行病早期的快照,之后系统发育被随后的迁移和突变所掩盖。可能会问到,是否可以通过使用最早的可用采样基因组作为根,在此早期阶段实现病毒进化的生根。但是,如SI附录所示,图S4显示,根据蝙蝠冠状病毒外群生根,于2019年12月24日采样的第一个病毒基因组已经远离根类型。
所描述的核心突变已被各种实验室和测序平台所证实,并被认为是可靠的。网络中的系统地理模式可能会受到独特的迁徙历史,创始人事件和样本数量的影响。然而,谨慎考虑突变变异体可能调节疾病的临床表现和传播的可能性。在评估SARS-CoV-2感染的临床和流行病学结局,设计治疗方法以及最终设计疫苗时,可以使用此处提供的系统发育分类来排除或确认此类影响。
材料和方法
全球禽流感数据共享倡议(GISAID)成立于2006年,自2010年以来一直由德国联邦粮食,农业和消费者保护部主办。自2019年12月起,GISAID也已成为冠状病毒库。截至2020年3月4日,即系统发育分析的临界点,GISAID数据库(https://www.gisaid.org/)已汇编了254个冠状病毒基因组,从244个人中分离出,9头中国穿山甲和1头蝙蝠Rhinolophus affinis(来自中国云南省的BatCoVRaTG13)。该序列已由补充数据表1的数据集S1中列出的82个实验室保藏。尽管SARS-CoV-2是RNA病毒,但按照惯例,保藏的序列为DNA格式。
我们的初步核对证实了Zhou等人的早期报道。(7)在我们的分析中,穿山甲冠状病毒的序列相对于人SARS-CoV-2病毒保守性很差,而蝙蝠冠状病毒的序列相似性为96.2%,与Zhou等人的96.2%一致。
我们丢弃了部分序列,仅使用了我们与Wu等人的完整参考基因组比对的最完整的基因组。(8)包含29,903个核苷酸。最后,为确保可比性,我们将所有序列的侧翼截短至共有范围56至29,797,并根据武汉1参考序列对核苷酸位置进行了编号(8)。数据集S1补充表2(冠状病毒分离物标签)中列出了所得的160个序列和蝙蝠冠状病毒序列的实验室代码。
160条人类冠状病毒序列正好包含100种不同类型。我们将蝙蝠冠状病毒作为一个分组添加到数据中,以确定系统发育内的根。系统网络分析是使用Network 5011CS软件包进行的,该软件包除其他算法外,还包括中位数加入网络算法(3)和Steiner树算法,以识别复杂网络中最简约的树(9)。
我们将相邻核苷酸的空位编码为单个缺失事件(这些缺失很少见,最长可达24个核苷酸,并且大部分在氨基酸阅读框中),并将epsilon参数设置为零运行数据,并通过设置进行探索性运行将epsilon参数设置为10。这两个设置都产生了一个低复杂度的网络。然后在两个网络上都运行了Steiner树算法,并提供了相同的结果,即网络中最简约的树的长度为229个突变。两个网络的结构都非常相似,其中epsilon 10设置在A和B群集之间提供了另一个矩形。使用“网络发布者”选项对网络输出进行注释,以指示地理区域,样品收集时间和聚类术语。
数据可用性。免费注册后,可从GISAID数据库(https://www.gisaid.org/)获得此分析中使用的SARS-CoV-2基因组的核苷酸序列。Fluxus技术网站(https://www.fluxus-engineering.com/)上以共享软件的形式提供了Network5011软件包和冠状病毒网络文件。
致谢。我们衷心感谢该研究所基于的GISAID EpiFlu(TM)数据库的序列作者和发起实验室。我们感谢Trevor Bedford(GISAID)提供有关数据库的说明和建议。数据集S1的补充表1中提供了贡献者表。我们感谢Arne R?hl评估了网络。
上面这一大段是非常长的,不想看的朋友也可以看下面这个摘要性质的文字:
significance上的查询是下面的:
其翻译是:
意义
这是从世界各地采样的SARS-CoV-2基因组的系统发育网络。这些基因组是密切相关的,并且在其人类宿主中处于进化选择之下,有时具有平行的进化事件,也就是说,相同的病毒突变出现在两个不同的人类宿主中。这使得基于角色的系统发育
网络在人类宿主中重建其进化路径和祖先基因组的选择方法。网络方法已在大约10,000种不同生物的系统发育研究中使用,并且主要用于重建人类的史前种群运动和生态研究,但在病毒学领域使用较少。
抽象
在对160个完整的人类严重急性呼吸系统综合症冠状病毒2(SARS-Cov-2)基因组进行的系统进化网络分析中,我们发现了三个主要的变异体,它们的氨基酸变化不同,我们将其命名为A,B和C,其中A为根据蝙蝠的外祖先型冠状病毒。A和C类型在东亚以外地区(即欧洲人和美国人中)的比例很高。相比之下,B型是东亚最常见的类型,其祖先基因组似乎没有先突变成衍生的B型就不会扩散到东亚以外,这表明在亚洲以外对该类型的创始人具有影响力或免疫或环境抵抗力。该网络忠实地竞争记录在案的冠状病毒病2019(COVID-19)病例的感染途径,这表明同种异体性网络同样可以成功地用于帮助追踪未记录的COVID-19感染源,然后可以对其进行隔离以防止疾病的再次传播全世界。
SARS-CoV-2进化亚型祖先型
9、相关文字
武汉坚守第七十八天——人性主导人性,兽性主导兽性?
武汉坚守第五十一天——六十八载皆伤痛,科普也能被辱骂——已阵亡
武汉坚守第五十天——半百之时转瞬到,解惑星链计划时——已阵亡
武汉坚守第四十一天——人命关天,生存权的保障是医生
最后,说一声抱歉,最近有人恶意评论,我只好修改为:关注后才可以评论,这样可以留下更多的信息,那些恶意评论的人就会多少小心一点。
前天有一个人评论后,删除了评论,也撤销了关注,嗯,善良最重要,恶意就算了。