Contig
Ein Contig (von engl. {{Modul:Vorlage:lang}} Modul:Multilingual:153: attempt to index field 'data' (a nil value) = angrenzend, zusammenhängend) ist ein Satz überlappender DNA- oder Protein-Stücke ({{Modul:Vorlage:lang}} Modul:Multilingual:153: attempt to index field 'data' (a nil value)), die von derselben genetischen Quelle stammen.<ref>A. Guthals, K. R. Clauser, N. Bandeira: Shotgun protein sequencing with meta-contig assembly. In: Molecular & cellular proteomics : MCP. Band 11, Nummer 10, Oktober 2012, ISSN 1535-9484, S. 1084–1096, doi:10.1074/mcp.M111.015768, PMID 22798278, PMC 3494147 (freier Volltext).</ref> Ein solches Contig kann dazu genutzt werden, die Original-DNA-Sequenz dieser genetischen Quelle (z. B. die Sequenz eines Chromosoms) abzuleiten.
Eine Contig-Karte zeigt die relative Reihenfolge einer zusammengehörenden Contig-Bibliothek, die z. B. ein komplettes Chromosom darstellen.
MAGs
Ein damit zusammenhängender Begriff ist ein MAG ({{Modul:Vorlage:lang}} Modul:Multilingual:153: attempt to index field 'data' (a nil value)), das ein gesamtes aus solchen Bruchstücken zusammengesetztes vermutetes (vorhergesagtes) Genom bezeichnet.<ref name=Farag2021>Ibrahim F. Farag, Rui Zhao, Jennifer F. Biddle: <templatestyles src="Webarchiv/styles.css" />“Sifarchaeota,” a Novel Asgard Phylum from Costa Rican Sediment Capable of Polysaccharide Degradation and Anaerobic Methylotrophy ( vom 3. Mai 2021 im Internet Archive), in: ASM Appl Environ Microbiol 87:e02584-20, Epub 13. April 2021, doi:10.1128/AEM.02584-20, PMID 33608286.
Preprint: “Sifarchaeota” a novel Asgard phylum capable of polysaccharide degradation and anaerobic methylotrophy, auf: CSH bioRxiv vom 14. Oktober 2020, doi:10.1101/2020.10.14.339440, ResearchGate.</ref><ref name=Caceres2019>
Eva F. Caceres: Genomic and evolutionary exploration of Asgard archaea, Doctoral thesis, Uppsala University, Disciplinary Domain of Science and Technology, Biology, Department of Cell and Molecular Biology, 12. November 2019. Siehe insbesondere §Genome binning.
</ref>
Skriptfehler: Ein solches Modul „Vorlage:Anker“ ist nicht vorhanden.Ein davon abgeleiteter Begriff ist „GVMAG“ ({{Modul:Vorlage:lang}} Modul:Multilingual:153: attempt to index field 'data' (a nil value)), der ein Riesenvirus-MAG bezeichnet und in der Metagenomik der Nucleocytoviricota (NCLDVs) gebräuchlich ist.
Skriptfehler: Ein solches Modul „Vorlage:Anker“ ist nicht vorhanden.Die durch fehlerhafte Aneinanderreihung entstandenen Sequenzen nennt man (Sequenz-)Chimären. zur Erkennung solcher Fehler wurde beispielsweise von Phil Hugenholtz ab 2001 das Programm Bellerophon entwickelt.<ref name="jgi"> JGI Faces: Phil Hugenholtz—Bug Hunter from Down-Under (PDF; 1,3 MB). In: the PRIMER. DOE Joint Genome Institute, US Department of Energy, Office of Science, Band 2, Nr. 1, S. 2–3, Januar 2005. </ref><ref name="jgi-archive"> Phil Hugenholtz. JGI, DOE Joint Genome Institute, US Department of Energy. Research Groups: Microbial Ecology. Stand: 11. Juni 2008, Memento im Webarchiv vom 26. August 2010.</ref>
Sequenzierung
Bei der DNA-Sequenzierung und insbesondere beim Shotgun Sequencing muss die DNA-Sequenz bzw. bei der De-Novo-Peptidsequenzierung muss die Aminosäuresequenz durch Aneinanderreihung der verschiedenen Contigs ermittelt werden.<ref>Vorlage:Cite book/URLVorlage:Cite book/MeldungVorlage:Cite book/MeldungVorlage:Cite book/MeldungVorlage:Cite book/MeldungVorlage:Cite book/MeldungVorlage:Cite book/MeldungVorlage:Cite book/Meldung2</ref> Für eine Genomsequenzierung wird zur Vorbereitung oftmals die genomische DNA fragmentiert und die Bruchstücke anschließend vervielfältigt. Die einzelnen DNA-Stränge besitzen dann unterschiedliche, teilweise überlappende Sequenzen, die durch die Aneinanderreihung die vollständige Sequenz ergeben.<ref>S. H. Lin, Y. C. Liao: CISA: contig integrator for sequence assembly of bacterial genomes. In: PloS one. Band 8, Nummer 3, 2013, ISSN 1932-6203, S. e60843, doi:10.1371/journal.pone.0060843, PMID 23556006, PMC 3610655 (freier Volltext).</ref><ref>Z. Frenkel, E. Paux, D. Mester, C. Feuillet, A. Korol: LTC: a novel algorithm to improve the efficiency of contig assembly for physical mapping in complex genomes. In: BMC Bioinformatics. Band 11, 2010, ISSN 1471-2105, S. 584, doi:10.1186/1471-2105-11-584, PMID 21118513, PMC 3098104 (freier Volltext).</ref>
Ein Contig entsteht unter der Annahme, dass die zugehörigen Reads korrekt sind. Es gibt aber bei allen bisher genutzten Sequenziermethoden Schwächen, die oft auch bekannt sind und deren Einfluss von den Herstellern zu minimieren versucht wird. Ein Contig kann auch schon aus einem einzelnen Read bestehen, aber jeder überlappende Read (am besten aus verschiedenen Richtungen oder sogar durch eine andere Sequenziermethode) erhöht die Wahrscheinlichkeit, dass hier die Wirklichkeit zu sehen ist.
Einzelnachweise
<references />