Koja je razlika između FASTA i FASTQ

Sadržaj:

Koja je razlika između FASTA i FASTQ
Koja je razlika između FASTA i FASTQ

Video: Koja je razlika između FASTA i FASTQ

Video: Koja je razlika između FASTA i FASTQ
Video: #Карника и #Бакфаст: в чем разница? Часть #1 2024, Srpanj
Anonim

Ključna razlika između FASTA i FASTQ je u tome što je FASTA tekstualni format koji pohranjuje samo sekvence nukleotida ili proteina, dok je FASTQ tekstualni format koji pohranjuje i sekvence i pridružene vrijednosti kvalitete sekvence.

Bioinformatika je područje koje koristi različite softvere za analizu i razumijevanje bioloških podataka, posebno kada je skup podataka složen i velik. Ovo polje kombinira biologiju, kemiju, fiziku, informatiku, informacijsko inženjerstvo, matematiku i statistiku za analizu i interpretaciju bioloških podataka. FASTA i FASTQ dva su formata predstavljanja sekvenci u polju bioinformatike za usklađivanje i analizu sekvenci. Zapravo, FASTQ je format datoteke sekvence koji proširuje FASTA format s mogućnošću pohranjivanja kvalitete sekvence.

Što je FASTA?

FASTA je softver za usklađivanje DNK i proteinske sekvence. Softver FASTA koristi FASTA format. To je tekstualni format koji predstavlja sekvence nukleotida ili sekvence aminokiselina (proteina). Ovdje jednoslovni kodovi predstavljaju oba ova niza. FASTA je važan alat u područjima bioinformatike i biokemije. Ovaj format dopušta da nazivi sekvenci i komentari prethode sekvencama.

FASTA protiv FASTQ u tabelarnom obliku
FASTA protiv FASTQ u tabelarnom obliku

Slika 01: FASTA sekvenca

Ovaj je format nastao iz softvera FASTA, a predstavili su ga David J. Lipmann i William R. Pearson 1985. Alat FASTA imao je mnoge izmjene tijekom vremena, a najnovija verzija sastoji se od programa za protein:protein, DNA:DNA, protein:translated DNA (s frameshifts) i traženje uređenih ili neuređenih peptida. FASTA čita zadanu sekvencu nukleotida ili aminokiselina i traži odgovarajuću bazu podataka sekvenci korištenjem lokalnog poravnanja sekvenci za pronalaženje podudaranja sličnih sekvenci baze podataka.

Što je FASTQ?

FASTQ je softver za usklađivanje koji se koristi u području bioinformatike, koji pohranjuje i biološki niz (obično nukleotidni niz) i njegove odgovarajuće ocjene kvalitete. Wellcome Trust Sanger Institute izvorno je razvio FASTQ kako bi povezao FASTA formatiran niz i povezane podatke o kvaliteti. S razvojem u području bioinformatike, FASTQ je postao de facto standard za pohranu izlaza mnogih instrumenata za sekvenciranje visoke propusnosti.

FASTQ format koristi četiri različite linije po nizu. Redak 1 počinje znakom @ i slijedi identifikator sekvence (slično retku naslova FASTA). Redak 2 sastoji se od neobrađenih slova niza. U retku 3 niz počinje znakom '+' i po izboru slijedi isti identifikator niza. Redak 4 kodira vrijednosti kvalitete za niz u retku 2 i trebao bi se sastojati od istog broja simbola kao slova u nizu.

Koje su sličnosti između FASTA i FASTQ?

  • FASTA i FASTQ su alati za poravnanje.
  • To su dva formata predstavljanja niza.
  • Obje su povezane s područjem bioinformatike.
  • I FAST i FASTQ važni su alati za pohranu i sekvenciranje.
  • FASTQ je proširenje FASTA formata s mogućnošću pohranjivanja kvalitete sekvence.

Koja je razlika između FASTA i FASTQ?

FASTA je format temeljen na tekstu koji pohranjuje samo sekvence nukleotida ili proteina, dok je FASTQ format temeljen na tekstu koji pohranjuje i vrijednosti kvalitete sekvence i povezane sekvence. Dakle, ovo je ključna razlika između FASTA i FASTQ. Štoviše, FASTA pohranjuje fragmente sekvence nakon mapiranja, dok FASTQ pohranjuje fragmente sekvence prije mapiranja. Osim toga, još jedna razlika između FASTA i FASTQ je ta što se FASTA sastoji od jedne linije opisa, a FASTAQ se sastoji od četiri linije.

Infografika u nastavku predstavlja razlike između FASTA i FASTQ u obliku tablice za usporedbu.

Sažetak – FASTA vs FASTQ

Bioinformatika koristi različite formate sekvenci kao što su FASTA i FASTQ, itd. FASTA pohranjuje fragmente sekvence nakon mapiranja, dok FASTQ pohranjuje fragmente sekvence prije mapiranja. FASTA je softver za usklađivanje sekvenci DNK i proteina. Sastoji se od programa za protein:protein, DNA:DNA, protein:prevedena DNA (s okvirnim pomacima) i traženje uređenih ili neuređenih peptida. FASTQ je softver za usklađivanje koji se koristi u području bioinformatike i pohranjuje i biološki niz (obično nukleotidni niz) i njegove odgovarajuće ocjene kvalitete. FASTA se sastoji od jedne linije opisa, a FASTQ se sastoji od četiri linije. Dakle, ovo sažima razliku između FASTA i FASTQ.

Preporučeni: