Berita
Perbedaan Genebank dan EMBL!
MALANG - Kemampuan untuk mengurutkan DNA suatu organisme telah menjadi salah satu alat terpenting dalam penelitian biologi modern. Urutan data yang terdapat pada DNA merupakan pusat genom dan dasar dari banyak penelitian dalam bioinformatika. Karena itu, sejumlah sistem telah dikembangkan untuk memelihara, membubuhi keterangan, dan mempertanyakan mengenai informasi DNA sequencing. DNA sequencing sendiri dikumpulkan melalui banyak database yang berbeda, dan untuk tujuan yang berbeda pula. Data yang dikumpulkan sering disimpan dalam database yang berbeda, terkadang dengan anotasi yang berbeda. Sebagai contoh, DNA squencing dari organisme tertentu dapat disimpan dalam database terdistribusi sebagai bagian dari kumpulan data spesifik organisme, dengan subset data yang dikirimkan ke database, data internasional untuk distribusi sebagai bagian dari kumpulan data ini.
Repositori urutan DNA terbesar adalah International Nucleotide Sequence Database Collaboration (INSDC), yang mencakup DNA Data Bank of Japan (DDBJ) di National Genetics Institute di Mishima, Japan Tables, Gene Bank di National Center of Biotechnology Information (NCBI) di Bethesda, USA, dan European Molecular Biology Laboratory (EMBL) Basis Data Urutan nukleotida, dikelola oleh European Bioinformatics Institute (EBI) di Inggris. Pertukaran data harian antara kelompok-kelompok ini memastikan cakupan internasional yang terkoordinasi. Institute for Genomic Research (TIGR) yang berbasis di Rockville, Maryland, USA juga menyimpan berbagai jenis data, termasuk urutan genom dan anotasi.
Ada dua jenis database yang dapat akan kita bahas disini, yaitu sebagai berikut:
1. Genbank
GenBank® merupakan database sekuens DNA komprehensif untuk umum dan tersedia lebih dari 300.000 organisme bernama, diperoleh melalui pengiriman laboratorium individu dan pengajuan proyek sekuensing massal skala besar. GenBank dikelola dan didistribusikan oleh National Center for Biotechnology Information (NCBI), divisi dari National Library of Medicine (NLM) di US National Institutes of Health (NIH) di Bethesda, MD. NCBI membangun GenBank melalui beberapa sumber, termasuk pengiriman data urutan dari penulis dan dari pengiriman massal expressed sequence tag (EST), genome survey sequence (GSS), whole genome shotgun (WGS) dan data throughput tinggi lainnya dari pusat urutan. Kantor Paten dan Merek Dagang US juga berkontribusi urutan dari paten yang dikeluarkan.
FTP GenBank yang tersedia untuk publik terdiri dari campuran file teks ASCII terkompresi dan tidak terkompresi. Isinya berupa data urutan dan indeks yang merujuk silang nama penulis, kutipan jurnal, nama gen, dan kata kunci ke catatan GenBank individu. Agar menjadi lebih mudah, catatan GenBank dipartisi ke dalam divisi menurut organisme sumber atau jenis urutan. Catatan yang terdapat pada divisi yang sama akan dikemas sebagai kumpulan file bernomor sehingga catatan dari satu divisi dapat dimuat dalam serangkaian banyak file. Ada dua format yang secara lengkap ditunjukan oleh GenBank, yaitu format “flatfile” GenBank, dan format Abstract Syntax Notation One (ASN.1) yang lebih terstruktur dan ringkas yang digunakan oleh NCBI untuk pemeliharaan internal. Sistem Entrez selalu menyediakan akses ke GenBank versi terbaru termasuk update harian. Selain itu, kontribusi dari proyek WGS juga membantu untuk melengkapi data di divisi tradisional, dan begitupun jumlah genom eukariota yang cakupan dan perakitannya signifikan memiliki peningkatan secara terus menerus.
2. EMBL
European Bioinformatics Institute (EBI) adalah sebuah divisi dari European Molecular Biology Laboratory (EMBL) yang merupakan sebuah organisasi nirlaba dan pusat penelitian di dalam bidang bioinformatika. Institut memelihara berbagai database yang berisi informasi biologis, termasuk asam nukleat, urutan protein, dan struktur makromolekul. Dari database yang yang telah disediakan, yang paling terkenal adalah EMBL Nucleotide Sequence Database, lalu selanjutnya database EMBL. Basis data EMBL adalah basis data utama (arsip) yang berisi hasil eksperimen pengurutan laboratorium serta interpretasi yang diberikan oleh pengirim, namun tidak ada atau sangat terbatas. Data yang ada di dalam basis data EMBL berasal dari proyek pengurutan genom skala besar, Kantor Paten Eropa, dan pengiriman langsung dari masing-masing ilmuwan. Wajib diketahui bahwa hak editorial untuk entri dalam database EMBL tetap menjadi milik pengirim asli. Artinya, selain menambahkan referensi silang, data tidak diperbarui oleh pengelola basis data EMBL kecuali diinstruksikan secara eksplisit oleh pengirim. Ada rilis triwulanan dari database EMBL dan catatan baru atau yang diperbarui, dan akan didistribusikan setiap hari. Ketika entri EMBL diperbarui, versi lama dari entri yang sama masih dapat diambil dari arsip versi urutan EMBL.
Berdasarkan Basis Data Urutan Nukleotida, EMBL dikelompokkan ke dalam beberapa divisi tergantung pada metode yang digunakan dalam pembuatannya. Misalnya EST (expressed sequence tag) dan HTG (explained sequence tag) high-throughput genomic sequences) atau asal taksonomi dari sumber urutan, layaknya sebagai Divisi Pembangkitan PLN. Hal ini diberlakukan agar subset database yang memisahkan sekuens berkualitas rendah, seperti sekuens EST dan HTG dari sekuens berkualitas tinggi bisa mengelompokkan sekuens berkualitas tinggi ke dalam grup reaktif. Manfaatnya menjadi lebih jelas ketika pencarian database atau analisis urutan serupa untuk mengiris entri daripada seluruh database.
Terima kasih telah membaca! Semoga sedikit penjelasan mengenai beberapa database DNA bisa membantu kalian ya💞
Sumber: Bioinformatics: Tools and Applications-David Edwards, Jason Stajich, David Hansen (book)
Leave a reply