Biyoinformatik bilim dalı, biyolojik verilerin anlamlandırılması, saklanması, görsellenmesi ve bu devasa bilgi birikiminden azami ölçüde yararlanabilmek amacıyla, matematik, istatistik, bilgisayar bilimleri, moleküler biyoloji ve genetik alanlarının sentezidir. Bir diğer tanımla, karmaşık biyolojik verilerin derlenmesi ve analiz edilmesi bilimidir [1].
Terim Biyoinformatik, 1970 yılında Paulien Hogeweg ve Ben Hesper tarafından “biyotik sistemlerde bilişimsel süreçlerin incelenmesi” olarak icat edilmiştir. Paulien Hogeweg, biyolojik sistemleri birbirine bağlı birçok seviyede, dinamik bilgi işleme sistemleri olarak inceleyen, Hollandalı bir teorik biyolog ve karmaşık sistem araştırmacısıdırm [2].
Frederick Sanger 1950’lerin başında insülin dizisini belirledikten sonra protein dizileri elde edildiğinde bilgisayarlar moleküler biyolojide önemli hale geldi . Birden çok sekansı manuel olarak karşılaştırmak pratik değildir. Bu alanda öncü Margaret Oakley Dayhoff’du [3]. Başlangıçta kitaplar olarak yayınlanan ilk protein dizisi veritabanlarından birini derlemiş ve dizilim hizalama ve moleküler evrim yöntemlerine öncülük etmiştir [4],[5]. Biyoinformatiğe erken katkıda bulunan bir başka Elvin A. Kabat1980 ve 1991 yılları arasında Tai Te Wu ile piyasaya sürülen kapsamlı antikor dizileri hacimleriyle 1970 yılında biyolojik dizi analizine öncülük etmiştir [6].
Biyoinformatikte kullanılan iki önemli aktivite vardır. Bunlardan ilki genomik diğeri ise proteomiktir. Bir genom nesilden nesile aktarılan genetik materyali kodlayan eksiksiz DNA dizileridir. Bu DNA sekansları, genomun içerdiği tüm genleri ve transkriptleri içerir. Dolayısıyla genomik, bir organizmada genler ve transkriptler dahil tüm bu genomik varlıkların dizilimini ve analizini ifade eder. Proteomik ise tüm protein ve proteom setinin analizini ifade eder. Genomiklere ve proteomiklere ek olarak, biyoinformatiklerin uyguladığı çok daha fazla biyoloji alanı vardır. Biyoinformaitkteki bu önemli alanların her biri biyolojik sistemleri anlamayı hedeflemişlerdir. Örneğin, bir sinyal yolunun bir hücrede nasıl çalıştığı, sistem biyolojisi yoluyla ele alınabilir. Yola dahil olan genler, nasıl etkileştikleri ve modifikasyonların aşağı yönde sonuçları nasıl değiştirdiği, hepsi sistem biyolojisi kullanılarak modellenebilir. Bilginin dijital olarak temsil edilebildiği herhangi bir sistem biyoinformatik için potansiyel bir uygulama sunar. Böylece biyoinformatik tek hücreden bütün ekosistemlere uygulanabilir. Bilim adamları bir genomdaki “parça listelerini” tam olarak anlayarak karmaşık biyolojik sistemleri daha iyi anlıyorlar. Bir genom veya proteomdaki tüm bu parçalar arasında meydana gelen etkileşimleri anlamak, sistemdeki bir sonraki karmaşıklık seviyesini temsil eder [7].
Biyoinformatiğin önemli bir diğer uygulaması, dizilenmiş organizmaların DNA ve protein dizilerinin analizidir. Dizi karşılaştırması, diğer birçok karmaşık manipülasyon için bir temel teşkil eden Biyoinformatik’teki temel işlemlerden biridir. Yeni keşfedilen bir dizinin işlevini belirlemek, genler ve proteinler arasındaki evrimsel ilişkileri belirlemek ve proteinlerin yapısını ve işlevini tahmin etmek gibi birçok önemli sorunun çözümü için önemli bilgiler sağlar [8]. Biyoinformatikte, organizmalar, gen, protein, ve hastalıkların, özel bir perspektiften alan farklı bir yönüne odaklanarak, çeşitli veri tabanlarının bir bolluk mevcuttur. Genler ve proteinler arasındaki bağlantılar veya türler arasındaki gen homologları gibi farklı veritabanlarının verileri arasında ilişkiler vardır. Birden fazla standartlaştırma çabası , her biri belirli bir biyoinformatik alt topluluğu için kesin portal olmayı amaçlayan büyük veri ambarları ile sonuçlanmıştır . Bu tür her bir depo, topluluğuna üç hizmet sunmaktadır:
- Topluluğa uygun terminolojiye sahip bir şema ve sorgu arayüzü şeklinde bir veri sunumu.
- Hem ham ölçümler hem de istatistiksel veya sezgisel olarak türetilmiş teşhisler ve bağlantılar, örn., Bir hastalık ile ilişkili gibi görünen bir gen şeklinde verilere erişim.
- Yerel olarak üretilen verilerin yanı sıra başka bir yerden içe aktarılmış olan verilerin temizlenmesi ve iyileştirilmesi.
Farklı depolar arasında hangi verilerin doğru olduğu konusunda zaman zaman anlaşmazlıklar vardır. Yine de bazı veritabanları birbirinden veri alır (tipik olarak özel komut dosyaları kullanarak) ve her depo, genellikle haftalık, aylık veya isteğe bağlı olarak yayınlanan düzeltmeler ve yeni verilerle sürekli olarak güncellenir [9].
Biyoinformatik alanında yapılmış önemli ve ses getirmiş bir çalışma olan İnsan Genom Projesinden (Human Genome Project) bahsetmemek olmaz. İnsan Genom Projesi’nin başlıca amacı 20-25.000 insan geninin tümünü keşfetmek, insan kromozomlarını ya da genomunda bulunan 3 milyar DNA alt biriminin sırasını belirlemek ve bu bilgileri daha fazla çalışmalarda kullanabilmektir. Bu çalışma kapsamında insan sağlığına olan etkisinin yanı sıra biyoarkeoloji, antropoloj, tarımdaki ve hayvancılıktaki verimin artmasına, insan göçleri ve evrim ile ilgili verileri değerlendirilip, incelenmesine de katkı sağlamaktadır. Bu proje sayesinde organizmaları daha iyi anlayacağımız ve tanıyacağımız için hem hastalık yapan etkilerin saptanmasında hem de tedavisinin bulunmasında bilim insanlarına kolaylık sağlamaktadır [10].
Biyoinformatiğin kullanım alanlarını sırasıyla yazmak gerekirse bunlar; protein yapısının/fonksiyonun belirlenmesi, herhangi biyolojik fonksiyonu arttıran ya da engelleyen küçük moleküllerin tasarlanması, karmaşık genetik fonksiyon ya da regülasyon faaliyetlerinin tanımlanması, tıbbi ya da endüstriyel amaçlı yeni makromoleküller üretmek, genetik faktörlerin hastalık yatkınlığına etkilerini ortaya çıkarmak olarak sıralanabilir [11].
NOT: İnsan Genom Projesi ile ilgili bir video linki bırakacağım izlerseniz çok sevinirim 🙂 . Lessons from the Human Genome Project, https://www.youtube.com/watch?v=qOW5e4BgEa4.
KAYNAKÇA
- Biyoenformatik, Hacettepe Üniversitesi, [docx dosyası]
- Bioinformatics and its applications, Alla L Lapidus, Ph.D. SPbAU, SPbSU, St. Petersburg ,[online:http://bioinformaticsinstitute.ru/sites/default/files/lapidus_1_0.pdf]
- Digital Code of Life: How Bioinformatics is Revolutionizing Science, Medicine, and Business. ISBN 978-0-471-32788-2, Moody, Glyn, 2004, [online: https://archive.org/details/digitalcodeoflif0000mood]
- Atlas of protein sequence and structure. National Biomedical Research Foundation, 215 pp, Dayhoff, M.O,1966
- Evolution of the Structure of Ferredoxin Based on Living Relics of Primitive Amino Acid Sequences, Eck, Richard V.; Dayhoff, Margaret O.,1966, [online:https://ui.adsabs.harvard.edu/abs/1966Sci…152..363E/abstract]
- Kabat Database and its applications: 30 years after the first variability plot, George Johnson, Tai Te Wu,2000, [online:https://academic.oup.com/nar/article/28/1/214/2384355]
- What is bioistatistics?, Joanne Fox, 2005, [online: https://www.scq.ubc.ca/quarterly011/0101fox.html]
- Fundamental concepts of bioinformatics DE Krane – 2002 – Pearson Education India, [online:https://www.sciencedirect.com/science/article/pii/B9780128037386000069]
- Integration in Support of Collaboration, An Hai Doan, Alon Halevy, Zachary Ives,2012,[online:https://www.sciencedirect.com/science/article/pii/B9780124160446000181]
- İnsan Genom Projesi: Umut mu, Kabus mu?, Dr. Ayşim Tuğ, Dr. İ. Hamit Hancı, Dr. Aysun Balseven, 2002, [online:https://www.ttb.org.tr/STED/sted0202/genom.pdf]
- Biyoenformatik, Vikipedia, [online:https://tr.wikipedia.org/wiki/Biyoenformatik]
Bu makaleyi 6 dakikada okuyabilirsiniz.