Genetics 72-155
Bioinformatics lab
חיפושים ממוחשבים
ברגע שיש בידינו מאגרי
נתונים רחבים, עם רצפים של גנומים שלמים, אנו מוכנים,
ואף זקוקים, לכלים חישוביים לעיבוד הנתונים.
בראש ובראשונה, הסביבה הנכונה
והמתאימה ביותר לעיבוד נתונים ברמת הגנום הוא באינטרנט. בתור חוקרים גנטיים, אנו
מעוניינים בגישה מירבית לכלל המידע הגנטי שהצטבר בנושא
שנבחר, והמידע הזה, וכן הכלים לעיבודו, נמצאים ברשת. לכן שומה על כל חוקר בימינו
להיות בקי בשימוש במחשב וברשת לצורך קידום המחקר שלו.
"כל
תלמיד לגנטיקה מולקולרית אנושית צריך להשתמש
באינטרנט!"
(Human
Molecular Genetics, 2nd ed., Taylor & Francis, 1999)
בעזרת כלים חישוביים ניתן
לבצע מגוון חיפושים והשוואות על מאגרי הנתונים. נביא כאן מספר דוגמאות:
א.
אפיון מפות Open
Reading Frame (ORF)
ניתן להכין מפות של כלל
הרצפים המועמדים לתרגום לחלבון בגנום (או כל מאגר רצפים שנבחר). המחשב סורק את
הרצפים ומחפש קודון התחלת תרגום (ברוב היצורים מדובר ב-AUG),
ומחפש האם ישנו מספר סביר (שנגדיר לו בעצמנו – 50 למשל) של חומצות אמינו מקודדות
ברצף לפני קודון פסק. מעניין לציין, כי אפילו ברצפים
שמקודדים לחלבון, בשאר מסגרות הקריאה (שאינם מקודדות) אנו נמצא כמות גדולה של קודוני פסק מפוזרים בכל הרצף. כאשר נמצא רצף העונה על דרישות
התוכנה ל-ORF,
יש כבר בסיס להמשך מחקר.
אפיון כזה מהווה בעצם
דוגמא ליכולת המחשב לסרוק רצף ולזהות מוטיבים ורצפים מיוחדים בתוך רצף גדול. ניתן
גם לחפש מוטיבים קצרים או ארוכים שחוזרים על עצמם במסגרת רצף מסויים
, ואף בכלל הגנום. בצורה כזו אופיינו אזורים מיוחדים בגנום, כגון טלומרים, וטרנזפוזונים.
ב.
השוואות רצפים
המחשב מתאים לבצע במהירות
וביעילות מטלות ארוכות ומייגעות, כגון השוואה בסיס-בסיס בין רצפים ארוכים. בהתאם
לקביעת תנאי סף שונים, מסוגל המחשב לזהות תת-רצפים מתאימים בתוך רצפים גדולים
יותר, שאולי לא היינו מבחינים ביניהם במבט ראשון.
ג.
חיפוש במאגרים
כהמשך ופיתוח להשוואת
רצפים, המחשב מתאים במיוחד לאיתור רצף נתון מתוך מאגר רחב. בעקרון, מדובר בהשוואת
רצף נתון לכלל הרצפים במאגר נתון. אלגוריתמי חיפוש משוכללים מאפשרים מענה מהיר מאד
(תחשבו על Google...).
תוכנות החיפוש יכולות לציין את כל המקומות בהם מופיע רצף נתון במאגר. ניתן למקד את
החיפוש ליצור או משפחת יצורים מסויימים, ולהציב מגוון
גדול של תנאי סף שונים. המחשב מחפש את הרצף הנתון על סמך התאמה מירבית, ומעניקה לכל תשובה ערך ע"פ מדת ההתאמה (למשל,
מספר בסיסים זהים רצופים). תוכנות שונות מתמחות במציאת רצפים בהפסקות או בשינויים
נקודתיים.