AI למטבוליומטיה מרחבית I: מערכי הנתונים של החיים

מקור תמונה

כאן ב- Neuromation, אנו מתחילים בסרט מרגש - ומתוחכם למדי! - פרויקט משותף עם קבוצת המטבולומיקה המרחבית של ד"ר תיאודור אלכסנדרוב מהמעבדה האירופית המולקולרית. במיני סדרת פוסטים זו אסביר כיצד אנו מתכננים להשתמש בהישגים האחרונים בלימוד מעמיק ולהמציא מודלים חדשים לעיבוד נתוני ספקטרומטריה המונית, ונמצא פרופילים מטבוליים של תאים בודדים כדי לנתח את מסלולי המולקולריה שעוקבים אחר תאים עם פנוטיפים שונים. ...

רגע, בטח כבר איבדתי אותך שלוש פעמים. תן לי להתחיל מחדש.

אומיקס: מערכי הנתונים שעושים לך

מקור תמונה

התמונה למעלה מציגה את הדוגמה המרכזית של הביולוגיה המולקולרית, התובנה העיקרית של הביולוגיה של המאה ה- XX כיצד החיים על כדור הארץ עובדים. זה מראה כיצד מידע גנטי זורם מה- DNA לחלבונים שעושים למעשה את העבודה בתאים:

  • ה- DNA אוגר מידע גנטי ויכול לשכפל אותו;
  • בתהליך המכונה תעתוק, DNA מעתיק חלקים מהקוד הגנטי שלו ל- RNA Messenger (m-RNA), גם הוא חומצה גרענית;
  • ולבסוף, התרגום הוא תהליך ייצור החלבונים, "קריאה" של הקוד הגנטי עבורם ממיתרי RNA והטמעת התוכנית הלכה למעשה.

ציירתי תמונה מאוד פשוטה אבל זו באמת זרימת המידע המרכזית, החשובה ביותר של החיים. הדוגמה המרכזית, שנאמר לראשונה על ידי פרנסיס קריק בשנת 1958, אומרת כי מידע גנטי זורם רק מחומצות גרעין (DNA ו- RNA) לחלבונים ולעולם לא חוזר - החלבונים שלך לא יכולים לחזור ולשנות את ה- DNA או RNA שלך, או אפילו לשנות חלבונים אחרים, הם נשלטים רק על ידי חומצות הגרעין.

כולם יודעים שהקוד הגנטי, המגולם ב- DNA, חשוב מאוד. מה שמעט פחות ידוע הוא שכל צעד לאורך מסלול הדוגמה המרכזי (מסלול הוא בעצם רצף של תגובות שכיחות שהופכות מולקולות זו לזו למשל, DNA -> RNA -> חלבון הוא מסלול, וחשוב מאוד! ) תואם את "מערך הנתונים" שלה, את אפיונו האישי של אורגניזם, כל אחד חשוב ומעניין בדרכו שלו.

מערכת הגנים שלך, המקודדת ב- DNA שלך, ידועה בשם הגנום. זהו "מערך הנתונים" העיקרי, התוכנית הראשית שלך, הגנום הוא הדברים שאומרים איך אתה עובד בצורה הכי מופשטת. כפי שאתה בטח יודע, הגנום הוא מחרוזת ארוכה מאוד של "אותיות" A, C, G ו- T, העומדות על ארבעת הנוקלאוטידים ... אל תדאגי, לא נפרט יותר מדי על הדברים האלה. פרויקט הגנום האנושי תאם בהצלחה ("לקרוא" מכתב אחר מכתב) טיוטה של ​​הגנום האנושי בשנת 2000 וגנום אנושי שלם בשנת 2003, שלושת מיליארדי המכתבים. מאז, שיטות הרצף השתפרו מאוד; יתר על כן, כל הגנומים האנושיים הם כמובן דומים מאוד, כך שברגע שיש לך אחד זה הרבה יותר קל להשיג את האחרים. הגנום שלכם קובע לאילו מחלות אתם רגישים ומגדיר רבים מהתכונות האופייניות שלכם.

חקר הגנום האנושי רחוק מלהסתיים, אך זהו רק החלק הראשון של הסיפור. כפי שראינו לעיל, יש לקרוא את הקוד הגנטי מ- DNA ל- RNA. זה מכונה שעתוק, תהליך מורכב לחלוטין שאינו רלוונטי לדיון שלנו כרגע: העניין הוא שפיסות הגנום מועתקות למילה RNA (באופן רשמי, T משנה ל- U, נוקלאוטיד אחר, אבל זה עדיין המדויק מידע זהה):

מקור תמונה

התאים מבדילים כאן בהם מתועתקים חלקים בגנום.

מערך רצפי ה- RNA (שניהם מקודדים RNA שישמש בהמשך לייצור חלבונים וגם RNA שאינו מקודד, כלומר שאר חלקיו) בתא נקרא התמליל. התמליל מספק מידע הרבה יותר ספציפי על תאים ורקמות בודדות: לדוגמה, לתא בכבד שלך יש אותו הגנום בדיוק כמו נוירון במוחך - אך טרנסקריפטומים שונים מאוד! על ידי לימוד התמליל, ביולוגים יכולים "להגביר את הרזולוציה" ולראות אילו גנים באים לידי ביטוי ברקמות שונות וכיצד. לדוגמה, רפואה מותאמת אישית מודרנית מנסרת תעתיקים לאבחון סרטן.

אך עדיין מדובר בקוד הגנטי. המערך השלישי מפורט עוד יותר: זהו הפרוטאום שמורכב מכל החלבונים המיוצרים בתא, בתהליך המכונה תרגום, שם RNA משמש כתבנית, עם שלוש אותיות המקודדות כל חלבון:

מקור תמונה

זה כבר הרבה יותר קרוב למטרה בפועל: החלבונים שתא מייצר קובעים את האינטראקציות שלו עם תאים אחרים, והפרוטאום אומר הרבה על מה התא עושה, מה תפקידו באורגניזם, מה ההשפעה שלו על אחרים תאים, וכן הלאה. והפרוטאום, בניגוד לגנום, נישא: תרופות רבות פועלות בדיוק על ידי דיכוי או מהירות של תרגום חלבונים ספציפיים. אנטיביוטיקה, למשל, נלחמת בדרך כלל בחיידקים על ידי תקיפת ה- RNA שלהם, מדכאת את סינתזת החלבון באופן מוחלט ובכך הורגת את התא.

גנומיקה, טרנסקריפטומיה ופרוטאומיקה הם תחומי משנה של ביולוגיה מולקולרית הבוחנת את הגנום, הטרנסקריפט והפרוטאום. הם ידועים ביחד כ"אומיקים ". הדוגמה המרכזית ידועה כבר תקופה ארוכה, אך רק לאחרונה מאוד ביולוגים פיתחו כלים חדשים שנראו לנו למעשה להציץ לתמלול ולפרוטאום.

וזה הוביל ל"מהפכת אומיקים "בנתונים הגדולים בביולוגיה מולקולרית: בעזרת כלים אלה, במקום לתאוריה, נוכל כעת לבדוק את הפרוטאום שלך ולגלות מה קורה בתאים שלך - ואולי לעזור לך באופן אישי, לא רק לפתח תרופה שצריכה לעבוד על רוב בני האדם אך איכשהו נכשלה עבורך.

מטבוליומיקה: מעבר לדוגמה

מקור תמונה

ביולוגים מולקולריים החלו לדבר על "מהפכת האומיקה" בהקשר של גנומיקה, טרנסקריפטיקה ופרוטאומיקה, אך הדוגמה המרכזית היא עדיין לא התמונה המלאה. תרגום חלבונים הוא רק תחילת התהליכים המתרחשים בתא; לאחר מכן, חלבונים אלה פועלים למעשה זה עם זה ומולקולות אחרות בתא. תגובות אלה כוללות את חילוף החומרים של התא, ובסופו של דבר זה בדיוק המטבוליזם שאנחנו מעוניינים בו ושאולי נרצה לתקן.

הביולוגיה המודרנית מעוניינת מאוד בתהליכים החורגים מהדוגמה המרכזית וכוללים את מה שמכונה מולקולות קטנות: אנזימים, ליפידים, גליקוז, ATP וכן הלאה. מולקולות קטנות אלו מסונתזות בתוך התאים - במקרה זה הם נקראים מטבוליטים, כלומר מוצרים של חילוף החומרים של התא - או מגיעים מעבר להם. למשל, ויטמינים הם מולקולות קטנות טיפוסיות שתאים זקוקים לה אך אינן יכולות לסנתז את עצמן, ותרופות הן מולקולות קטנות אקסוגניות שאנו מתכננים להתמודד עם חילוף החומרים של התא.

תהליכי סינתזה אלה נשלטים על ידי חלבונים ועוקבים אחר מה שמכונה מסלולי מטבולית, שרשראות של תגובות בעלות תפקיד ביולוגי נפוץ. הדוגמה המרכזית היא מסלול אחד חשוב מאוד, אך במציאות ישנם אלפים. מודל שפותח לאחרונה של חילוף חומרים אנושי מונה 5324 מטבוליטים, 7785 תגובות וגנים הקשורים ל -1675, וזו בהחלט לא הגרסא האחרונה - הערכות מודרניות מגיעות עד 19000 מטבוליטים, כך שהמסלולים עדיין לא מומו.

הפרופיל המטבולי של אורגניזם אינו נקבע במלואו על ידי הגנום, הטרנסקריפום שלו, או אפילו הפרוטאום: המטבוליום (סט המטבוליטים) נוצר, בפרט, תחת השפעת הסביבה המספקת, למשל, ויטמינים. מטבוליומיקה, החוקרת את ההרכב והאינטראקציה בין מטבוליטים באורגניזמים חיים, נמצאת בצומת הביולוגיה, הכימיה האנליטית והביואינפורמטיקה, עם יישומים הולכים וגדלים לרפואה (וזה לא אחרון האומיקים, אבל מטבולימוסים יספיקו לנו כעת) .

בידיעת המטבוליום, נוכל לאפיין טוב יותר ולאבחן מחלות שונות: כולן צריכות להשאיר עקבות בחילוף החומרים מכיוון שאם המטבוליזם לא השתנה מדוע בכלל יש בעיה? .. על ידי לימוד פרופילים מטבוליים של תאים ביולוגים יכולים לגלות סמנים ביולוגיים חדשים לאבחון וטיפול כאחד, מוצאים יעדים חדשים לתרופות. Metabolomics הוא הבסיס לרפואה המותאמת אישית באמת.

מערך הנתונים האולטימטיבי

מקור תמונה

עד כה, אני מסביר בעצם את ההתקדמות האחרונה בביולוגיה מולקולרית ורפואה. אבל מה אנו מתכננים לעשות בפרויקט הזה? אנחנו לא ביולוגים, אנחנו מדעני נתונים, חוקרי AI; מה החלק שלנו בזה?

ובכן, המטבוליזם הוא בעצם מערך נתונים ענק: לכל תא יש פרופיל מטבולי משלו (מערכת מולקולות המופיעות בתא). הבדלים בפרופילים מטבוליים קובעים אוכלוסיות תאים שונות, כיצד משתנים פרופילי חילוף החומרים בזמן לדפוסים של התפתחות התאים, וכן הלאה, וכן הלאה. יתר על כן, במטבוליומטיקה מרחבית שאנו מתכננים לשתף פעולה בנושא זה מגיע בצורה של תמונות מיוחדות: תוצאות הדמיה של ספקטרומטריה המונית המיושמת ברזולוציה גבוהה מאוד. זה שוב דורש הסבר כלשהו.

ספקטרומטריה המונית היא כלי שמאפשר לנו לגלות את המוני כל מה שיש במדגם. מלבד התנגשויות נדירות, זה בעצם זהה לגלות אילו מולקולות ספציפיות מופיעות במדגם. לדוגמה, אם תכניס יהלום בספקטרומטר המוני תראה ... לא, לא רק אטום פחמן בודד, סביר להניח שתראה איזוטופים 12C וגם 13C, וההרכב שלהם יגיד הרבה על תכונות היהלום.

הדמיה של ספקטרומטריה המונית היא בעצם תמונה שבה כל פיקסל הוא ספקטרום. אתה לוקח קטע מרקמה מסוימת, מכניס אותה לספקטרומטר המוני ומקבל "קוביית נתונים" תלת מימדית: כל פיקסל מכיל רשימה של מולקולות (מטבוליטים) שנמצאות בחלק זה של הרקמה. תהליך זה מוצג בתמונה למעלה. הייתי מציג כאן כמה תמונות אבל זה מטעה: העניין הוא שזו לא תמונה אחת, זה הרבה תמונות מקבילות, אחת לכל מטבוליט. משהו כזה (תמונה שצולמה מכאן):

השאיפה לייצור כלי הדמיה טובים יותר של ספקטרומטריה המונית נועדה בעיקר להגדיל את הרזולוציה, כלומר, להפוך את הפיקסלים לקטנים יותר, ולהגדיל את הרגישות, כלומר לזהות כמויות קטנות יותר של מטבוליטים. בשלב זה, הדמיה של ספקטרומטריה המונית עשתה דרך ארוכה: הרזולוציה היא כה גבוהה עד שפיקסלים בודדים בתמונה זו יכולים למפות לתאים בודדים! ספקטרומטריית המונים גבוהה-הדף הזו, שזכתה לכינוי "ספקטרומטריה-מסה-תא חד-תאית", פותחת את הדלת למטבולימטיקה: כעת תוכל לקבל את הפרופיל המטבולי של הרבה תאים בבת אחת, להשלים עם מיקומם המרחבי ברקמה. .

זהו מערך הנתונים האולטימטיבי של החיים, החשבון המעמיק ביותר של רקמות בפועל שקיימות ברגע זה. בפרויקט אנו מתכננים ללמוד מערך נתונים אולטימטיבי זה. בפרק הבא של מיני-סדרה זו, נראה איך.

סרגיי ניקולנקו, מנהל מחקר ראשי, Neomomation