מגזין מעיין דויד כ"ד אלול התשפ"ג

האם אפשר לסמוך על אבחונים רפואיים של הבינה המלאכותית? מתי המחשבים יחליפו את הרופאים? וכיצד מחשב קורא צילומים? >> אחרי שמיליוני אנשים בעולם שאלו את התוכנה שאלות רפואיות, הגיע הזמן לעשות סדר. יצאנו לפגוש את הרופאים המומחים שהסבירו את הסודות והכשלים

 

 מיליוני אנשים שמגלים סימפטומים מסוכנים באמצע הלילה, מנסים >> עכשיו הגיע הזמן לבדוק ולהיזהר

 

למי מאיתנו זה לא קרה. הילד הקטן מתעורר באמצע הלילה או אחותו המבוגרת יותר והם מרגישים כאב לא שגרתי. יש פריחה או סימפטום כלשהו, מטריד. מה עושים?

אנשים צעירים בדרך כלל מתקשרים להורים. אנשים קצת יותר מיומנים מתקשרים למוקד הלילה של הקופה. ברוב המקרים התשובה היא תמשיכו לישון, קחו משכך כאבים ובואו מחר עם שחר לראות רופא.

אבל בתקופה האחרונה הדברים משתנים. יותר ויותר אנשים מכל העולם מדווחים על יועץ לילי חדש: הבינה המלאכותית.

החברות שמנהלות את Chat GPT מזהות לא מעט שאלות רפואיות. בהרבה סיטואציות של ספקות רפואיים, מנוע הבינה המלאכותית העוצמתי נראה כמו פתרון קסם. 'כואבת לי הבטן בצד שמאל, מה זה יכול להיות?' 'לילד שלי יש חום גבוה וכאבי גב וראש, מה נראית לך האבחנה?'

הבינה המלאכותית בטוחה בעצמה. מפגיזה תשובות מדויקות בתוך שניות ספורות. כל מה שנשאר לנו עכשיו לברר הוא אם אפשר לסמוך עליהן.

רופאים שניסו את המערכת בשאלות דומות, יצאו סקפטיים. כך למשל ד"ר סטיבן יוז מאוני' 'אנגליה רסקין' הבריטית, מתאר כיצד שאל את הבינה המלאכותית מה האבחנות האפשריות של ילד עם כאב גרון ופריחה אדומה בפנים.

המחשב סיפק כמה אפשרויות סבירות, אבל לא ציין כלל אפשרות אחת, שהרופא חשב עליה: שנית (סקרלטינה). שנית נפוצה היום הרבה פחות מפעם, אבל רופאים עדיין יכולים להיתקל בה אצל ילדים, וחשוב לאבחן אותה נכונה כדי להעניק טיפול אנטיביוטי שמונע סיבוכים בהמשך.

יוז תמה על ההשמטה החשובה, הוסיף לרשימת התסמינים שתיאר למחשב מינוח בז'רגון רפואי שמתאר את סוג הפריחה – כזו שבה האזור סביב הפה נשאר חף מהפריחה האדומה: perioral sparing. זהו מאפיין קלאסי של שנית. בשלב זה ההשערה הראשונה של הבינה המלאכותית באשר למחלה הייתה אכן שנית.

המסקנה? התוכנה כנראה אוהבת ז'רגון מקצועי, אומר ד"ר יוז. ובהתחשב בכך שההורה הממוצע המודאג מהחום והפריחה של הילד לא מכיר את המונחים הרפואיים, שמתארים ניואנסים של מאפיינים קליניים שונים, טוב יעשה אם ייקח את ילדו לרופא ולא יסתמך על הבינה המלאכותית שתאבחן אותו.

המגבלות הנוכחיות של פיתוח הבינה המלאכותית, עם זאת, לא צפויות להפסיק את ההתקדמות העצומה של התחום. נכון שעדיין לא מומלץ לנסות לאבחן את עצמנו בעזרת בינה מלאכותית, אולם הבינה המלאכותית היא כבר חלק בלתי נפרד מעולם הרפואה, ואת המגמה הזו כבר אי אפשר להפוך.

האם זה אומר שבעוד כמה שנים תבואו למרפאה ותשבו לפני מחשב שיאבחן ויטפל בכם? יצאנו לבדוק.

 

המכונה לומדת לאבחן

בינה מלאכותית, בגלגוליה הבוסריים יותר, היא חלק ממערכות רפואה כבר עשרות שנים. אם עברתם אק"ג בעשרים וחמש השנים האחרונות, יש סיכוי טוב שתוכנה סייעה בפענוח. התוכנות הללו נוטות להיות פשוטות למדי ובעזרת מערך חוקים שהוזן אליהן, הן יודעות לקשר בין דפוסי גלים שונים למגוון מצבים, כמו חסימת עורק או פרפור פרוזדורים.

עדיין, לא בכל בדיקה רפואית ששילבה עד היום תוכנות מחשב התוצאות מספקות באותה מידה. כשמדובר בממוגרפיה, למשל, המיועדת לזהות גידולים סרטניים בשלבים ראשוניים מאוד, תוכנות פענוח הן חלק מהתהליך בעשורים האחרונים. אולם, כמו במקרה של האק"ג, המכונות הללו לא 'מחכימות עם למידה'.

זה לא משנה אם הן ראו אלף בדיקות שדורשות פענוח או רק שתיים – הן עובדות לפי חוקים שלימדו אותן. התוצאה? במחקר מתשס"ז (2007) שהשווה את הדיוק של בדיקות ממוגרפיה לפני ואחרי ההטמעה של עזרי מחשב, נמצא ששיעור הביופסיות אכן עלה פלאים, אולם שיעור הזיהוי של גידולים ממאירים חודרניים קטנים, הסוג שמבחינה רפואית הכי חשוב לפענח בבדיקה כזו, ירד.

ביצועים מהסוג הזה הובילו מדענים, שעסקו בתחום הבינה המלאכותית ברפואה, להסיק שהעתיד בתחום לא שייך לאלגוריתמים מבוססים על חוקים, אלא לכאלה המבוססים על למידה. המכונה צריכה ללמוד איך לאבחן, בדיוק כפי שרופא לא רק משנן את ספר הרפואה שלו כדי להגיע לדיאגנוזה, אלא הוא מתבסס בעיקר על שנים ארוכות של ניסיון. אסטרטגיית המחשוב הזו ידוע בשם 'רשת נוירונים' כי את ההשראה לה אפשר למצוא באופן שבו המוח מתפקד, עם סינפסות (קשרים בין הנוירונים) שמתחזקות או נחלשות בהתאם למידת ההפעלה שלהם.

מי שביצע את אחד הצעדים הראשונים המרשימים ביותר בתחום היה מדען המחשבים סבסטיאן תרון, אז פרופסור באוני' סטנפורד ובמקביל בכיר בחברת 'גוגל'. תרון, שאימו מתה מסרטן שאובחן מאוחר מדי, התעניין בפיתוח בינה מלאכותית שתמנע טרגדיות כאלה. הוא בחר להתחיל בסרטן עור, תחום שדורש אבחון של רופא עור מנוסה בשלבים ראשוניים, כדי להחליט אם יש חשד שמצדיק ביופסיה.

על אף שספרי רפואת עור מפרטים מספר מאפיינים חשודים של שומות (חוסר סימטרייה, גבולות מטושטשים, קוטר גדול יותר משישה מ"מ וכן הלאה), תרון שם לב שבפועל במאגרי תמונות של גידולי עור שהתגלו בביופסיה כממאירים, רבים מהם לא כללו את המאפיינים הללו.

תרון גייס שני סטודנטים לסיוע במחקר, והם מצאו מאגרים שונים של מחלות עור וגידולי עור שסווגו על ידי רופאי עור. בעשרות אלפי התמונות הללו היו גם כמה אלפי תמונות שהסיווג שלהן אושר על ידי ביופסיה, ולכן הסטטוס של הגידולים היה ברמת ודאות גבוהה מאוד. הסטודנטים הזינו את התמונות – עם הסיווג שלהן – למערכת הממוחשבת, במטרה שדרך החשיפה לכמות כה עצומה של דאטה, המערכת תדע לאבחן גם בעתיד נגעי עור חשודים.

בשום שלב של התכנות לא הוסבר למערכת מה הם הכללים לזיהוי נגעי עור ממאירים. תרון הסביר זאת כך: "תארו לעצמכם שאתם מנסים ללמד תוכנה מיושנת לזהות כלב. מהנדס תוכנה יכתוב אלף משפטי 'אם' כדי לעזור לה בכך: 'אם יש ליצור אוזניים, ואף, ופרווה, ואם הוא איננו עכברוש', וכך הלאה והלאה בלי סוף. אבל כמובן, לא ככה בני אדם לומדים לזהות כלבים. הם לומדים כי הם רואים כלבים ואומרים להם שהדבר הזה הוא כלב.

"אלגוריתם למידת המכונה כמוהו כילד, מושך מידע מ'מערך ההכשרה' שעבר מיון. זה כלב, וזה אינו כלב. ואז הוא שולף מאפיינים ממערך אחד בהשוואה למערך אחר, ובכך שהוא בודק את עצמו ביחס למאות אלפי תמונות מסווגות הוא מתחיל ליצור את הדרך שלו לזיהוי כלב. בדיוק כפי שילד עושה זאת".

בתשע"ה (2015) התחיל הצוות של רתון לבחון מה התוכנה למדה בכך שהציג לה 14,000 תמונות, שאובחנו על ידי רופאי עור. המערכת אבחנה נכון 72 אחוז מהמקרים. שני רופאי עור שנבחנו לצידו קיבלו ציונים גרועים יותר: הם צדקו רק ב־66 אחוזים מהמקרים.

בשלב הבא גייסו תרון וצוותו עשרים וחמישה רופאי עור, והפעם השתמשו באלפיים תמונות של גידולים שעברו ביופסיה, כדי לבדוק אם הם שפירים או ממאירים. כמעט בכל מבחן הייתה התוכנה רגישה יותר מהרופאים והחמיצה הרבה פחות מלנומות. היא גם הייתה ספציפית יותר: היא נטתה הרבה פחות לקבוע שמשהו הוא מלנומה בזמן שהוא לא היה. "בכל אחד מהמבחנים התוכנה ביצעה את האבחון טוב יותר מרופאי עור מומחים", סיכמו החוקרים בדו"ח שהתפרסם בכתב העת נייצ'ר.

 

בינה עם מגבלות

לכאורה הכל נראה נהדר. למה בכלל להמתין לתור רחוק אצל רופא מומחה, אם התוכנה יכולה לאבחן אותנו בדייקנות רבה יותר? ואם הבינה המלאכותית מפגינה ביצועים מהסוג שהוכיח הצוות של תרון, איך ייתכן שעברו שמונה שנים מאז הניסוי הזה ועדיין אנחנו מתייצבים אצל רופא עור כדי שיבדוק את השומות?

פרופסור אנריקו קויירה הוא פרופסור לאינפורמטיקה רפואית ומנהל המרכז לאינפורמטיקת בריאות באוני' מקווארי האוסטרלית. הוא רופא שגם מחזיק בדוקטורט במחשבים, והקים באוסטרליה את האגודה הלאומית לקידום בינה מלאכותית ברפואה. במאמר שפרסם לאחרונה עם עמיתים בכתב העת The Conversation, הוא מזהיר שלמרות הפיתוחים הרבים בתחום הבינה המלאכותית ברפואה, אין כלל ודאות שהם עומדים בסטנדרטים הנדרשים במקצוע הבריאות. לעיתים יהיו להם הטיות שיגרמו נזק, במיוחד אם כלי הבינה המלאכותית ייבחן בסביבה חדשה שהוא לא מכיר.

"אם מדברים על המחקרים בתחום זיהוי שומות חשודות, למשל", הוא אומר בריאיון ל'משפחה', "זו דוגמה טובה להטיה שקיימת בדאטה. רוב הדאטה הזמינה על גידולי עור נוגעת לאנשים לבנים. ככל שמדובר בהם, הבינה המלאכותית יכולה לספק מענה. אבל אם היא פותחה על בסיס דאטה כזו בלבד, היא לא תהיה באמת יעילה לטיפול בארצות שבהן רוב האוכלוסייה אינה לבנה. צריך ללמד אותה מחדש עם דאטה מאוכלוסיות אחרות ומקומות אחרים".

ככלל, הוא אומר, ההצלחות המדהימות של כלי הבינה המלאכותית מתרחשות בתנאי מעבדה. "בתנאי שדה אנחנו פשוט לא רואים שהם מצליחים לשחזר את ההצלחה. ושוב – זה קשור לדאטה. אם תיקחו דאטה מבית חולים גדול בתל אביב, לדוגמה, ותפתחו לפיו כלי אבחוני ואז תיישמו אותו במדינה אחרת – אנחנו יודעים בוודאות ששיעורי ההצלחה שלו יצנחו, כי האוכלוסיות הן שונות".

הוא מציין שיש גם בעיה נפוצה נוספת עם כלים אבחוניים על בסיס בינה מלאכותית. "שימוש בהם יכול ליצור מצב של אבחון יתר, שזו בעיה שהעולם הרפואי סובל ממנה כבר היום. כיום אנחנו אומרים שעוד לפני הבינה המלאכותית, רק 60 אחוזים מכלל הטיפולים הרפואיים שניתנים הם מוצדקים ומבוססי ראיות. 30 אחוזים מיותרים לחלוטין, ועוד 10 אחוזים מזיקים ממש.

"נתקלתי לאחרונה, למשל, בכלי למידת מכונה שהיה טוב יותר מרופאים בזיהוי תסמינים לסרטן בלוטת התריס באולטרה סאונד. הבעיה שכבר היום אנחנו מזהים יותר מדי מקרים לא מסוכנים של סרטן בלוטת התריס ומטפלים ביותר מדי אנשים! שימוש בבינה מלאכותית רק יחמיר את הבעיה, וזה סיכון שחשוב להיות ערים אליו".

אולי בשל נקודות התורפה הללו, קויירה רואה בעיקר את עתיד הבינה המלאכותית בהשתלבות במערך הכלים העומדים לרשות הרופא. "אנשים היום הולכים לרופא ומרגישים שהוא לא באמת מקשיב להם, כי הוא מקליד כל הזמן. האם זה לא היה נהדר אם הרופא והפציינט יכלו לנהל שיחה מרוכזת, בעוד שהמחשב מקשיב ויוצר בעצמו את סיכום הביקור? לפני חמש שנים צוות שלי ניסה לפתח את זה, אבל התוכנה פשוט לא הייתה מספיק טובה. היום אנחנו ממש על סף השגת יישום כזה. הוא יהיה שינוי גדול, אבל הוא יקרה בהדרגתיות. כתוצאה מכך, כמו שהיום רופאים לומדים 'תקשורת עם פציינטים', הם ילמדו בעתיד 'תקשורת עם מחשבים', כדי למקסם את התועלת מהבינה המלאכותית".

עם זאת, גם ביישומים כאלה יש בעיות אפשריות. "באוסטרליה נשמעו תלונות לאחרונה על כך שרופאים השתמשו בבינה מלאכותית כדי לסכם דאטה של פציינטים. לרופא זה אולי טוב, אבל לפציינט לא בהכרח, כי הדאטה לא נשארת כאן אלא מגיעה למחשבי החברה בארה"ב. זו הפרת חוק החיסיון הרפואי ולכן בעייתית. כתוצאה מכך, כל מה שנרצה לפתח במישור הזה ידרוש פיתוח מקומי שישאיר את הדאטה במדינה ויכפיף אותה לחוקים מקומיים. בלי זה אנשים עלולים לשלם מחיר משפטי כבד".

קויירה, כאמור, ייסד את האגודה האוסטרלית לקידום בינה מלאכותית ברפואה. המטרה, הוא אומר, הייתה לגרום לשיתוף פעולה של כל הגורמים האפשריים לקידום התחום. "אוסטרליה היא מדינה בגודל של ארצות הברית, אבל עם אוכלוסייה קטנה – עשרים ושניים מיליון בסך הכל – ומפוזרת מאוד. כדי שנוכל להביא בינה מלאכותית לשירותי הבריאות כאן, כולם חייבים לעבוד ביחד: הממשלה, התעשייה, המחקר, שירותי הבריאות. אין לנו גודל שוק של ארה"ב או השקעה ממשלתית עצומה בבריאות של בריטניה או תרבות סטרטאפים של מדינת ישראל, לכן היינו צריכים למצוא דרך אחרת לעשות את זה".

למרות ההבדל בין גודלה של אוסטרליה לזה של מדינת ישראל, קויירה מדבר על פתרונות בינה מלאכותית בהקשרים של בעיות שיישמעו מוכרות מאוד לישראלים.

"אין באמת גישה אחידה לטיפול רפואי איכותי באוסטרליה. אם אתה בבריסביין או בסידני או במלבורן תקבל טיפול רפואי ברמה עולמית, אבל אם אתה ביישוב מרוחק, זה מסובך הרבה יותר. המרכזים הרפואיים הטובים רחוקים ואנחנו לא מצליחים לגרום לאנשי רפואה לעבור לגור במקומות הללו ולעבוד שם.

"בזכות הקורונה השקיעה הממשלה סוף סוף ב'טל-רפואה' והסכימה לשלם לרופאים שמטפלים כך בפציינטים. זה פתרון טוב במיוחד לרפואת משפחה. ובתחום ה'טל-רפואה', בינה מלאכותית יכולה לעזור מאוד.

"ראשית, תוכנה טובה של בינה מלאכותית יכולה לעזור לאנשים להחליט איזה שירות רפואי הם בכלל צריכים. הם מתארים את המצב שלהם והאלגוריתם מחליט אם הם צריכים לראות רופא מייד, לדבר עם אחות או פשוט לקבוע תור לרופא בימים הקרובים. שנית, גם כשכבר מגיעים לבית חולים, בינה מלאכותית יכולה לסייע בחדרי המיון העמוסים לעשות טריאז' ולקבוע עדיפויות טיפול.

"בינה מלאכותית גם יכולה לנטר את הדאטה של המטופל באופן שוטף ולהרים דגל אדום כשיש צורך בהתערבות של רופא. באופן כזה גם אפשר להיעזר ברופאים מומחים בערים הגדולות, שמקבלים את הדאטה מהתוכנה ומייעצים לפיה".

 

לא רופא, עוזר

ניפרד מאוסטרליה ונחזור לארץ. בשנה שעברה הושק בחיפה מרכז ראשון מסוגו בארץ, ומהראשונים מסוגו בעולם: מרכז הטכניון-רמב"ם לבינה מלאכותית ברפואה. את היוזמה הוביל פרופסור יואכים בהר, העומד בראש המעבדה לבינה מלאכותית בטכניון. המרכז, הבטיחו יוזמיו, יקדם מהפכה בקבלת החלטות רפואיות.

"לכלי בינה מלאכותית יש פוטנציאל לזהות מחלות מוקדם יותר וטוב יותר", מסביר פרופסור בהר בריאיון 'למשפחה'. "למשל, כשעושים אק"ג לרופא הוא יכול להיראות תקין, אבל בינה מלאכותית יכולה לפעמים לזהות דפוסים שמצביעים על בעיה שתבוא לידי ביטוי בהמשך.

"יש אפשרות להשתמש בדאטה קלינית כדי לפתח כלי בינה מלאכותית שיצביעו על מידע רפואי חשוב גם בבדיקות שלכאורה לא קשורות למידע הזה. רופא עיניים, למשל, מסתכל על תמונות של עיניים כדי לזהות בעיות עיניים. אבל בעזרת בינה מלאכותית שרגישה מאוד לזיהוי דפוסים, יש פוטנציאל שהתוכנה תסתכל על צילומי העיניים הללו ותזהה מחלות כלי דם. זה אומר שאנחנו משתמשים בדאטה שכבר קיימת, כי הבדיקות הללו ממילא נעשות, אבל מפיקים מהם יותר ידע רפואי על הפציינט. זה ידע שרופא העיניים שלו לא יכול לראות. הוא לא מסתכל על זה, והוא גם מומחה בתחום שלו, לא בכל תחום אחר, כמו כלי דם".

התקדמות כזו, הוא מסביר, היא לא רק תאורטית, אלא כבר נוסתה בהיקפים נרחבים. "לדוגמה, עשינו ניסוי גדול עם רישומי אק"ג של 400,000 אנשים, כדי לבדוק אם הבינה המלאכותית יכולה למצוא מי בסיכון לפרפור לב. התברר שאכן יש מבנים מסוימים באק"ג שהרופא לא יראה בהם שום דבר חשוד, אבל הבינה המלאכותית מסוגלת לגלות, על בסיס הדאטה העצומה שלה, איפה יש דפוס שדורש מעקב".

גם הוא, כמו פרופסור קויירה, מודע מאוד לכך שיכולות האבחון המוקדם של כלי בינה מלאכותית מגיעות עם סיכונים ולא רק עם סיכויים. הניווט בין השניים, הוא אומר, הוא עניין של מדיניות בריאות הציבור.

"נגיד שבדיקות עיניים יכולות לתת תחזיות על סיכון למחלות לב. אם בכל פעם שבן אדם יעשה בדיקת עיניים הבינה המלאכותית שלו תסרוק את הבדיקה בחיפוש אחרי דגלים אדומים קרדיולוגיים, מערכת הבריאות תקרוס. לכן סביר יותר שתוכנות כאלה ייושמו רק לגבי קבוצות סיכון ספציפיות".

על שיתוף הפעולה עם בית חולים רמב"ם הוא מספר: "שנינו בחיפה. אנחנו בטכניון חזקים בבינה מלאכותית והנדסה ויש לנו מרכז חישובים חזק. להם יש רופאים טובים והרבה דאטה רפואית. זה שיתוף פעולה הגיוני שמחבר את הידע והכלים של שני הצדדים. חוץ מהעובדה שהקשר עם בית חולים מספק לנו דאטה, חלק גדול מהיוזמה הוא להכניס את הדברים האלה לבית חולים, לעבוד עם רופאים, לראות איך הם מעוניינים להשתמש בכלי הבינה המלאכותית ואיפה הם יכולים להשפיע. העבודה המשותפת מאפשרת את החיבור הזה".

 

בצפי לעתיד, האם אתה חושב שבינה מלאכותית תחליף רופאים?

"זו שאלה קלאסית, אבל אני באמת לא חושב שבינה מלאכותית תחליף רופאים. היא כן תשנה את העבודה של הרופא. כשלא היה אק"ג, הרופא היה בודק את בריאות הלב בסטטוסקופ. היום יש אק"ג. וכשיהיה לו כלי חדש, העבודה של הקרדיולוג שוב תשתנה. זה קורה תמיד עם כל מהפכה חדשה במכשור או תרופות. כן, רופאים צריכים להיות מוכנים לשינויים וללמוד איך לעבוד עם הכלים החדשים. אני כן רואה שרופא שיודע להשתמש בכלי הבינה המלאכותית הכי מתקדמים, יש לו סיכוי טוב יותר להצליח בימינו".