פרופ' בן-עמי סלע, מנהל המכון לכימיה פתולוגית, מרכז רפואי שיבא, תל-השומר; החוג לגנטיקה מולקולארית וביוכימיה, פקולטה לרפואה, אוניברסיטת תל-אביב.
באופן טבעי לחלוטין, העשייה הרפואית מורכבת משני חלקים חשובים במידה שווה: שלב האבחון ושלב הטיפול.
שני השלבים הללו דורשים ידע ומיומנות רבים של הרופאים המטפלים, באופן שאבחון נכון ומדויק של מחלה או מפגע רפואי, יספקו את הבסיס לטיפול האופטימאלי שיבוא לאחר מכן, אם טיפול תרופתי או שמרני אחר, או שמא טיפול כירורגי בניתוח מתחייב.
ב-20 השנים האחרונות אנו נחשפים יותר למידע הרפואי הנובע מהניסיון והידע שנרכש באין-ספור מחקרים וניסויים קליניים שיצרו תשתית הידועה כ-evidence-based medicine (EBM), או רפואה המתבססת על נתונים ועדויות פרי מחקרים אלה.
למרות שכל מטופל, הוא עולם לעצמו, ואין שני אנשים בעולמנו, ואף בני אותה משפחה, המגיבים באופן זהה לחלוטין לאותו טיפול תרופתי, ויתרה מזאת, אין שני אנשים בעולמנו שילקו במחלה או במפגע רפואי באופן דומה, כאשר הם נחשפים לאותו פתוגן, או לאותם גורמי-סיכון, עדיין הידע והפרוטוקולים הרפואיים הנגזרים מהתנהגות ממוצעת של כלל האוכלוסייה, מספקים לרופא המודרני את הבסיס לאבחון נכון, ולטיפול נכון.
הרופא המודרני, חייב בגלל שפע המידע האמור להסתגל ולהתעדכן ואף לשנות לעתים את דרך חשיבתו ואופן ההתייחסות שלו למטופליו: מה שלמד הרופא בפקולטה לרפואה לפני 30 שנה, עשרים שנה, ולעתים אך לפני 5 שנים, עלול כבר לא להספיק ברגע זה, כאשר מדע הרפואה שועט קדימה וגורם לכך שיום יום אנו למדים עוּבדוֹת ואמיתות רפואיות חדשות.
בדיקות רפואיות חדשות נותנות בידי הרופא מכשירים טובים יותר לנסות ולאבחן מה מציק לראובן או כיצד לטפל בשמעון. לפני דור איש מהרופאים לא ידע מה משמעות מדידת BNP כמדד לאי-ספיקת לב, או מדידת D-dimer להערכת יצירת קרישי דם, כאשר היום שני טסטים אלה הם מרכזיים בעשייה הרפואית.
כאשר מתגלים אותם מבדקי מעבדה חדשים, הם מתוארים במושגים של הרגישות שלהם (sensitivity) ושל הסגוליות שלהם (specificity).
מבחן רגיש טוב לגילוי של מחלה קיימת, בעוד מבדק סגולי טוב לאישור של העדר מחלה בנבדקים בריאים.
אך ישנם עוד גורמים חשובים הקובעים מתי נזדקק למבדק מעבדתי זה או אחר, ואלה כוללים את עלות המבדק, מידת זמינותו, ואף מידת הסיכון הנגרם למטופל מעצם ביצוע המבדק המסוים.
אך חשוב מכל, האם המידע יסייע לרופא להגיע לאבחון מדויק יותר, שהרי מבדקים רפואיים עלולים להזיק אם הם מובילים לטיפולים חודרניים מיותרים או אף לטעת במטופל דאגה מיותרת ולא מוצדקת.
לדוגמה, אם נבדק מבוגר המעשן מגיע לרופא עם תמונה של קוצר נשימה (dyspnea) ממקור לא ברור, הרופא עשוי לשקול ביצוע בדיקת א.ק.ג., בדיקת אֶקוֹ, צילום חזה, ומדידת רמת BNP בדם. האם יש אמנם צורך בביצוע של כל הארבעה? במקרה כמו שלפנינו, מחקרים אחדים ביחידות לטיפול נמרץ בבתי חולים אירופיים, מצאו שביצוע מדידת רמת BNP עשויה להפחית את אורך האשפוז, ואת העלויות הכספיות שלו, וכמובן את אי הנוחות הנגרמת למאושפז. במקרה שלפנינו סביר היה לבצע צילום חזה, ובדיקת א.ק.ג., אך אין צורך לבצע בדיקת אקו, אם מדידת רמת BNP שהיא בדיקת דם פשוטה מתקבלת נורמאלית.
הרופא המבקש בדיקה מסוימת, צריך לנתח בקבלת התשובה האם כאשר התוצאה המתקבלת "חיובית", מה הסבירות לקיומה של המחלה הנחשדת במטופל המסוים? כאן אנו דנים במושג "ערך ניבוי חיובי של המבדק" או positive predictive value. אך כאשר מבדק מסוים מניב תוצאה "שלילית" צריך הרופא להתלבט מהי הסבירות שהנבדק אמנם חף מהמחלה הנחשדת, או "ערך ניבוי שלילי של המבדק" (negative predictive value").
לכל מבדק רפואי יש מה שמכונֶה יחס סבירות חיובי או שלילי או positive likelihood ratio (LR+) ו-negative likelihood ratio (LR-), למה הכוונה? יחסי סבירות אלה מגלים לנו את המידה על פיה מבדקים רפואיים חיוביים או שליליים מגבירים או מפחיתים את ההסתברות של מחלה. כאשרLR נמצא בתחום שבין 5.0 ל-10.0, הסיכוי למחלה גבוה, ואילו ערך LR שנמצא בין 0.1 ל-0.2 מצביע על סיכוי נמוך מאוד למחלה. מובן שערכי ביניים של LR בין 1.0 ל-5.0 מעידים על סיכון ממוצע לקיום מחלה נחשדת.
מספר מבדקים רפואיים שנחשבו בעבר חיוניים לאבחון מחלות , מתבררים במרוצת השנים כבלתי מדויקים כאשר בוחנים אותם בקפידה. כלומר אותם מבדקים שעדיין נלמדים בפקולטות לרפואה, ועדיין נמצאים בשימוש נרחב העשייה הקלינית, הם בעלי ערכי LR הקרובים ל-1.0, ולכן ערכם האבחוני נמוך, ונביא כמה דוגמאות:
1. דלקת חריפה של כיס המרה (acute cholecystitis) – אחת הבדיקות המקובלות היא מדידת שני אנזימי הכבד הידועים כטרנסאמינזות (sGPT ו-sGOT). הרגישות של מבדק כזה היא 38% והסגוליות שלו היא של 62%. ה-LR+ של מבדק כזה הוא של 1.0 כמו גם ה-LR- שלו.
2. מהלכים באבחון סרטן שד במקרה של הפרשה ספונטאנית מהפטמה המוגבלת לצינור חלב אחד-המבדק המתבצע עדיין הוא בדיקת אל-שמע (אולטרה-סאונד) שיש לו רגישות של 36%, סגוליות של 68%, LR+ של 1.1 ו-LR- של 0.94. ערך הניבוי של מבדק זה אינו אם כן מהגבוהים.
3. אבחנה של אנמיה על רקע חסר ברזל- אחת המדדים הקלאסיים שתמיד היה נדמה שהוא מזוהה הכי טוב עם אנמיה על רקע חסר ברזל היה נפח נמוך של כדוריות דם אדומות (MCV) בתחום שבין 75 עד 79 פמטוליטר. מסתבר שמדד זה הוא בעל LR+ נמוך של 1.0, דהינו הערך האבחוני שלו נמוך. המדדים המשמעותיים יותר לאנמיה על רקע חסר ברזל הם ביצוע משטח דם ובדיקה מיקרוסקופית המגלה צביעה היפוכרומאטית (כלומר צביעת חסר של הכדוריות האדומות), ערך גבוה של RDW המבטא פיזור גדול של כדוריות אדומות עם גדלים שונים, מצב של פּוֹיקילוציטוזיס דהינו מורפולוגיה משתנה של הכדוריות, וכמובן רמה נמוכה של פריטין בדם שהוא המדד הרגיש ביותר לאנמיה על רקע חסר ברזל, רמה נמוכה של ברזל בדם, ותוצאה גבוהה של TIBC או כושר הקישור ברזל על ידי החלבון נושא הברזל טרנספרין. במקרים של חסר ברזל, הכבד מייצר יותר טרנספרין, על מנת לקשור ככל האפשר ברזל בדם ולמנוע אבדן ברזל חופשי הנמצא בדם בכמות נמוכה.
4. הֵצרוּת של תעלת עמוד השדרה באזור המותניים (lumbar spinal stenosis)- מבדק קליני שמקובל שנים רבות הוא המדד של כאבים חזקים המתגברים בשעת הליכה. הרגישות של מבדק זה היא של 71% והסגוליות שלו היא של 30%, כאשרLR+ ו LR- של מדד זה היא של 1.0, דהינו מבדק בעל ערך אבחוני מוגבל.
5. כאבי ראש כתוצאה ממיגרנה-כאשר מדד מקובל עד היום הוא שכאבי הראש הללו מתגברים על ידי הופעת המחזור החודשי. למדד זה רגישות של 44% וסגוליות של 56%, וערכיLR+ ו LR- של 1.0, המעידים על מבדק עם ערך אבחנתי מוגבל.
6. סרטן השחלות-עד היום מקובל שהתסמין האפשרי הראשון היא תחושה עמומה של אי-נוחות בתחתית הבטן, המזוהה עם הפרעות בעיכול המזון (indigestion). למדד זה רגישות של 36% וסגוליות של 63%, אך ערכי LR+ וLR- של 1.0, שוב כושר אבחוני נמוך.
7. מחלת עורקים היקפיים-עד היום משתמשים במדד אבחוני של דופק חלש בעורק השוק, אך מדד זה עם רגישות של 33% וסגוליות של 67% וערכי LR+ ו LR- של 1.0, אינו יכול להיחשב מדד אבחוני משמעותי.
8. תסחיף ריאתי (pulmonary embolism)-בדיקה שעדיין נהנית מפופולאריות היא ביצוע של סריקה הדמייתית של הריאות לבחינה של הצירקולציה של אוויר ודם בריאות. המבחן מוכר כ-V/Q lung scan או כ-ventilation/perfusion lung scan. בדיקה זו מבוצעת לגלות האם יש קרישי דם או זרימת דם בלתי נורמאלית בתוך הריאות, למרות שבדיקה יותר מודרנית ומדויקת היא ביצוע CT עם חומר ניגוד. לבדיקת V/Q lung scan יש LR+ של 1.2, שאף הוא נמוך ואינו מייחס למבדק זה ערך אבחוני מובהק.
הדגמה משכנעת למשמעות של ערכי LR משתנים לגבי הסבירות להתרחשות של סרטן רירית הרחם (endometrial cancer) על ידי מדידה על ידי אולטרה-סאונד טרנס-ואגינאלי של עובי רירית הרחם בנשים בגיל 55 שנה ומעלה עם תופעות דמם מהנרתיק. שיטה זו הולכת ותופסת תאוצה ולא בכדי.
הבה נעקוב אחר תוצאות המבדק ומובהקותן לגבי סרטן רירית הרחם: כאשר עובי הרירית קטן מ-4 מילימטר, ה-LR של תוצאה זו הוא 0.02 והסבירות לסרטן היא 0.2% בלבד. כאשר עובי הרירית נמדד כ-5 מילימטר ערך ה-LR הוא 0.2 והסבירות לסרטן עולה ל-2.3%. עובי רירית של 6-10 מילימטר נותן LR של 0.5 עם סבירות של 5.3% לסרטן, ועובי רירית של 11 עד 15 מילימטר מעלה את ה-LR ל-2.2 עם סבירות לגילוי סרטן של 19.6%. כאשר הרירית נמדדת בעובי של 16 עד 20 מילימטר ה-KR מגיע כבר ל-6.4 עם הסתברות לסרטן הרירית של 41.6%, ואילו עובי נמדד של רירית הרחם שבין 21 ל-25 מילימטר נותן LR של 9.0 עם הסתברות של 50% לסרטן. מעל 25 מילימטר של עובי הרירית ה-LR מטפס ל-15.2 עם הסתברות גבוהה של 63% לסרטן הרחם.
מספר מבדקי מעבדה טובים בתור מנבאי מחלה כאשר התוצאה שלהם מתקבלת חיובית, אך אותם מבדקים עצמם אינם שוללים את המחלה כאשר הם מתקבלים שליליים, והיפוכו של דבר.
תופעה זו יכולה להקשות על הרופא הסבור שתוצאות המבדקים מתנהגות באופן סימטרי, בהוכחה או בשלילה של מחלה. מבדקים שהם שימושיים רק לאישוש מחלה, נוטים להיות אלה עם רגישות של 50% אך יש להם סגוליות (specificity) גבוהה מאוד.
היפוכו של דבר, מבדקים השימושיים רק בשלילת אפשרות של מחלה, הם בעלי רגישות גבוהה מאוד, אך הסגוליות שלהם ממוצעת. דוגמה טובה לכך מגיעה מבדיקת D-dimer, המתבצעת באלה בהם קיים חשש לתסחיף ריאתי (PE). מדידת D-dimer הנותנת תוצאה של מעל 500 מיקרוגרם לליטר רגישה ב-99% אך הסגוליות שלה לאבחון מצב של PE היא רק של 44%. לתוצאה כזו ישLR+ של 1.8, ו LR- של 0.2. החישוב מראה שאם לנבדק יש לפני המבדק סבירות מוקדמת של 10% להתרחשות של PE, סבירות זו עולה ל-17% אם תוצאת מבדק ה-D-dimer אינה נורמאלית, וזו תוצאה שאינה עוזרת מבחינה קלינית לרופא המאבחן.
לעומת זאת, אם תוצאת מבדק ה-D-dimer מתקבלות נורמאליות, הסבירות ל-PE נופלת ל-0.2% בלבד. כך שמבדק זה מעולה לשלילת PE, כאשר הוא שלילי בנבדק עם סיכון נמוך לתסחיף ריאתי, אך ערכו זעום לאשש תסחיף ריאתי כאשר באותו נבדק התוצאה המתקבלת היא בלתי נורמאלית.
קיימת הנחה שגויה שכיחה, שתוצאות ממוצעות המתבססות על evidence based medicine, יכולות לשמש מעין מדריך מתכונים רפואי או cook-book medicine, על פיו כל המטופלים זוכים לטיפול זהה במצבים קליניים זהים או דומים. אך תסריט כזה כמובן אינו נכון.
שֶף טוב הרוקח מטעמים במטבח יודע שספר בישול מספק רק את עמדת הפתיחה הנכונה להכנת תבשיל או תפריט מסוים, אך יש כמובן חלופות אחדות הטובות באותה מידה להגיע לתפריט טעים, וזאת כמובן בתלות במרכיבי המזון הזמינים ובפריטי היעד של הארוחה.
באופן דומה, הפענוח של מבדק רפואי, וההתנהלות הטיפולית לאחר מכן, תלויים בהסתברות של המחלה הנחשדת. דוגמה אחת היא תוצאה בלתי נורמאלית של מדידת CA-125 שלאחריה מתבצע מבחן אולטרה-סאונד אם תוצאת מבחן ה-CA-125 אינה תקינה, ששילובם נותן 57% רגישות ו-99% סגוליות לסרטן השחלה.
מבדק כפול זה הוא בעל ערךLR+ של 75, וערך LR- של 0.43. לכן, מבדק זה טוב לאישוש סרטן השחלות כאשר הוא מתקבל חיובי, אך אינו טוב לשלול סרטן השחלות כאשר הוא מתקבל שלילי. אך בגין שכיחות מחלה זו הנושא הופך לקריטי האם יש להשתמש במבחן CA-125 באופן גורף.
באוכלוסייה הכללית, בה שכיחות סרטן השחלות היא רק 0.04%, ההסתברות שלאישה עם תוצאת CA-125 בלתי נורמאלית אך תוצאת אולטרה-סאונד תקינה יש סרטן שחלות, היא רק 2.2%. לכן שימוש נרחב של מבדק CA-125 יגרום לנזק פסיכולוגי ולשימוש-יתר בבדיקות חודרניות, ולאפארוסקופיה. מאידך גיסא, מבדק CA-125 יכול להוות חלופה רגישה באוכלוסיית נשים בסיכון גבוה ושכיחות גבוהה של סרטן השחלות, כמו אלו עם המוטציה בגן BRCA1 ו-BRCA2.
בדיקות מעבדה ומבחנים אחרים, מתווספים ללא הרף לתפריט הרפואי, לעתים על חשבון בדיקות מעבדה ומבדקים שסר חינם. והרופאים, כמו גם אלה העוסקים במחקר רפואי, חייבים לעמוד כל הזמן על המשמר, כדי ללמוד על מבדקים חדשים אלה, להעריך את תרומתם למאמץ האבחוני של מטופליהם, ולעשות בהם שימוש מושכל, לשיפור תוצאות הטיפול הרפואי.
בברכה, פרופ' בן-עמי סלע