最近在醫學院看到一份醫學生的通訊,裏面有一篇文章在探討甚至鼓吹尿療法,說尿內有所謂的CAD-II,可以治療癌症。在文章裏他們把醫療方法分為正統療法及另類療法,另類療法被解釋為所謂的祖傳秘方或其他基於一般性經驗的療法,而尿療法即被歸納為這所謂的另類療法。看到這篇文章,讓我猛然一驚,我們的醫學教育病了,而且病的這麼的嚴重,這些我們學術界未來的主人翁,居然是如此的認知,那我們的國家社會還有甚麼將來。挽回學術真與善的精神是我們學術中人無可逃避的責任。
實證醫學(Evidence Based Medicine)是目前醫學界奉為評論醫療知識真偽的歸臬,所有的醫療原則與方法均需要有實證為基礎。這個認知完全正確,沒有人能反對或敢反對。可是,什麼是實證?如何去定義實證,或如何去檢驗實證的真實性?證據可以是簡單到某人說的話,或是個完全偏差的觀察結果(只用在少數病例且沒有對照組),也可以是非常嚴謹實驗所得的結果。所以,講證據,那還不簡單,每個人都有,可是誰的證據才對呢?由此可知,實證醫學的精神不在證據的有無而在證據的正確性或可靠性。舉一個例子來說,一個在培養皿內細胞實驗中所觀察的結果,若要實用在人體上恐怕還是十萬分遙遠的事,只基於某化學物質能殺死培養皿內癌症細胞的現象,就推論此化學物質可以用來治癌,這是極端錯誤的外插法。因為雖然此化學物質在培養皿內能殺死癌細胞,若用在人體上,說不定會被其他種種因素影響而無法殺死癌細胞,甚至於此化學物質也有可能具有極大毒性連其他正常細胞一齊死。一種藥物,若要證實為具有療效,除了在細胞實驗以外,還需動物實驗來證實,最最重要的是一定要通過嚴密控制的人體實驗才行。很多藥物在動物實驗宣稱成功,可是就通不過人體實驗。最近在報章雜誌上常常看到類似的報導,「××豆」的化學抽取物可以殺死培養皿內的癌細胞」,於是記者諸公們甚至研究者本人就說「××豆」可能可以防癌或治癌,有時連「可能」二字都省去了,於是就造成坊間搶購××豆的熱潮,頓時烏鴉變鳳凰,糞土變黃金。錢冤枉了也就算了,命沒了那才冤枉呢!有人將之稱為「媒體做秀醫學」,這真是傳神極了,寫報導的人只想嘩眾取寵,語驚四座,讀報導的人不加思考,人云亦云,是非對錯早就被忘的一乾二淨。如果這背後還潛伏著不當利益時,那更危險了。我們的社會若到處充斥著這種媒體做秀醫學或類似的廣告醫學,那真是學術界甚至整個社會的悲哀。
如何讓我們的社會擺脫這種虛妄不實的言論呢?唯有透過教育的力量,來教導我們下一代明辨是非的能力,也就是如何用科學的方法來檢定所謂醫學實證的真實性與可靠性。簡單來說,有人拿了一個研究結果或是一篇論文要來當作實證醫學的證據,我們不能照單全收,得要建立一套正確並客觀的標準來檢驗它。唯有經得起檢驗的證據才算證據。我們以某種新藥物在人體試用研究為例。一個好的研究必須要有嚴謹的設計,客觀的實驗過程以及合理的推論。這個嚴謹的條件可分為五個層面:
第一、病例選擇的標準:
什麼樣疾病的病例適合本研究的條件,此疾病的定義必須要明確,病例的選擇標準(Inclusion criteria 或exclusion criteria) 必須要清楚客觀。若要更嚴謹的話,還得說明到底一共有多少病例符合本研究疾病的定義,而且又有多少病例是不符這個選擇的標準,然後還得說明這些病例又是如何治療的。唯有了解整個病例選擇的過程,才能真正了解病例選擇過程中可能發生的偏差(Bias)。
第二、變數的定義或標準:
一般的研究包含兩種變數:獨立變數與相依變數。在藥物人體實驗研究的獨立變數,包括病例之分類或影響因子的存在,例如有無心臟病、糖尿病或是罹患疾病之嚴重度等等。所謂相依變數亦即是實驗的結果,包括藥效的高低、併發症的有無。這些變數均需明確的定義,例如,心臟病的定義是什麼;血糖多高,維持多久才叫糖尿病;藥效之高低如何測量,測量的方法為何;什麼叫併發症,併發症的定義又是什麼,如何認定或測量。所以,這裏另外又有一個問題:誰來認定或測量呢?不同的人所做出來的結果可能不一樣,這也是在研究方法學內特別要重視個別觀察者間的差異。目前,由無關的第三人(Third party)來做評估是大家都接受的一個方法。
第三、混淆變數(Confounding variables)之控制:
在研究過程,很多可以影響實驗結果的因素就叫混淆因素,例如,病例間之差異,危險因子的有無、或病例合作的能力等等皆是,這些因素的變異可能會造成很大的偏差。所以,目前大家公認前溯性隨機控制比較實驗(Prospective randomized control comparative study)是最嚴謹的研究。所有的混淆因子在事先就以隨機的方法來分類控制,使相比較之兩組均具有相等之變異情況,所以比較的結果才能客觀公平可信。所謂回溯性研究或缺之比較組的實驗,通常發生偏差的機會較高且其可信度會較低,因為這兩種方法均無法做到公平公正的比較,它們共同的缺點是會有病例選擇偏差的問題,而且回溯性研究更會有資料不足的問題。
第四、病例追蹤率與追蹤的時間:
如果病例追蹤率太低,流失的病例太多,這些流失的病例可能造成偏差。因為這些流失的病例可能都是治療成果不好的病例,所以沒有回來追蹤,這都會影響實驗的結果。另一方面,如果追蹤的時間不夠長,有些併發症是要較長的時間才會發生,或有些療效會隨時間消失,追蹤的時間不夠長會造成結論的偏差。目前一般公認追蹤率應至少百分之八十以上才行,追蹤時間隨著不同的實驗對象而異。
第五、統計方法:
統計方法的選擇與結果的判讀非常的重要,錯誤的統計方法會導至錯誤的實驗結果。舉例來說,如果一個應該用無母數分析方法分析的資料,硬是用有母數的方法,可能會錯過了可能有意義不同的發現;反之若用無母數的方法去分析應用有母數方法分析的資料,可能會錯失一些有用的訊息。再例如,用重復的雙重比較方法去進行多重比較,可能會產生有意義不同之機率的偏高。統計考驗力分析(Power analysis)也很重要,如果考驗力不夠的話,偽陰性(False negative)的機會會增加。總而言之,一個實驗數據之統計分析最好皆能有專門的統計學者來幫忙。
第六、結果的推論:
所有的文章都有一個結果,如何由此結果來下結論是文章的精神所在。常言道十分證據說三分話,在科學論文內雖然不需要如此誇張,但三分證據決對不能說七分話,所有的結論必須有文章數據的支持。例如,若某種手術用來治療某種疾病得到不錯的結果,只能說這是一個可以接受的手術方法,決不能說這最好的方法,除非有和所有的方法做比較。另外一點就是關連(Association)關係和因果(Cause-effect)關係,如果回溯性研究證實喝葡萄酒的人,罹患心臟病的機率低,只能說兩者有關連,而不能說葡萄酒可以降低心臟病的機率,除非有一個很好的前溯隨機比較實驗。還有一點就是要避免不當的外插,實驗室(培養皿或動物實驗)的結果,決對不能外插到人體身上,除非有最嚴謹的人體實驗來證實相同的結果。
以上簡單提出幾個檢驗實驗證據可靠性的根據。一個社會科學化的程度決定這個社會向上提升的能力,若所有的人民皆有科學方法的觀念與素養,則所有反科學、非科學的作法均會被摒棄。一些似是而非、指驢為馬的觀念或作法就不可能得逞。如本文開頭所提,所謂的另類療法是這種以假亂真的代表,其實沒有所謂正統或另類的講法,療法只有一種,就是科學療法,科學也只有一種,就是符合嚴謹實驗方法所做出來的研究成果。我們希望將來我們的醫學教育能夠貫徹科學方法的教育,教導學生如何做嚴謹正確的研究,也希望能教育民眾明辨是非對錯的能力。如此我們的學術界一定很快的能躋身世界一流的境界,我們國家的競爭力一定可以很快的提升,而且提升的很高。