專題討論9:人工智慧對醫療的影響

程 序 表

S9-5
醫療文件資訊擷取與理解
Information extraction & understanding of medical documents
陳縕儂
國立台灣大學資訊工程學系

  在醫療診斷的過程中,醫生以自然語言或關鍵片語紀錄病患的症狀及對應之診斷,此病歷資料會因為不同醫生的語言使用方式不同而有所差異。通常需要人力手動標記此診斷紀錄對應之 ICD 診斷代碼。
  隨著自然語言與深度學習技術之進步,現今能透過機器學習人類語言的使用變異,學習擷取自然語句中的重要資訊,並且進一步理解可能對應之診斷代碼,此自動化之流程可以有效下降後方人力之需求。而機器除了預測診斷代碼,同時也提供模型擷取之重要語句,可以協助醫生易於判斷此預測是否合理,讓機器後續的效能能夠改善與提升。
  除了直接對不同 ICD 代碼做預測以外,專家定義的代碼間階層關係也同時經模型學習及考慮,更進一步提升預測之效果。此實驗證明了機器能有效學習人類於醫療領域之語言的使用變異,也驗證了機器學習與專家知識整合之重要性。