醫(yī)療影像的處理技術早在模式識別時代就有了,發(fā)展至今已經(jīng)有二十年左右的歷史。影像處理是和醫(yī)療診斷直接相關的技術,國內外從事相關技術研究的高等院校、科研院所和企業(yè)很多。只不過近幾年,隨著數(shù)據(jù)的積累和深度學習算法的應用,圖像識別的準確率有了大幅提升,也被更多人所熟知。
而國內的語音識別技術直到最近兩三年才取得突飛猛進式的發(fā)展,識別準確率從80%多提升到了95%以上,達到了實用化的水準,并逐漸發(fā)展出了面向醫(yī)療等行業(yè)的定制化模型。目前,國內從事語音技術的企業(yè)還相對較少,掌握語音核心技術的公司更是有限。
為何電子病歷語音轉錄備受期待?
電子病歷語音轉錄之所以備受期待,主要有三方面的原因:
一、可以為醫(yī)生節(jié)省手寫病歷的時間。國內醫(yī)生的工作任務通常比較繁重,除了跟病人溝通交流,還要花費大量時間和精力書寫病歷和醫(yī)療文書。利用語音識別技術將醫(yī)生和病人的對話自動轉錄成文本,可以幫助醫(yī)生騰出時間來為更多患者服務,提升工作效率。
二、可以為醫(yī)患糾紛提供材料佐證。醫(yī)患糾紛是醫(yī)療行業(yè)的一大難題,一旦出現(xiàn)醫(yī)患糾紛,醫(yī)院往往處在弱勢地位,因為缺少足夠的資料證明醫(yī)生在診斷和用藥的過程中沒有失誤。醫(yī)院現(xiàn)有的HIMSS系統(tǒng)只能記錄患者的基本信息,簡單描述患者的基本癥狀,以及醫(yī)生用了什么藥。這種記錄的完整性還遠遠不夠。
現(xiàn)在很多保險公司正在大力推進雙錄機制,即錄音、錄像,作為解決投訴糾紛的證明材料。語音錄入病歷不僅是將醫(yī)生和病人的對話轉成文字和結構化的數(shù)據(jù)進行存儲,便于后期查詢和智能化分析;同時也會保留原始的錄音文件,作為處理醫(yī)患糾紛的證明材料。
三、語音轉錄形成的結構化數(shù)據(jù)可以在一定程度上緩解醫(yī)療資源不足、不均的問題。國內的病人看病都喜歡去大醫(yī)院掛專家號,但專家號很難掛,原因在于醫(yī)療資源不足。其實很多非三甲醫(yī)院、地方醫(yī)院的設備并不見得很差,真正缺少的是經(jīng)驗豐富的優(yōu)秀醫(yī)生。
過去醫(yī)療經(jīng)驗的傳承主要是師傅帶徒弟的模式:一個主任醫(yī)師帶幾個學生,傳播的范圍和效率都很有限。假如我們利用結構化的醫(yī)療數(shù)據(jù)搭建一個醫(yī)療大數(shù)據(jù)平臺,讓經(jīng)驗不足的醫(yī)生可以通過它學習專家的診斷經(jīng)驗,培養(yǎng)更多的醫(yī)學人才,就能在一定程度上緩解國內醫(yī)療資源不足和不均衡的問題。我想這才是電子病歷語音轉錄更高層次的意義。
為何國內市場一片空白?
很多醫(yī)生提到,自己看到國外醫(yī)生使用語音錄入病歷時十分羨慕。電子病歷語音轉錄技術在國外確實更為普遍,但這種語音轉錄技術和今天略有不同。
以前Nuance在印度有一個特別大的、面向全球醫(yī)生的人工坐席呼叫中心。申請了這項服務的醫(yī)生只需要隨身攜帶PAD并佩戴耳麥,KUKA機器人示教器維修,和病人交流時語音就能傳到呼叫中心。呼叫中心通過語音識別技術將語音轉錄成文字,機器人維修,并由人工進行校對,醫(yī)生需要時就能直接查看。語音醫(yī)療呼叫中心曾經(jīng)帶來的收入在Nuance的整體收入中的占比甚至超過了50%。
捷通總經(jīng)理武衛(wèi)東認為,國內的電子病歷語音轉錄市場之所以一片空白,除了跟國內語音識別技術起步較晚有關,也跟醫(yī)療體系結構密不可分。
在美國,每個家庭都有自己長期合作的診所和私人醫(yī)生,機器人維修,這些醫(yī)生通常是全科醫(yī)生。病人只要有任何身體上的不適都可以找他,醫(yī)生進行初步診斷后,再將病人轉給相應的專科醫(yī)院。醫(yī)院的病歷數(shù)據(jù)是相對公開的,可以跨醫(yī)院調取,這在中國的醫(yī)療體制下非常困難。另外,美國的商業(yè)醫(yī)保比較發(fā)達,醫(yī)院的數(shù)據(jù)對保險公司是公開的。中國是公費醫(yī)保,每個醫(yī)院都有自己的體系,不同體系之間相互隔離。在中國建立一個Nuance這樣的面向全國醫(yī)院的客服中心幾乎是不可能的。
雖然國內現(xiàn)在也在積極學習國外的醫(yī)療體系結構,積極推動分級診療和醫(yī)聯(lián)體模式,但進展比較緩慢。這一方面是因為國內的醫(yī)療資源非常稀缺;另一方面,醫(yī)院之間的數(shù)據(jù)鏈路也很難打通。
雖然醫(yī)生對語音錄入病歷的需求非常旺盛,但醫(yī)院還處在封閉、半封閉的狀態(tài),沒有形成社會化的體系,項目必須一家醫(yī)院一家醫(yī)院去對接,推進速度非常緩慢。武衛(wèi)東說道。
空白中該如何突圍?
如今國內的智能語音市場可謂是群雄逐鹿,百度,阿里,科大訊飛等都在語音技術上投入巨大,實力雄厚。面對這些重量級的競爭對手,該如何競爭呢?
現(xiàn)在大多數(shù)語音識別公司采用的都是深度學習算法,各家在語音識別基礎算法的差距并不會特別大,在識別普通話和帶方言的普通話,準確率都差不多。而主要的差距在于數(shù)據(jù)的規(guī)模、歸集和行業(yè)化的定制。通常掌握的數(shù)據(jù)規(guī)模越大,加上資金和人力方面的優(yōu)勢,可以做適應性更強的語音識別模型。
醫(yī)生在診療過程中的語言組織和表達都是相當專業(yè)規(guī)范的。醫(yī)生面對的是來自全國各地的病人,所以他們工作中基本使用的是普通話或帶口音的普通話,識別起來相對容易。利用互聯(lián)網(wǎng)上的數(shù)據(jù)初步訓練出模型之后,就可以投入醫(yī)院試用,在實際應用場景中進一步學習和優(yōu)化。
還有哪些問題需要解決?
雖然電子病歷語音轉錄技術確實能給醫(yī)生帶來便利,但目前還處于市場培育階段。醫(yī)院還在邊考察邊適應,只在某些科室進行了示范性的應用,并沒有全面推廣。另外,技術本身也需要進一步優(yōu)化。
醫(yī)生對電子病歷語音轉錄技術仍然有一些不滿的地方:一是改變了他原有的工作習慣,現(xiàn)在醫(yī)生查房都需要攜帶一個PAD,但醫(yī)院的WiFi信號可能并不總是穩(wěn)定的,會給醫(yī)生造成一些不便;二是使用方法略為繁瑣,使用前需要進行設置;三是語音轉錄之后醫(yī)生還要一定時間進行校正修改,文本后處理技術還需要完善。
除了電子病歷語音轉錄,語音技術在醫(yī)院還有很多落地場景。比如很多年前就已經(jīng)在醫(yī)院大規(guī)模應用的語音叫號;再比如智能語音導診,通過語音控制燈光開關,設置醫(yī)療器械參數(shù)等等。
雖然目前語音轉錄病歷還處于市場培育階段,但是我們相信未來發(fā)展會非常迅速,這片市場未來規(guī)模也值得我們關注。