大數據在醫院運營管理中的價值探索
作者簡介:
曾春:北京東軟望海科技有限公司首席架構師,負責公司基礎架構、云計算、大數據管理平臺、開發平臺等技術體系的研發,并負責OES產品研發中心及人力資本HCG專項孵化管理工作。清華大學計算機軟件與理論專業博士。曾就職于IBM、百度公司任重要技術崗位。在數據庫、云計算、大數據及人工智能方面擁有豐富的經驗。
———————————————————————————————————————
如今,云計算、大數據、物聯網、人工智能在科技領域的發展方興未艾,并與各行各業不斷融合。在新技術給人們帶來便捷的同時,引發的思考和爭論也隨之而來。大數據時代對個人的數據權益和隱私保護帶來了新的挑戰,特別是個人健康數據,涉及個人敏感信息,如何保護越來越受到重視。
一、大數據技術的發展以及在醫療行業的應用場景
大數據技術經過多年的發展,經歷從SQL(Structured Query Language,結構化查詢語言),到NoSQL(Not Only SQL,泛指非關系型數據庫),再到NewSQL數據庫,其應用場景在不斷得到強化。
傳統SQL數據庫在醫療行業的需求場景仍然很強勁,用于很多醫院信息系統,但越來越無法滿足OLTP(Online Transaction Processing,聯機事務處理)數據快速增長的需要。在業務報表和數據分析等OLAP(Online Analytical Processing,聯機分析處理)場景,一些新型的關系型列式數據庫技術被用來解決大規模歷史數據的復雜查詢分析。
NoSQL數據庫的出現有效解決了系統的可擴展性,但也存在很多不足,比如對SQL的支持不夠,也不支持事務操作。通常NoSQL作為分布式非關系型數據庫使用,用于支持高吞吐、高并發的新興業務場景,比如物聯網應用,以醫療物資為核心的供應鏈生態,實現全要素的協同運營。
NewSQL數據庫是傳統SQL與NoSQL技術結合之下的產物,在為OLTP業務提供像NoSQL那樣的伸縮性同時,提供傳統SQL數據庫那樣的事務ACID(原子性、一致性、隔離性和持久性)保證。通常NewSQL作為分布式關系型數據庫使用,主要針對傳統SQL的部分高性能應用場景,可以滿足醫療行業OLTP數據快速增長的需要。NewSQL技術和NoSQL技術有著各自典型的應用場景,兩者也在不斷演進,在慢慢借鑒和融合。
隨著醫療健康數據的不斷積累,以及大數據技術的深入應用,很多人工智能和深度學習技術被引入來支持數據挖掘和輔助診斷,比如醫學影像診斷分析、心電圖診斷分析等。這些新興技術結合醫生的專業知識,通過經驗模型的訓練,從大量數據中篩查可疑的信息,可以有效輔助醫生做出判斷,大大減輕醫生的工作量。
二、醫療健康大數據的價值
醫療健康大數據是國家重要的基礎戰略資源,醫療健康大數據的發展與醫療信息化緊密相關,一般醫院都部署了醫院信息系統HIS和電子病歷EMR系統等,這些系統的各個模塊中都沉淀了大量的醫療數據,比如診療數據、用藥數據、醫學檢驗結果數據,以及費用數據等。這些數據一般分散在多個業務系統,由不同的供應商實施和運維,難以利用和形成有用的知識和信息。
為了有效利用和挖掘這些分散的數據,醫院一般通過建設多種數據中心,比如醫院臨床數據中心、醫院經濟運營數據中心等。基于這些分散的數據源,通過數據集成平臺推動數據倉庫的建設,然后生成不同主題的數據集市,產生更多的統計指標和分析數據。基于這些數據集市可以研發不同的數據應用,比如運營駕駛艙、財務分析應用,成本分析應用等。醫院管理層可以基于這些數據服務,及時掌握醫院運營的狀況和指標完成情況,為醫療業務的發展和投入做出正確的決策。
隨著局端監管和區域醫療管理等平臺的信息整合,也會帶來數據的快速增長。這些數據不僅可以增加共享和優化就醫秩序,也可以形成從點到面的信息全覆蓋的疾病監測方式,實現全流程和可追溯的管理體系。基于區域醫療信息,醫院還可以與同類指標的行業標桿值橫向比較,發現自身的問題和優化方向,并找出自身在區域醫療行業中所處的位置。
醫療健康大數據的價值還可以體現在很多方面,比如:
1用藥經驗
可以對知名專家的臨床診療數據進行采集,通過對數據的整合和分析,形成一些用藥經驗和關聯規則,針對個體癥狀,調整用藥的比例、類型或成分等,通過參考這些經驗,有效提升普通醫生的診治水平。
2輔助診斷
通過構建醫學影像數據倉庫,可以利用人工智能和深度學習技術,基于醫生的專業知識,訓練診斷模型,從大量醫學影像數據中篩查可疑的影像,減輕醫生的閱片工作量。
3成本管控
對醫院經濟業務活動的風險進行防范和管控,使醫院決策層、管理層、執行層和監督部門之間形成相互制衡、相互促進、相互協調的關系。
4疾病防控
通過整合和共享不同醫院之間的臨床數據信息,可以對某些疾病的演變和慢病的防控進行跟蹤,通過全流程和可追溯的方式進行管理。
三、醫療健康大數據的安全
大數據時代對個人的數據權益和隱私保護帶來了新的挑戰,特別是健康數據,涉及個人敏感信息,數據安全和隱私保護尤為重要。對個人健康數據的保護不足,不僅會損害個人數據權利和隱私權利,也會導致公眾信任危機,阻礙醫療健康大數據的良性發展。
在建設醫療健康大數據的過程中,主要涉及如下安全挑戰:
1內部威脅
醫療行業的內部威脅高于外部威脅。除了比較明顯的安全管理問題,比如弱密碼、數據庫暴露在公網等,這些都比較容易發現和整改。一般醫院都要求進行信息安全等級保護的認證,這些基本的外部威脅都能有效控制。目前比較突出的是內部威脅,受經濟利益驅使或其它原因,內部員工很容易獲得數據的權限和竊取非授權數據。
2基礎平臺
傳統的SQL數據庫,比如Oracle、SQL Server、MySQL等,還有分析型數據庫,比如Greenplum、Vertica等,這些數據庫本身提供細粒度的權限控制和安全審計功能。而NoSQL數據庫,比如基于Hadoop的數據庫系統,就比較缺乏基于角色的身份管理和細粒度訪問控制,以及安全審計功能,存在很大的安全隱患。
3數據采集
由于數據采集的復雜性,很多數據存在被濫用的風險,數據的跟蹤和溯源存在很大的困難。醫院內部一般存在很多第三方的技術供應商,通常系統之間需要建立服務接口,滿足互操作的應用場景,這種醫療數據的傳遞和流動很難保證數據的安全性。
4隱私保護
一般健康數據都涉及個人敏感信息,醫療健康大數據尤其需要注重隱私保護。為了滿足醫療科研項目和非商業的用途,一般都需要對醫療健康數據進行脫敏處理,也就是不能有效標識用戶和還原匿名數據。
四、東軟望海大數據技術和應用的探索
東軟望海在HRP、醫院成本一體化、醫療衛生資源監管等領域保持優勢地位。東軟望海在大數據方向做了很多積極的探索,從傳統的商業智能BI到大數據平臺,應用于醫院的精細化運營、局端監管和成本核算等應用系統。
◆ 大數據平臺
數據集成需要整合多種數據源的醫療健康數據,其中比較關鍵的是標準化,使分散、零亂、標準不統一的操作數據轉換為集成、統一的信息。數據字典標準體系是業務數據進行交換和集成的基礎,可以實現不同業務系統對同一數據理解的一致性,比如會計科目、財務報表、成本報表、資產分類、物資分類、科室分類、人員分類等。這些字典和數據標準都需要遵循國家或者行業發布的政策、制度,并進行統一和規范。
一般數據集成到一個中心數據倉庫里,傳統的數據倉庫都是基于SQL數據庫,通過建立星型模型或者雪花模型,支持歷史數據的查詢和分析。隨著醫療健康數據的不斷積累,很多歷史數據會不斷聚合,只支持粗粒度的查詢場景。
為了滿足對數據精細化的查詢和分析場景,平臺引入了基于Hadoop生態的數據庫技術,數據集成后生成特定格式的數據文件(比如parquet)存儲在HDFS上。分布式查詢引擎基于精心設計的數據分區,并行調度和查詢集群上的數據文件,滿足用戶的復雜查詢請求,如下圖所示:
◆ 大數據應用
1、HIA醫療大數據平臺
HIA(健康信息聯盟)以“分享、創新、發展”為宗旨,將大數據“取之于聯盟,服務于聯盟”。以“數據標準化、服務規范化、應用智能化”為特點的HIA醫療大數據平臺,可以幫助醫院進行高效、精細化運營,共同提升醫療行業的管理水平。基于大數據技術,平臺內置數據標準與數據質量控制機制,完成醫療數據的標化與入庫。數據內容覆蓋醫院運營相關數據應用場景,支持關鍵標桿值/知識庫的平臺測算,支持個性化數據分析報告。基于人工智能技術,實現數據分析的智能化,支持數據分析的自定義,支持行業指數的發布與持續更新。
2、區域經濟運行監管平臺
以醫院財務核算、成本核算數據為基礎,從醫院經營風險、成本管控、運行效率、費用控制等方面全面監管區域醫院運行情況,防止經濟風險發生。從保證醫院可持續發展角度出發,對收入、成本兩個重要方面進行分析,指導合理組織收入,控制成本,提高經濟效益。從項目角度出發對項目的盈虧及成本構成進行分析,指導醫療服務價格調整。從病種角度出發,對病種的盈虧及成本構成進行分析,指導病種定價。醫療服務價格跟蹤與監管依據醫院項目成本核算數據,在價格正式調整前,對醫院整體運行、各科室運營及各類疾病患者影響情況進行測算;醫療服務價格調整后,通過對醫院的收入結構,患者負擔進行實時監測,防患系統性風險發生。
————更多行業專家資訊,可在微信搜索“東軟望海”,別忘加關注哦!————
Hash:82c2a8bd7e35801bd0c35d8a4465261afd3176cd
聲明:此文由 望海康信ViewHigh 分享發布,并不意味本站贊同其觀點,文章內容僅供參考。此文如侵犯到您的合法權益,請聯系我們 kefu@www.51kouyi.org