物聯傳媒 旗下網站
登錄 注冊
RFID世界網 >  新聞中心  >  物聯網新聞  >  正文

百度人工智能與癌癥醫療結合會有什么想象力?

作者:承哲
來源:搜狐
日期:2015-12-25 11:48:42
摘要:近日,李彥宏宣布個人捐款3000元萬,支持中國的癌癥事業,而在今年烏鎮互聯網大會上李彥宏也提及了大數據醫療。馬不停蹄,12月22日百度方面也正式宣布與協和醫院一起發布了“百度與協和醫學院合作開展癌癥研究”協議,將百度的人工智能技術與協和醫院的食癌數據進行對接,共同推進食癌項目,這也是繼百度與中國交通部、中國疾病預防控制中心合作后的第三次參與到民生工程的建設中。

百度人工智能與癌癥醫療結合會有什么想象力?

  近日,李彥宏宣布個人捐款3000元萬,支持中國的癌癥事業,而在今年烏鎮互聯網大會上李彥宏也提及了大數據醫療。馬不停蹄,12月22日百度方面也正式宣布與協和醫院一起發布了“百度與協和醫學院合作開展癌癥研究”協議,將百度的人工智能技術與協和醫院的食癌數據進行對接,共同推進食癌項目,這也是繼百度與中國交通部、中國疾病預防控制中心合作后的第三次參與到民生工程的建設中。

  一,為何癌癥大數據處于“沉睡”狀態?

  《中國科學報》曾經做過一個采訪,專家們對癌癥大數據總結下來屬于這么一個情況,中國擁有13億的人口,其產生的海量數據有著極大的研發價值,但是困境有以下幾點。

  由于數據的過于龐大,首先面臨的是數據的存儲與計算問題。一個標準的病理圖則接近5GB,僅一個社區醫院累積的數據量就可達數萬億字節甚至數千萬億字節(PB)之多,加之每天患者數目的增加,醫療大數據也有著增長過快的特點。這就導致了有些普通醫院甚至連存儲這些海量數據的能力都沒有。而與此同時,龐大的數據也導致需要極為強大的計算能力,要在短時間內處理上TB的數據,只有是大型IT科技公司或者是國家級計算機科研機構才能做到,醫院方面也只能望洋興嘆。

  其次,醫療大數據的結構缺乏標準化,每家醫院的信息化工作都涉及幾十個廠家,每個廠家的數據、標準、采集、存儲都不一樣。因此,即便是在一家醫院,都會出現很多孤島。

  以上,中國的癌癥大數據處于蜂窩煤的狀態,數據雖大,但是亂,質量差,缺乏對數據利用的能力。醫院的尷尬在于,有著海量的重要病患的大數據資源,但是卻沒有對應處理的工具,處于巧婦難為無米之炊的狀態。

  二,百度將如何激活“醫療大數據”?

  先從存儲空間與運算能力來說,先說存儲空間,雖然百度從未公布過自己的存儲能力,但是從另一個側面,2013年開啟的百度云盤免費2T容量,而當時中國的網民有6億,假如保守估計有1億用戶使用百度的產品,那百度所需要存儲的數據也是一個天文數字。其次是高運算能力,這點百度也是百度強項,根據2014年的數據,百度一天可以掃描高達10PB的數據,而百度也在準備推出Minawa超級計算機,能夠進行每秒7千萬億次的計算,將進入全球前十的超級計算機。

  百度做搜索起家,其大規模分布式內存存儲以及分布式集群計算的能力早已成熟,因此幫助協和醫院進行數據的存儲與處理也自然不成問題。

  其次是要解決數據的標準化問題,大數據醫療最痛苦的事情不在于數據的統計相關性對比,最為痛苦的事情在于數據的無法標準化。以谷歌1.3億美金投資的Flatiron Health公司為例,該公司在做的主要任務不是大數據的挖掘,而是大數據格式的統一化,該公司通過還完善“NLP自然語言處理”的技術,讓計算機“閱讀”文件,并且從中提取數據,并再聘請50人護士團隊手動錄入數據,這在國內也同樣是無法繞過的事情。

  幸運的“NLP”技術是百度建立公司的技術基石,搜索引擎理解用戶的請求、理解文本內容、理解內容的價值高低,等等所有環節都需要用到NLP技術。百度的“NLP”技術,百度在“NLP”將會是將醫療大數據進行標準化的最大福音。

  綜上,百度通過自身優勢與醫院的癌癥大數據結合,將會一點點喚醒原本沉睡的數據,發現地下的金礦。

  三,人工智能與生命科學還能碰撞出什么?

  在12月22日下午召開的北京協和醫學院與百度合作開展癌癥研究發布會上,李彥宏這表示,早在20年前,就對生命科學很感興趣,并差點投身于生命科學領域。而當下的大數據+人工智能+生命科學正在爆發著前所未有的潛力,正在曲線實現李彥宏當初的愿望。

  人工智能與生命科學還能碰撞出什么?我們探討一下可能性。

  1)基因測序:整個生命科學的第一步也是最大的困難之處就是在于基因測序,雖然說“人類基因組計劃”已于2011年宣告結束,但是依然還有1%的基因無法被檢測出結果,需要更為先進的技術作為支撐才能檢測出來。

  而這里所在等待的先進技術,其實就是人工智能。以癌癥基因檢測項目為例,其所做的就是要在大量的基因突變中,找到與某個具體癌密切相關的突變的位置,這其實和百度的搜索技術其實一致,百度能夠通過百億的用戶關鍵詞搜索的點擊中找到用戶最想要的高相關的一系列網頁,將其進行先后排序,而從海量用戶的海量突變基因中找到與食管癌的最大相關的基因,就能最大幾率的找到食管癌發病是哪些關鍵基因導致。

  并且百度尋找的不是單向相關性而是多項的,其要找到哪些基因突變疊加在一起就會增加患食管癌的概率,也就是要在無數的基因中突變中尋找組合的相關性,這對計算的要求其實是指數級的。

  但這卻正是人工智能的強項所在。

  2)基因藥物研發:目前學界有一個共識,當前的藥物都是屬于化合藥物,但是在不久的將來,藥物將不僅僅只是化合物,藥物也可以是人工合成的蛋白質,合成的細胞,甚至某些組織和器官等等。但與此同時也伴隨著更大的風險,因而人們在未來使用這些藥物時需要更為格外的小心謹慎。

  人工智能則可以利用大數據醫療幫助醫生研發,將各個患者的用藥情況統統聯網,建立統一的藥物治療大數據網,通過使用到反饋的信息收集,讓基因藥物研發配比更為可靠,進而加速整個基因藥物研發進程。

  3)量化自我:凱文?凱利在預測未來20年科技的發展趨勢時,第一個提到的就是“量化的自我”。所謂“量化自我”就是通過利用各種可穿戴設備,諸如智能手環、智能血壓儀、智能體脂秤等等設備,將自己一切身體數據諸如心跳記錄、血壓記錄、體重記錄、BMI記錄、等等都記錄在案。

  人工智能通過對這些大數據進行監控,并再輔以病人病歷數據監控,可以為生命科學提供有利的學術研究支持,可以極為有效的加大對癌癥基因判斷的準確性。

  結語:對于醫院來說病患的數據具有極大的科研意義,但是由于自身技術水平有限,也導致了巧婦難為無米之炊,而百度的人工智能技術支持正是雪中送炭,并且百度的大數據技術將在未來給大數據醫療帶來更大的價值,這體現了科技公司高度的社會責任。

  我們看到BAT正在全面進入經濟、娛樂、民生等多項領域,進入方式各有不同,但是在醫療領域,技術一定是關鍵,百度的想象力很大。