Thomas Insel 辭去任職13年的美國國家精神衛生研究院(NIMH)院長,加入Google的Alphabet。而蘋果的 ResearchKit 就要成為 Apple Watch 的基本配置,而穿載式配備「即時地」分析受試者的面部表情和聲音特徵;分析說話內容、語調和速度;分析情緒量表和心理測驗的結果;接上感受器後分析睡眠品質、心率變異和腦波…。研究數據的質和量都要改變了,未來在Nature/Science發表精神疾病和健康研究的機構,很快就變成是Microsoft、Apple和Google。
Thomas Insel 離開 NIMH 加入 Alphabet。
不久之前,Thomas Insel 辭去任職13年的美國國家精神衛生研究院(NIMH)院長,加入Google的Alphabet,他認為,“In the future, when we think of the private sector and health research, we may be thinking of Apple and IBM more than Lilly and Pfizer.”
Thomas Insel 是令我崇敬的一位精神醫學學者,他擔任美國國家精神衛生研究院(NIMH)院長時,公開表示不支持美國精神醫學會的DSM-5,同時推動一個新的研究取向準則─Research Domain Criteria (RDoC),來做為NIMH贊助研究計畫之重點,期待做為未來新分類系統的基礎。
我在以色列和英國都聽過他演講,他的演講條理分明,語調溫和,卻有巨大的感染力;他在 NIMH 成功地年年增加精神疾病在 NIH 中的資源分配,在源頭發拓精神醫學研究的資源。他在 NIMH 已經做得很好了,他的但他希望做的更好。"I wouldn’t be making the move unless I thought there was a chance to have a greater impact from the private sector." 在他的TED演講中,可以看出他對精神疾病研究上的瓶頸有深入見解。有趣的是最後引用的是比爾‧蓋茲的話:「我們總是高估未來兩年將發生的變化,低估未來十年將發生的變化」,似乎是他辭去公職加入Google的徵兆。
Apple 的 ResearchKit
複雜性症病的謎題需要大數據來破解,美國食品藥品監督管理局(FDA)推出了名為「認證前軟體試驗」(Pre-Cert for Software Pilot)計畫,並邀請蘋果(Apple)和運動手環業者Fitbit等9家大廠共襄盛舉,以加速數位健康科技之發展。幾年前蘋果公司就收購「應用人工智慧技術來分析情緒表情」的Emotient公司,研發AI技術來分析面部表情、判斷人們的情緒,主要幫助廣告商評估客戶對其廣告的反應,在不久的未來,蘋果的 ResearchKit 就成為 Apple Watch 的基本配置,而穿載式配備「即時地」分析受試者的面部表情和聲音特徵;分析說話內容、語調和速度;分析情緒量表和心理測驗的結果;接上感受器後分析睡眠品質、心率變異和腦波…。研究數據的質和量都要改變了,未來在Nature/Science發表精神疾病和健康研究的機構,很快就變成是Microsoft、Apple和Google。
http://www.apple.com/researchkit/
據Bloomberg報導,FDA在2017年9月26日宣布將選擇9家科技大廠加入試驗計畫,以繞過拖延健康軟體和產品上市的層層法規。獲選的科技大廠除了包括蘋果和Fitbit之外,三星電子(Samsung Electronics)、Verily Life Sciences、嬌生(Johnson & Johnson)、羅氏大藥廠(Roche Holding AG)、Pear Therapeutics Inc、Phosphorus Inc和Tidepool等生技業者也上榜。
引領潮流需要的是劃時代的見解和理論,而且是不同領域的人才爭奪戰,未來的精神醫學大師,很可能就是熟悉電腦運算的AI高手。
引領潮流需要的是劃時代的見解和理論(更新 2017/10/16)
http://cobolsu.blogspot.tw/2015/10/blog-post_16.html
蘋果等9家業者獲FDA入選新試驗計畫,加速數位健康技術的發展 (法新社 楊步偉 2017-09-30)
http://www.digitimes.com.tw/iot/article.asp?cat=158&ct=o&id=0000513871_AZE94QFV6AMX5J2ZPHRR9
http://buzzorange.com/techorange/2015/09/24/alphabet-psychology/
Why America’s Top Mental Health Researcher Joined Alphabet
http://www.technologyreview.com/news/541446/why-americas-top-mental-health-researcher-joined-alphabet/
US mental health agency director hired by Alphabet
http://www.theverge.com/2015/9/15/9330249/google-alphabet-thomas-insel-hired-life-sciences-nimh
Google’s Medical Moonshots Take Aim at Mental Health
http://recode.net/2015/09/15/googles-medical-moonshots-take-aim-at-mental-health/
Apple smart strap patent hints at new direction in wearable tech
http://www.geeksnack.com/2015/12/05/apple-smart-strap-patent-hints-at-new-direction-in-wearable-tech/
http://www.technmau.com/apple-smart-strap-patent-hints-at-new-direction-in-wearable-tech-368679
Google AI 翻譯新突破!保留原聲同步語音翻譯
ReplyDelete2019/05/16 Anny Google AI 、 翻譯蒟蒻
https://www.inside.com.tw/article/16390-google-ai-translatotron-end-to-end
評論
上週在 I / O 開發者大會上,Google 分享機器學習透過神經網路和語意理解模型如何縮短智慧型手機使用流程,像是 Google 智慧助理的速度提高 10 倍、Google Lens 的即時翻譯,可以透過 AI 鏡頭翻譯 100 多種語言,更在今日於官方部落格上發表了突破性的保留原聲同步語音翻譯。
過去十年間蓬勃發展的語音翻譯系統提高跨國交流,各家廠商相繼推出翻譯棒、翻譯蒟蒻,一般來說,機器翻譯需要經過三個步驟才能完成,首先,要透過語音辨識將語音轉化成文字;再者,將文字翻譯成目標語言文字;最後,用目標語言文字產生目標語言語音,才能完成即時語音翻譯流程。這項技術為許多商業語音翻譯產品提供支援。
為了提高翻譯速度與正確率,Google 提出實驗性新系統「Translatotron」,讓語音到語音之間能不依賴於中間文字轉譯,直接完成翻譯。
根據 Google 技術說明,為了使「Translatotron」能夠進行端點到端點的翻譯,研究員使用 seq2seq 模型和頻譜圖作為輸入數據的訓練。藉由麥克風編碼器搜集說話者聲音,透過多任務學習預測音源或目標說話者使用的單字。
「Translatotron」系統提供比傳統的語音翻譯系統更多優勢,像是:更快的推理速度,避免了辨識和翻譯之間的錯誤,翻譯後要保留原始說話者的聲音也變得更簡單,甚至也會處理不需要翻譯的單字(例如,名字和專有名詞)。
image1
「Translatotron」翻譯系統架構
從測量機器翻譯品質的 BLEU 分數發現「Translatotron」的分數雖然低於傳統的語音翻譯系統,但「Translatotron」 確實達到整體更精準的翻譯。
研究員表示,Translatotron 是首組能保留原說話者的聲音,將語言從語音直接翻譯成另一種語音的點到點模型。希望將此實驗系統作為未來點到點語音轉語音翻譯系統研究的起點。
讓谷歌折戟的 AI 流行病預測,在今天如何被創業公司攻佔?
ReplyDeleteLogo硅谷洞察 · 2020年2月6日 12:06
https://www.chainnews.com/zh-hant/articles/998525765905.htm
預測未知,一直是人類十分嚮往的能力。遠不說國人熟悉的周易八卦、唐代道士編寫的《推背圖》,還有西方人熟知的占星術、中世紀流行起來的塔羅牌,近的比如說當年根據 “2012 世界末日”這一瑪雅預言影響下出現的全民狂熱和商業狂歡,依然讓我們記憶猶新。
現在“不問蒼生問鬼神”的時代已經過去,我們對物理世界及社會經濟的確定性的、經驗性的甚至概率性的預測都已輕車熟路。但比如說像“蝴蝶效應”描述的高度複雜的、超多變量以及超大數據量的預測,人類還是束手無策麼?
答案並不是。
近日,我國武漢新型冠狀病毒疫情的爆發引起世界衛生組織和全球多地衛生機構的密切關注。其中,《連線》雜誌報道了“一家加拿大公司 BlueDot 通過 AI 監測平臺率先預測和發佈武漢出現傳染疫情”的新聞,得到國內媒體的廣泛關注。這似乎是我們在“預測未來”這件事上最想看到的成果——藉助大數據沉澱基礎和 AI 的推斷,人類似乎正能夠揣摩“天意”,揭示出原本深藏於混沌之中的因果規律,從而在天災降臨前試圖挽救世界。
今天我們就從傳染病預測出發,看看 AI 是如何一步步走向“神機妙算”的。
谷歌 GFT 頻喊“狼來了”:
流感大數據的狂想曲
用 AI 預測傳染病顯然不是 Bluedot 的專利,其實早在 2008 年,今天的 AI“強手”谷歌,就曾進行過一次不太成功的嘗試。
讓谷歌折戟的 AI 流行病預測,在今天如何被創業公司攻佔?
2008 年穀歌推出一個預測流感流行趨勢的系統——Google Flu Trends (谷歌流感趨勢,以下簡稱 GFT)。GFT 一戰成名是在 2009 年美國 H1N1 爆發的幾周前,谷歌工程師在《Nature》雜誌上發表了一篇論文,通過谷歌累積的海量搜索數據,成功預測 H1N1 在全美範圍的傳播。就流感的趨勢和地區分析中,谷歌用幾十億條檢索記錄,處理了 4.5 億個不同的數字模型,構造出一個流感預測指數,其結果與美國疾病控制和預防中心(CDC)官方數據的相關性高達 97%,但要比 CDC 提前了整整 2 周。在疫情面前,時間就是生命,速度就是財富,如果 GFT 能一直保持這種“預知”能力,顯然可以爲整個社會提前控制傳染病疫情贏得先機。
然而,預言神話沒有持續多久。2014 年,GFT 又再次受到媒體關注,但這一次卻是因爲它糟糕的表現。研究人員 2014 年又在《Science》雜誌發佈 “谷歌流感的寓言:大數據分析的陷阱” 一文,指出在 2009 年,GFT 沒有能預測到非季節性流感 A-H1N1。從 2011 年 8 月到 2013 年 8 月的 108 周裏,GFT 有 100 周高過了 CDC 報告的流感發病率。高估了多少呢?在 2011-2012 季,GFT 預測的發病率是 CDC 報告值的 1.5 倍多;而到 2012-2013 季,GFT 預測流感發病率已是 CDC 報告值的 2 倍多。
讓谷歌折戟的 AI 流行病預測,在今天如何被創業公司攻佔?
(圖表來自 The Parable of Google Flu: Traps in Big Data Analysis | Science,2014)
儘管 GFT 在 2013 年調整了算法,並回應稱出現偏差的罪魁禍首是媒體對 GFT 的大幅報道導致人們的搜索行爲發生了變化 ,GFT 預測的 2013-2014 季的流感發病率,仍然高於 CDC 報告值 1.3 倍。並且研究人員前面發現的系統性誤差仍然存在,也就是“狼來了”的錯誤仍然在犯。
到底 GFT 遺漏了哪些因素,讓這個預測系統陷入窘境?
根據研究人員分析,GFT 的大數據分析出現如此大的系統性誤差,其收集特徵和評估方法可能存在以下問題:
一、大數據傲慢(Big Data Hubris)
所謂“大數據傲慢”,就是谷歌工程師給出的前提假設就是,通過用戶搜索關鍵詞得到的大數據包含的即是流感疾病的全數據收集,可以完全取代傳統數據收集(採樣統計),而不是其補充。也就是 GFT 認爲“採集到的用戶搜索信息”數據與 “某流感疫情涉及的人羣”這個總體完全相關。這一 “自大”的前提假設忽視了數據量巨大並不代表數據的全面和準確,因而出現在 2009 年成功預測的數據庫樣本不能涵蓋在之後幾年出現的新的數據特徵。也是因爲這份“自負”,GFT 也似乎沒有考慮引入專業的健康醫療數據以及專家經驗,同時也並未對用戶搜索數據進行“清洗”和“去噪”,從而導致此後流行病發病率估值過高但又無力解決的問題。
二、搜索引擎演化
同時搜索引擎的模式也並非一成不變的,谷歌在 2011 年之後推出“推薦相關搜索詞”,也就是我們今天很熟悉的搜索關聯詞模式。
比如針對流感搜索詞,給出相關尋求流感治療的 list,2012 年後還提供相關診斷術語的推薦。研究人員分析,這些調整有可能人爲推高了一些搜索,並導致谷歌對流行發病率的高估。舉例來說,當用戶搜索“喉嚨痛”,谷歌會在推薦關鍵詞給出“喉嚨痛和發燒”、“如何治療喉嚨痛”等推薦,這時用戶可能會出於好奇等原因進行點擊,造成用戶使用的關鍵詞並非用戶本意的現象,從而影響 GFT 蒐集數據的準確性。
讓谷歌折戟的 AI 流行病預測,在今天如何被創業公司攻佔?
而用戶的搜索行爲反過來也會影響 GFT 的預測結果,比如媒體對於流感流行的報道會增加與流感相關的詞彙的搜索次數,進而影響 GFT 的預測。這就像量子力學家海森堡指出的,在量子力學中存在的“測不準原理”說明的一樣,“測量即干涉”,那麼,在充斥媒體報道和用戶主觀信息的搜索引擎的喧囂世界裏,也同樣存在“預測即干涉”悖論。搜索引擎用戶的行爲並不完全是自發產生,媒體報道、社交媒體熱點、搜索引擎推薦甚至大數據推薦都在影響用戶心智,造成用戶特定搜索數據的集中爆發。
爲什麼 GFT 的預測總是偏高?根據這一理論,我們可以知道,一旦 GFT 發佈的流行病預測指數升高,立刻會引發媒體報道,從而導致更多相關信息搜索,從而又強化 GFT 的疫情判斷,無論如何調整算法,也改變不了“測不準”的結果。
三、相關而非因果
研究人員指出,GFT 的根源問題在於,谷歌工程師並不清楚搜索關鍵詞和流感傳播之間到底有什麼因果聯繫,而只是關注數據之間的——統計學相關性特徵。過度推崇“相關”而忽略“因果”就會導致數據失準的情況。比如,以“流感”爲例,如果一段時間該詞搜索量暴漲,可能是因爲推出一部《流感》的電影或歌曲,並不一定意味着流感真的在爆發。
一直以來,儘管外界一直希望谷歌能夠公開 GFT 的算法,谷歌並沒有選擇公開。這讓很多研究人員質疑這些數據是否可以重複再現或者存在更多商業上的考慮。他們希望應該將搜索大數據和傳統的數據統計(小數據)結合起來,創建對人類行爲更深入、準確的研究。
顯然,谷歌並沒有重視這一意見。最終在 2015 年 GFT 正式下線。但其仍在繼續收集相關用戶的搜索數據,僅提供給美國疾控中心以及一些研究機構使用。
爲什麼 BlueDot 率先成功預測:
AI 算法與人工分析的協奏曲
衆所周知,谷歌在當時已經在佈局人工智能,2014 年收購 DeepMind,但依然保持它的獨立運營。同時,谷歌也沒有 GFT 再投入更多關注,因此也並未考慮將 AI 加入到 GFT 的算法模型當中,而是選擇了讓 GFT 走向“安樂死”。
幾乎在同一時期,今天我們所見到的 BlueDot 誕生。
BlueDot 是由傳染病專家卡姆蘭·克汗(Kamran Khan)建立流行病自動監測系統,通過每天分析 65 種語言的約 10 萬篇文章,來跟蹤 100 多種傳染病爆發情況。他們試圖用這些定向數據收集來獲知潛在流行傳染病爆發和擴散的線索。BlueDot 一直使用自然語言處理(NLP)和機器學習(ML)來訓練該“疾病自動監測平臺”,這樣不僅可以識別和排除數據中的無關“噪音”,比如,系統識別這是蒙古炭疽病的爆發,還僅僅是 1981 年成立的重金屬樂隊“炭疽”的重聚。又比如 GFT 僅僅將“流感”相關搜索的用戶理解爲可能的流感病患者,顯然出現過多不相關用戶而造成流行病準確率的高估。這也是 BlueDot 區別於 GFT 在對關鍵數據進行甄別的優勢之處。
就像在這次在新型冠狀病毒疫情的預測中, 卡姆蘭表示,BlueDot 通過搜索外語新聞報道,動植物疾病網絡和官方公告來找到疫情信息源頭。但該平臺算法不使用社交媒體的發佈內容,因爲這些數據太過雜亂容易出現更多“噪音”。
讓谷歌折戟的 AI 流行病預測,在今天如何被創業公司攻佔 (下)?
ReplyDeleteLogo硅谷洞察 · 2020年2月6日 12:06
https://www.chainnews.com/zh-hant/articles/998525765905.htm
讓谷歌折戟的 AI 流行病預測,在今天如何被創業公司攻佔?
關於病毒爆發後的傳播路徑預測,BlueDot 更傾向於使用訪問全球機票數據,從而更好發現被感染的居民的動向和行動時間。在 1 月初的時候,BlueDot 也成功預測了新型冠狀病毒從武漢爆發後,幾天之內從武漢擴散至北京、曼谷、漢城及臺北。
新冠病毒爆發並非是 BlueDot 的第一次成功。在 2016 年,通過對巴西寨卡病毒的傳播路徑建立 AI 模型的分析,BlueDot 成功地提前六個月預測在美國佛羅里達州出現寨卡病毒。這意味着 BlueDot 的 AI 監測能力甚至可以做到預測流行病的地域蔓延軌跡。
從失敗到成功,BlueDot 和谷歌 GFT 之間究竟存有哪些差異?
一、預測技術差異
之前主流的預測分析方法採取的是數據挖掘的一系列技術,其中經常用到的數理統計中的“迴歸”方法,包括多元線性迴歸、多項式迴歸、多因 Logistic 迴歸等方法,其本質是一種曲線的擬合,就是不同模型的“條件均值”預測。這也正是 GFT 所採用的預測算法的技術原理。
在機器學習之前,多元迴歸分析提供了一種處理多樣條件的有效方法,可以嘗試找到一個預測數據失誤最小化且“擬合優度”最大化的結果。但迴歸分析對於歷史數據的無偏差預測的渴求,並不能保證未來預測數據的準確度,這就會造成所謂的“過度擬合”。
據北大國研院教授沈豔在《大數據分析的光榮與陷阱——從谷歌流感趨勢談起》一文中分析,谷歌 GFT 確實存在“過度擬合”的問題。也就是在 2009 年 GFT 可以觀察到 2007-2008 年間的全部 CDC 數據,採用的訓練數據和檢驗數據尋找最佳模型的方法所參照的標準就是——不惜代價高度擬合 CDC 數據。所以,在 2014 年的《Science》論文中指出,會出現 GFT 在預測 2007-2008 年流感流行率時,存在丟掉一些看似古怪的搜索詞,而用另外的 5000 萬搜索詞去擬合 1152 個數據點的情況。2009 年之後,GFT 要預測的數據就將面臨更多未知變量的存在,包括它自身的預測也參與到了這個數據反饋當中。無論 GFT 如何調整,它仍然要面對過度擬合問題,使得系統整體誤差無法避免。
BlueDot 採取了另外一項策略,即醫療、衛生專業知識和人工智能、大數據分析技術結合的方式,去跟蹤並預測流行傳染病在全球分佈、蔓延的趨勢,並給出最佳解決方案。
讓谷歌折戟的 AI 流行病預測,在今天如何被創業公司攻佔?
BlueDot 主要採用自然語言處理和機器學習來提升該監測引擎的效用。隨着近幾年算力的提升以及機器學習,從根本上徹底改變了統計學預測的方法。主要是深度學習(神經網絡)的應用,採用了“反向傳播”的方法,可以從數據中不斷訓練、反饋、學習,獲取“知識”,經過系統的自我學習,預測模型會得到不斷優化,預測準確性也在隨着學習而改進。而模型訓練前的歷史數據輸入則變得尤爲關鍵。足夠豐富的帶特徵數據是預測模型得以訓練的基礎。經過清洗的優質數據和提取恰當標註的特徵成爲預測能否成功的重中之重。
二、預測模式差異
與 GFT 完全將預測過程交給大數據算法的結果的方式不同,BlueDot 並沒有完全把預測交給 AI 監測系統。BlueDot 是在數據篩選完畢後,會交給人工分析。這也正是 GFT 的大數據分析的“相關性”思維與 BlueDot 的“專家經驗型”預測模式的不同。AI 所分析的大數據是選取特定網站(醫療衛生、健康疾病新聞類)和平臺(航空機票等)的信息。而 AI 所給出的預警信息也需要相關流行病學家的再次分析才能進行確認是否正常,從而評估這些疫情信息能否第一時間向社會公佈。
當然,就目前這些案例還不能說明 BlueDot 在預測流行病方面已經完全取得成功。首先,AI 訓練模型是否也會存在一些偏見,比如爲避免漏報,是否會過分誇大流行病的嚴重程度,因而再次出現“狼來了”的問題?其次,監測模型所評估的數據是否有效,比如 BlueDot 謹慎使用社交媒體的數據來避免過多的“噪音”?
讓谷歌折戟的 AI 流行病預測,在今天如何被創業公司攻佔?
幸而 BlueDot 作爲一家專業的健康服務平臺,他們會比 GFT 更關注監測結果的準確性。畢竟,專業的流行病專家是這些預測報告的最終發佈人,其預測的準確度直接會影響其平臺信譽和商業價值。這也意味着,BlueDot 還需要面臨如何平衡商業化盈利與公共責任、信息開放等方面的一些考驗。
AI 預測流行病爆發,僅僅是序曲…
“發出第一條武漢冠狀病毒警告的是人工智能?”媒體的這一標題確實讓很多人驚訝。在全球一體化的當下,任何一地流行疾病的爆發都有可能短時間內傳遍全球任何一個角落,發現時間和預警通報效率就成爲預防流行疾病的關鍵。如果 AI 能夠成爲更好的流行病預警機制,那不失爲世界衛生組織(WHO)以及各國的衛生健康部門進行流行病預防機制的一個辦法。
那這又要涉及到這些機構組織如何採信 AI 提供的流行病預報結果的問題。未來,流行病 AI 預測平臺還必須提供流行病傳染風險等級,以及疾病傳播可能造成的經濟、政治風險的等級的評估,來幫助相關部門做出更穩妥的決策。而這一切,仍然需要時間。這些組織機構在建立快速反應的流行病預防機制中,也應當把這一 AI 監測系統提上日程了。
可以說,此次 AI 對流行病爆發提前成功地預測,是人類應對這場全球疫情危機的一抹亮色。希望這場人工智能參與的疫情防控的戰役只是這場持久戰的序曲,未來應該有更多可能。比如,主要傳染病病原體的 AI 識別應用;基於主要傳染病疫區和傳染病的季節性流行數據建立傳染病 AI 預警機制;AI 協助傳染病爆發後的醫療物資的優化調配等。這些讓我們拭目以待。