承啟生物基於FANSe演算法的基因測序分析雲平臺在AWS上執行成功
本文已影響1.72W人
本文已影響1.72W人
近日,承啟生物攜手亞馬遜雲服務(AWS),在AWS上成功部署了基於FANSe演算法的全自主基因測序分析雲平臺,並免費向全世界開放使用。承啟生物將依託AWS構建的雲端計算加速系統,充分發揮FANSe演算法準確、便捷快速、可擴充套件性強等效能優勢,為全世界的基因測序企業和科研機構做好服務。FANSe演算法在AWS平臺的執行也標誌著中國自主研發的準確組學技術解決方案走出國門走向世界,為醫療的發展貢獻力量。
速度慢、算不準 傳統演算法短板不容忽視
隨著數字化時代的全面到來,越來越多的企業開始將應用向雲端遷移,而且從外圍輔助型應用,逐步深入到生產和決策等核心業務系統,而AWS作為全球大的雲服務商,為全球數百萬企業提供了安全性高、擴充套件性強、可靠性高的雲基礎設施,同時,還提供了來自全球資料中心的超200種功能服務,搭建了極具活力的生態系統,其較高的整體網路質量,低延遲、低資料包丟失,應用程式靈活度高等特點滿足了公共事業政府部門、傳統企業、老牌網際網路企業、創業科技公司等不同機構企業的多元化需求。由於雲端計算彈性好、頻寬大、算力高、按需付費的特點,似乎十分適合基因測序分析的場景,在AWS平臺上,此前也確實有部分大規模測序分析演算法執行,比如一些基於BWT的演算法,然而卻少有在醫學和科研中的實際應用,因為應用體驗其實算不得好,主要集中在速度慢、算不準兩個問題上。
當前主流的二代基因測序是將DNA或RNA隨機打斷成無數個小片段進行並行測序,資料量極大,一個人全基因組測序資料集動輒高達300GB以上,採用通用壓縮演算法可將其壓縮至1/4,上傳仍然需要幾個小時,傳完還得解壓。隨後,需要進行序列過濾、序列比對、統計檢驗、資料庫匹配等大量計算才能得出有意義的檢測結果,傳統演算法運算效能不高,例如基因組突變搜尋常需要幾十個小時才能跑完整個流程。為了提升演算法的速度,國內有云計算服務商部署了FPGA硬體加速的基因測序分析系統,但此類分析系統成本高昂、應用單一,難以適應日新月異的應用需求。儘管如此,其單任務處理速度耗時依然較長,例如分析完成一個人全基因組測序資料集(不計網路傳輸)仍需接近2個小時,這種速度顯然無法適應醫學時代每天海量樣品的分析需求。此外,傳統測序分析演算法引數複雜,如若沒有相應的專業知識和經驗試錯,不易設定最 優化的引數,從而直接影響檢出率和準確率。因此,企業寧願自行購買維護昂貴的伺服器叢集、花大價錢僱傭生信分析員在本地進行分析,也極少願意在實際業務中使用雲平臺。
FANSe在AWS公有云平臺上線 為基因測序行業降本增效
FANSe演算法由承啟生物全自主研發,歷經多次更新迭代,如今已發展到第四代,在基因組突變搜尋、轉錄組定量等常見應用中,其準確度和穩健性顯著超越傳統演算法,是迄今為止穩健性和準確性高的比對演算法。在執行速度上,其曾創下並至今保持了單機5分鐘分析完一個30X人全基因組測序資料集的世界紀錄。承啟還自主開發了專用於FANSe的壓縮演算法,能將測序資料壓縮至較高1/20進行傳輸,成倍降低了網路傳輸耗時,且無需解壓即可被FANSe處理。承啟生物自主搭建的基於FANSe演算法的私有云平臺表現出了優異的效能,使用者不必購買伺服器,也不必掌握艱深的生物資訊學知識,點點滑鼠即可完成測序分析,得到穩健而準確的結果。但在私有云上由於頻寬的限制,隨著使用承啟雲分析的客戶增多,就會出現資料“扎堆”傳不上,頻寬被“擠爆”的現象,這時,即使是FANSe這類快速準確的演算法也失去了用武之地。
如今,基於FANSe演算法的基因測序分析雲平臺“搬”到了AWS公有云平臺上,首先解決的就是網路頻寬問題。公有云分散式的網路總頻寬極大,可以承載很多使用者海量資料的同時上傳,這對FANSe演算法來說無疑是“如虎添翼”,其極為的優勢在公有云彈性大的特點下得以充分展現:單任務完成速度快,小規模的應用上傳完畢稍等片刻即可得到結果,大型應用如全基因組測序分析也只是需要呼叫更多的計算核心而已。且FANSe完全不需要任何FPGA、GPU等硬體加速,僅靠CPU運算就可實現如此高的速度,通用性較好,雲服務商也無需專門配置專用硬體,在現有硬體上就可以良好執行,易於不斷升級來適應層出不窮的新應用。
其次,基於FANSe演算法的基因測序分析雲平臺在AWS上的成功執行,可以讓來自全球的基因測序企業和科研機構在滿足各國敏感資料不出境的法律法規要求下享有準確的分析服務,此前,由於涉及人類遺傳資源,許多國家和地區政府立法規定基因測序資料和樣本不允許出境,這也就使得很多境外企業和科研機構不能應用FANSe雲平臺進行基因測序資料分析。而由於AWS平臺在各國都設有資料中心,完美地符合法律法規要求,就可以讓全世界都獲得基於FANSe演算法的基因測序分析服務,從而推動全球基因測序、醫學行業的快速發展。
於企業而言,FANSe在AWS的成功執行可以為其實現降本增效,而對於承啟生物而言,在如今中美貿易戰、科技戰愈演愈烈的國際大背景下,純國產自主研發的技術能獲得全球大雲服務商的高度認可並全球部署,是中美基因測序行業逆向技術溢位效應的一個良好開端,未來,承啟生物將繼續深耕組學技術領域,以更多的國產創新技術助推行業發展,在世界舞臺上發出更多的中國聲音,賦能“醫學更準確”。
深圳承啟生物科技有限公司簡介
承啟生物是基於自主核心技術“多組學+資訊學”提供醫學服務、IVD及治療方案的綜合性醫學平臺,致力於用生物醫學前沿科技為人們提供醫療及健康管理解決方案。旗下有四家國家高新技術企業以及一家持牌臨檢中心。
承啟生物擁有完全自主研發並獲得國際高度認可的超高精度基因測序資料分析FANSe演算法。該FANSe演算法於2020年創造了演算法準確度和速度的世界紀錄,被作為國際人類蛋白質組計劃核心支柱的推薦演算法。承啟生物還建立了國內第 一個全自主基因檢測流程,在基因組、轉錄組、翻譯組、蛋白質組、代謝組全組學層次均有準確的自主技術,該流程被作為國家醫學生命組學質量控制標準的藍本。(文章來源:齊魯線上網)
穀雨氨基酸洗面奶成分 穀雨氨基酸洗面奶成分分析
李準基全慧彬確認已分手 迴應:因繁忙的行程
世界上最古老機器,安蒂基西拉計算機(預測日食/青銅裝置)
鄭中基毀了蔡卓妍原因何在 鄭中基蔡卓妍相愛結婚瞭解分手
雲舟生物獲4.1億元C輪投資,加速全球生命科學和基因藥物研發程序
講述李兆基先生成功之道 揭祕李兆基為什麼不傳位給長子
艾滋病治癒最新訊息:基因編輯清除HIV成功
商朝的摘星臺在哪裡?現名摘星臺,只剩樓基(位於淇縣)
又一里程碑 博騰生物CDMO產業化基地正式啟動
燕雲臺原著中各人物大結局:燕雲臺人物關係圖及結局解析
十二星座的幹物女基因排行榜 白羊座居然排行第一
海豚的祖先是什麼動物?巴基獸/生活在陸地上(外形似狗)
海賊王漫畫886情報分析貝基實力多強 海賊王887情報預測介紹
基督教的信仰是什麼:上帝耶穌基督的救恩(與神同行)
嚴整腫瘤基因檢測背後的灰色江湖,廈門政府出臺重磅政策
一口唾液能檢測孩子天賦基因?檢測費用不菲 專家:十分荒謬
科學家:自閉症或因繼承父親基因突變 非承自母親
飛機上使用電腦手機平板條件已基本成熟 網友:終於不用睡覺了
成功把妹案例分析
穀雨氨基酸洗面奶成分 穀雨氨基酸洗面奶成分分析
味之素(中國)有限公司在上海成立生物製藥培養基業務客戶中心
為什麼說章魚的基因不屬於地球 章魚基因有什麼特別的
《三國吧兄弟》八月內地不刪檔 探索成功基因
磷基生命存在嗎?揭祕磷基生命的優勢和劣勢
基因檢測能檢測出什麼 關於基因檢測作用介紹。
360N5詳細評測 後臺執行30個程式不卡
英特爾推酷睿八代 基於Coffee Lake平臺和14 奈米++製程技術
基因遞送引發全國關注 雲舟生物摘得"創客中國"全國桂冠
海森生物首個生產基地在肥東全面開工
博騰生物與邦耀生物達成戰略合作 加速推進基因與細胞治療藥物商業化
基基復基基 功能柯基你可以考慮養一隻
諾基亞旗艦新品全面分析講解
博騰生物與科金生物達成戰略合作,推進基因與細胞治療藥物開發