華文網

“大資料分析系統國家工程實驗室”究竟咋回事,這回終於說清楚了

3月29日,國家發改委正式批復,由中國科學院計算技術研究所承建的“大資料分析系統國家工程實驗室”(以下簡稱“實驗室”)在京揭牌。

大資料分析系統國家工程實驗室揭牌儀式

實驗室重點立足“分析”和“系統”兩個關鍵字(具體後面會講),是2016年《國家發展和改革委員會辦公廳關於請組織申報大資料領域創新能力建設專項的通知》規劃的13個國家級大資料實驗室中的一個。

據介紹,實驗室由中國科學院計算技術研究所牽頭,聯合中國科學院大學、中國科學院電腦網路資訊中心、曙光資訊產業股份有限公司、國創科視科技股份有限公司共同建設。

宗旨是產學研結合,使大資料技術更好的落地,推動大資料產業更快的發展。而事實上,這也是《通知》對於國家級大資料實驗室的核心要求。

只熱鬧不夠,重要的是落地

從13個國家級大資料實驗室的設立,不難看出大資料當前的發展熱度。而實際上,像這樣的指導性檔和規劃近兩年還有很多,

比如《關於運用大資料加強對市場主體服務和監管的若干意見》、《促進大資料發展行動綱要》、《政務資訊資源分享管理暫行辦法》、《大資料產業“十三五”發展規劃》……

特別需要指出的是2016年10月9日,中央政治局舉行集體學習,習近平總書記提出,要實施網路強國戰略,建設全國一體化的國家大資料中心,推進技術融合、業務融合、資料融合,實現跨層級、跨地域、跨系統、跨部門、跨業務的協同管理和服務。

國家對大資料產業的重視程度略見一斑。它不再是產業內少數幾個企業在做、在推動的事情,已經上升到了國家層面。換句話說,從上至下,全社會已經充分意識到了資料的價值。

這很好,重視是做好一件事的前提。但與此同時,光口頭上的重視並不能帶來實際的價值。資料如果不經過處理,它只是資料,沒有意義。

這正是13個國家級大資料實驗室所承擔的使命。

簡而言之,為國家、為產業界趟出一條實踐的道路,未來各個實驗室在各自細分的領域都是一個樣本工程。

理解“分析”和“系統”

這裡值得一提的是,相較科研實驗室,工程實驗室更講究落地、應用,因此在操作中更講求產學研的結合。具體到實驗室的設置、規劃,也能看出這一點。

從共建成員來看,中國科學院計算技術研究所、中國科學院大學、中國科學院電腦網路資訊中心、曙光資訊產業股份有限公司和國創科視科技股份有限公司,

研、學、產各方都有,而且實力很強。

以曙光資訊產業股份有限公司(以下簡稱“曙光”)為例,伺服器、存儲等硬體處於領先地位,特別是在高性能計算領域;軟體方面,曙光自主研製的XData大資料平臺能夠充分融合各種資料資源並進行全方位多層次的智慧分析。更為關鍵的是,曙光的軟硬體方案已經在氣象、政府、醫療、廣電等多個行業得到了實踐,這是實驗室最迫切需求的。

從實驗室業務建設方向來看,規劃了三大平臺:大資料分析基礎設施平臺、軟硬一體的大資料開放分析平臺、大資料分析示範應用與服務平臺,覆蓋大資料分析全生命週期的技術與應用環路。

解釋一下實驗室的兩個關鍵字“分析”和“系統”。

分析主要指橫向軟體層面的。使用者需要的不是Hadoop,也不是Spark,而是解決問題的能力,因而實驗室要研製的是新一代的資料分析軟體棧,是要把各種資料分析平臺都囊括其中,做成一個工具集。

系統狹義的理解縱向軟硬體一體的平臺。廣義的理解如曙光高級副總裁聶華所講,產學研的搭配、軟硬一體的組合、從資料收集分析到應用的全囊括。我理解這是應對大資料時代的一套方法論,讓大資料發揮出價值是項系統工程,要系統的對待。

一切以落地、應用為前提。

深入行業,應用是根本

除此之外,總體規劃在三大基礎平臺之上,各共建單位還將分別深入一個細分領域進一步探究大資料的應用。比如曙光就同時掛牌“政府大資料分析系統實驗室”,未來將重點開展政府相關行業的大資料智慧分析技術與系統的研製。

二級實驗室授牌儀式

為什麼會有這樣的佈局,主要源於兩方面的考慮:一是工程實驗室本來就致力於實際應用,基礎性研究只是手段不是目的,深入行業觸及實際應用是必然;二是從共建方的角度考慮,擅長、優勢的行業更利於拓展應用。

再以曙光為例,自其2015年提出“資料中國”戰略以來,通過“百城百行”的佈局,一張中國雲資料服務網路已初現端倪。截止當前已經有近40個城市落地、服務近百行業、部署近千應用。

從這個角度看,曙光深入政府行業是一種順其自然。就“政府大資料分析系統實驗室”這個小目標而言,曙光有很好的基礎。這意味著曙光發展自身業務與建設“政府大資料分析系統實驗室”這件事剛好一致,這個過程不會有資源被浪費,相互促進更利於雙方面的共同進步。

如果再放大視角來看,曙光的戰略佈局與實驗室規劃的契合度也非常高。實驗室所致力的三大平臺建設,無論軟硬體還是應用,曙光都能提供很好的支撐和促進作用。同時,在這個過程中如聶華所言,將進一步完善曙光自身的大資料理念、架構、技術,推進大資料的理論研究與產業應用,推動業務更好的發展。

因此,我們有理由相信在實驗室近期目標“直接可管理的科學與政府大資料開放資源30-50PB”“分佈於50-100個城市的大資料分析雲基礎設施”和“支撐至少兩大領域的示範應用”的規劃中,曙光能做出自己的貢獻。同時,在更長遠的“建設大資料產學研用良性生態系統”的目標中,曙光也能發揮自己應有的價值。

大資料時代已經來臨,其所能帶來的產業價值不可估量。而我國的實際情況卻是這樣,據統計,中國擁有全球14%的資料量,利用率卻不到0.4%,待開發的價值可想而知。這對於實驗室而言,既是壓力也是動力。希望其能化壓力為動力,迎難而上,早日讓大資料發揮出應有的價值。

這是實驗室最迫切需求的。

從實驗室業務建設方向來看,規劃了三大平臺:大資料分析基礎設施平臺、軟硬一體的大資料開放分析平臺、大資料分析示範應用與服務平臺,覆蓋大資料分析全生命週期的技術與應用環路。

解釋一下實驗室的兩個關鍵字“分析”和“系統”。

分析主要指橫向軟體層面的。使用者需要的不是Hadoop,也不是Spark,而是解決問題的能力,因而實驗室要研製的是新一代的資料分析軟體棧,是要把各種資料分析平臺都囊括其中,做成一個工具集。

系統狹義的理解縱向軟硬體一體的平臺。廣義的理解如曙光高級副總裁聶華所講,產學研的搭配、軟硬一體的組合、從資料收集分析到應用的全囊括。我理解這是應對大資料時代的一套方法論,讓大資料發揮出價值是項系統工程,要系統的對待。

一切以落地、應用為前提。

深入行業,應用是根本

除此之外,總體規劃在三大基礎平臺之上,各共建單位還將分別深入一個細分領域進一步探究大資料的應用。比如曙光就同時掛牌“政府大資料分析系統實驗室”,未來將重點開展政府相關行業的大資料智慧分析技術與系統的研製。

二級實驗室授牌儀式

為什麼會有這樣的佈局,主要源於兩方面的考慮:一是工程實驗室本來就致力於實際應用,基礎性研究只是手段不是目的,深入行業觸及實際應用是必然;二是從共建方的角度考慮,擅長、優勢的行業更利於拓展應用。

再以曙光為例,自其2015年提出“資料中國”戰略以來,通過“百城百行”的佈局,一張中國雲資料服務網路已初現端倪。截止當前已經有近40個城市落地、服務近百行業、部署近千應用。

從這個角度看,曙光深入政府行業是一種順其自然。就“政府大資料分析系統實驗室”這個小目標而言,曙光有很好的基礎。這意味著曙光發展自身業務與建設“政府大資料分析系統實驗室”這件事剛好一致,這個過程不會有資源被浪費,相互促進更利於雙方面的共同進步。

如果再放大視角來看,曙光的戰略佈局與實驗室規劃的契合度也非常高。實驗室所致力的三大平臺建設,無論軟硬體還是應用,曙光都能提供很好的支撐和促進作用。同時,在這個過程中如聶華所言,將進一步完善曙光自身的大資料理念、架構、技術,推進大資料的理論研究與產業應用,推動業務更好的發展。

因此,我們有理由相信在實驗室近期目標“直接可管理的科學與政府大資料開放資源30-50PB”“分佈於50-100個城市的大資料分析雲基礎設施”和“支撐至少兩大領域的示範應用”的規劃中,曙光能做出自己的貢獻。同時,在更長遠的“建設大資料產學研用良性生態系統”的目標中,曙光也能發揮自己應有的價值。

大資料時代已經來臨,其所能帶來的產業價值不可估量。而我國的實際情況卻是這樣,據統計,中國擁有全球14%的資料量,利用率卻不到0.4%,待開發的價值可想而知。這對於實驗室而言,既是壓力也是動力。希望其能化壓力為動力,迎難而上,早日讓大資料發揮出應有的價值。