物聯傳媒 旗下網站
登錄 注冊
RFID世界網 >  新聞中心  >  物聯網新聞  >  正文

元數據標準研究亟待加強

作者:徐恒
來源:中國電子報
日期:2015-07-21 15:00:59
摘要:從IT時代到DT時代,大數據已成為一場革命,正在改變人們的生活、工作和思維方式。大數據標準研制作為產業發展基礎,目前仍處于起步階段。為實現數據間無歧義溝通,元數據標準研究與應用顯得更為迫切。
關鍵詞:大數據元數據

  從IT時代到DT時代,大數據已成為一場革命,正在改變人們的生活、工作和思維方式。大數據標準研制作為產業發展基礎,目前仍處于起步階段。為實現數據間無歧義溝通,元數據標準研究與應用顯得更為迫切。

  在研國標有10項

  大數據領域的標準化工作是支撐大數據產業發展和應用的重要基礎。記者近日從全國信標委大數據標準工作組第二次會議上獲悉,目前大數據相關標準研制還處于起步階段。國際上有4大標準化組織針對大數據進行專門研究,分別是ISO/IEC JTC1 SC32、ISO/IEC JTC1 WG9、ITU和NIST。

  為了推動和規范我國大數據產業的快速發展,建立大數據的產業鏈,與國際標準接軌,我國在2014年12月正式成立了全國信息技術標準化技術委員會大數據標準工作組(以下簡稱工作組)。工作組主要負責制定和完善我國大數據領域標準體系,組織開展大數據相關技術和標準的研究,申報國家、行業標準,承擔國家、行業標準制修訂計劃任務,宣傳、推廣標準實施,組織推動國際標準化活動。目前,工作組正在研制的國家標準有10項,其中《信息技術大數據術語》和《信息技術大數據技術參考模型》兩項國家標準已經完成相應的草案,準備進入征求意見階段。

  “目前已有138家單位申請成為工作組成員。”中國電子技術標準化研究院副院長高林表示,“工作組下一步將繼續完善和維護工作組工作平臺,加強元數據、數據分類、數據開放共享等方面的標準化研究,同時將積極開展測試評價、認證等相關準備工作。”

  值得一提的是,在研究提出大數據技術框架的基礎上,結合數據全周期管理,數據自身標準化特點,當前各領域推動大數據應用的初步實踐,以及未來大數據發展的趨勢,工作組提出了大數據標準體系框架。大數據標準體系由五個類別的標準組成,分別為:基礎標準、技術標準、產品和平臺標準、大數據安全標準及應用和服務標準。

  有專家認為,針對大數據,我國在數據管理、云計算、信息安全等方面,已經發布和在研一些標準,適用于大數據環境,提供了一定的基礎,但是缺乏標準化整體規劃;數據分析、數據安全、數據質量管理等技術標準,數據處理平臺、開放數據集、數據服務平臺類新型產品和服務形態的標準較為缺乏,亟須研制。

  需加強元數據標準研究

  近年來,大數據技術已經開始步入高速發展階段,國內外從事大數據方面研究和服務的公司越來越多,行業分得越來越細。不過,在行業應用中,由于缺乏統一的數據描述,數據在解釋、同步、轉換過程中時常會存在歧義,數據擁有者不能及時地按業務要求提供正確的數據時有發生。因此,在大數據時代,借助于元數據了解數據元素含義和上下文的需求越來越強烈。

  記者了解到,ISO/IEC JTC1 SC32下設4個工作組研究不同領域的標準研制,其中就包括元數據。其范圍涉及研制開發和維護有利于規范和管理的元數據、元模型和本體的標準,此類標準有助于理解和共享數據、信息和過程,支持互操作性,電子商務以及基于模型和基于服務的開發,包括:建議用于規定和管理元數據、元模型和本體的框架;規定和管理元數據、元模型和本體;規定和管理過程、服務和行為數據;開發管理元數據、元模型和本體的機制,包括注冊和存儲;開發交換元數據、元模型和本體的機制,包括基于互聯網、局域網等的語義。

  對于我國元數據標準制定,有專家就指出,我國迫切需要加強元數據標準或元數據模型的研究與應用,健全完善元數據標準規范及元數據模型。需要充分結合政府各部門現有數據資源建設情況,針對當前政務大數據資源、科技大數據資源、電子商務大數據資源等重點領域,研制元數據標準或統一的元數據標準模型框架,使得大數據向著標準化、條理化、脈絡化方向發展,實現無歧義溝通、理解和使用數據。解決當前數據在交易、使用等過程中存在的問題,更好地對數據進行管控,挖掘大數據,發揮數據價值。

  相關鏈接

  大數據標準體系中五類標準

  基礎標準

  基礎標準是指為整個標準體系提供包括總則、術語和參考模型、元數據等基礎性標準。

  技術標準

  主要針對大數據相關技術進行規范。包括數據治理和數據質量兩類標準。其中,數據治理標準主要針對數據的收集、預處理、分析、可視化、訪問、能力成熟度評價模型等方面進行規范。數據質量標準主要針對數據質量提出具體的管理要求和相應的指標要求,確保數據在產生、存儲、交換和使用等各個環節中的質量,為大數據應用打下良好的基礎,包括質量評價、數據溯源、質量檢測等標準。

  產品和平臺標準

  主要針對大數據相關技術產品和應用平臺進行規范。包括關系型數據庫產品、非結構化數據管理產品、智能工具、可視化工具、數據處理平臺和測試規范六類標準。其中關系型數據庫產品標準針對存儲和處理大數據的關系型數據庫管理系統,從訪問接口、技術要求、測試要求等方面進行規范,為關系型數據庫管理系統進行大數據的高端事務處理和海量數據分析提供支持;非結構化數據管理產品標準針對存儲和處理大數據的非結構化數據管理系統,從參考架構、數據表示、訪問接口、技術要求、測試要求等方面進行規范;智能工具用來幫助用戶對大數據進行分析決策,包括ETL、OLAP、數據挖掘等工具,智能工具標準對智能工具的技術及功能進行規范;可視化工具是對大數據處理應用過程中所需用到的可視化展現工具的技術和功能要求進行規范;大數據平臺標準是針對大數據存儲、處理、分析系統從技術架構、建設方案、平臺接口等方面進行規范;測試規范針對大數據的產品和平臺給出測試方法和要求。

  大數據安全標準

  數據安全作為數據標準的支撐體系,貫穿于數據整個生命周期的各個階段。拋開傳統的網絡安全和系統安全,大數據時代下的數據安全標準主要包括通用要求、隱私保護兩類標準。

  應用和服務標準

  應用和服務類標準主要是針對大數據所能提供的應用和服務從技術、功能、開發、維護和管理等方面進行規范。主要包括開放數據集、數據服務平臺和領域應用數據三類標準。其中開放數據集標準主要對向第三方提供的開放數據包中的內容、格式等進行規范;數據服務平臺標準是針對大數據服務平臺所提出的功能性、維護性和管理性的標準;領域應用數據指的是各領域根據其領域特性產生的專用數據標準,包括工業電子商務等領域。

人物訪談