一、大數(shù)據(jù)服務(wù)是大數(shù)據(jù)發(fā)展的核心
從根本上看,“大數(shù)據(jù)”并非一個科學(xué)、嚴格的概念,它來自于對數(shù)據(jù)規(guī)模的爆炸性增長這一現(xiàn)象的歸納。但在“海量數(shù)據(jù)”、“大規(guī)模數(shù)據(jù)”等概念已經(jīng)存在的前提下,之所以還要提出新的概念,就是因為既有概念只著眼于數(shù)據(jù)規(guī)模本身,未能充分反映數(shù)據(jù)爆炸大背景下的數(shù)據(jù)處理與應(yīng)用需求。而“大數(shù)據(jù)”這一概念所以能夠引發(fā)共識,成為當前熱點,就在于各個行業(yè)領(lǐng)域具有了對大數(shù)據(jù)分析和利用的巨大現(xiàn)實需求和明確應(yīng)用需求。所以說,大數(shù)據(jù)這一概念,不僅指規(guī)模超出傳統(tǒng)技術(shù)處理能力的靜態(tài)的數(shù)據(jù)對象,又包含著對這些數(shù)據(jù)對象的動態(tài)的處理和應(yīng)用活動。
若再考察數(shù)據(jù)的生命周期,從數(shù)據(jù)生成、數(shù)據(jù)傳輸、數(shù)據(jù)采集,到數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)應(yīng)用,會涉及多個環(huán)節(jié)和若干層面,但就大數(shù)據(jù)而言,其重點不在于對數(shù)據(jù)的傳輸、收集、存儲,而是重在對數(shù)據(jù)的分析挖掘,并由此獲得憑直覺難以發(fā)現(xiàn)的有用信息。惟有將重點放在數(shù)據(jù)的分析挖掘與應(yīng)用上,才能最大程度地實現(xiàn)大數(shù)據(jù)的真正價值,也惟有分析與應(yīng)用才是大數(shù)據(jù)及大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的重中之重。因此可以認為,以數(shù)據(jù)為中心,為滿足用戶對數(shù)據(jù)的分析應(yīng)用需求而提供的大數(shù)據(jù)服務(wù)將是大數(shù)據(jù)發(fā)展的核心。
而隨著對大數(shù)據(jù)應(yīng)用需求的不斷提升和大數(shù)據(jù)對象分析處理難度的增大,一般的企業(yè)將越來越難以運用先進的信息技術(shù)工具和人工智能相關(guān)的方法論從事大數(shù)據(jù)分析挖掘。身為專業(yè)機構(gòu)的第三方企業(yè)將孕育而生,這就是獨立的大數(shù)據(jù)服務(wù)提供商。大數(shù)據(jù)服務(wù)提供商能夠基于其信息技術(shù)能力和專業(yè)分析能力,為企業(yè)用戶提供大數(shù)據(jù)服務(wù)。與提供大數(shù)據(jù)相關(guān)信息系統(tǒng)所用到的軟硬件設(shè)備的企業(yè)相比,大數(shù)據(jù)服務(wù)提供商的地位必然更加重要,將與用戶結(jié)合成為戰(zhàn)略共同體。
二、大數(shù)據(jù)服務(wù)是定制化、知識型服務(wù)
大數(shù)據(jù)服務(wù)不是一種通用型的服務(wù),而是與基礎(chǔ)數(shù)據(jù)和用戶需求息息相關(guān)的定制化服務(wù)、知識型服務(wù)。對此,可以從大數(shù)據(jù)“三位一體”的內(nèi)涵進行理解。
我們認為,“大數(shù)據(jù)”不僅僅指大規(guī)模數(shù)據(jù)集合本身,而應(yīng)當是數(shù)據(jù)對象、技術(shù)與應(yīng)用三者的統(tǒng)一。這其中,從對象角度看,大數(shù)據(jù)是大小超出典型信息技術(shù)軟硬件采集、儲存、管理和分析等能力的數(shù)據(jù)集合,不同用戶所掌握的數(shù)據(jù)對象既有可能相同,也有可能不同;從技術(shù)角度看,大數(shù)據(jù)技術(shù)是從各種各樣類型的大數(shù)據(jù)中,快速獲得有價值信息的技術(shù)及其集成,同樣的技術(shù)、產(chǎn)品可以為不同的用戶所使用。既然大數(shù)據(jù)對象和大數(shù)據(jù)技術(shù)可能相同,則決定大數(shù)據(jù)應(yīng)用水平的就主要在于大數(shù)據(jù)應(yīng)用。
從應(yīng)用角度看,大數(shù)據(jù)是對特定的大數(shù)據(jù)集合,集成應(yīng)用大數(shù)據(jù)技術(shù),獲得有價值信息的行為。由于不同用戶之間的業(yè)務(wù)需求存在差異,對于不同領(lǐng)域、不同業(yè)務(wù),甚至同一領(lǐng)域不同企業(yè)的相同業(yè)務(wù)來說,由于數(shù)據(jù)集合和分析挖掘目標存在差異,所運用的大數(shù)據(jù)技術(shù)和大數(shù)據(jù)信息系統(tǒng)也可能有著相當大的不同。正由于與具體應(yīng)用緊密聯(lián)系,甚至是一對一的聯(lián)系,才使得“應(yīng)用”成為大數(shù)據(jù)不可或缺的內(nèi)涵之一。
正因為此,用戶、應(yīng)用需求和應(yīng)用場景(包括時間、區(qū)域等)一旦發(fā)生變化,則其對大數(shù)據(jù)服務(wù)的要求就會發(fā)生改變。這種變化的出現(xiàn)和存在,使得完全通用的大數(shù)據(jù)服務(wù)無法存在,也使得大數(shù)據(jù)服務(wù)成為一種更加專業(yè)化、更具針對性的知識型服務(wù)。而相應(yīng)地,大數(shù)據(jù)服務(wù)的市場空間也被放大。根據(jù)有關(guān)機構(gòu)預(yù)測,如果信息技術(shù)產(chǎn)業(yè)規(guī)模增長5%-10%,大數(shù)據(jù)服務(wù)的收入規(guī)模就將保持30%以上的增長,未來幾年全球大數(shù)據(jù)服務(wù)的產(chǎn)值將達到100億美元之上。
三、大數(shù)據(jù)對服務(wù)能力提出了更高要求
大數(shù)據(jù)帶來了認知、技術(shù)、產(chǎn)品、服務(wù)和應(yīng)用于一體的服務(wù)時代。由于大數(shù)據(jù)與用戶發(fā)展戰(zhàn)略和業(yè)務(wù)之間存在著前所未有的高度關(guān)聯(lián)性,所以對于提供數(shù)據(jù)分析挖掘等服務(wù)的大數(shù)據(jù)服務(wù)提供商而言,其所需要達到的能力要求也比傳統(tǒng)的信息系統(tǒng)集成服務(wù)商或信息技術(shù)運維服務(wù)商更高。
首先,大數(shù)據(jù)服務(wù)提供商必須擁有豐富的行業(yè)經(jīng)驗,對用戶所在行業(yè)的業(yè)務(wù)流程和數(shù)據(jù)價值有充分的了解,才能夠針對用戶需求提供有針對性的應(yīng)用方案和服務(wù)方案。
其次,大數(shù)據(jù)服務(wù)提供商必須掌握先進的信息技術(shù),特別是在數(shù)據(jù)挖掘、文本挖掘、及其學(xué)習等數(shù)據(jù)分析技術(shù)和音視頻、圖像、網(wǎng)頁數(shù)據(jù)、社交網(wǎng)絡(luò)數(shù)據(jù)等多媒體數(shù)據(jù)的識別技術(shù)方面建立優(yōu)勢,才能夠?qū)τ脩魯?shù)據(jù)對象的高水平、高質(zhì)量分析。
再者,大數(shù)據(jù)服務(wù)提供商必須擁有高質(zhì)量的“算法”資源、“規(guī)則庫”資源和“方法論”資源,才能夠從大數(shù)據(jù)對象中挖掘出有價值的信息。
在此基礎(chǔ)上,大數(shù)據(jù)服務(wù)提供商必須重視與數(shù)據(jù)價值產(chǎn)生相關(guān)聯(lián)的應(yīng)用的復(fù)雜多變性,以緊抓用戶的綜合服務(wù)需求,從數(shù)據(jù)集成、管理、分析、呈現(xiàn)等各個環(huán)節(jié)提供全方位的信息服務(wù),才能夠滿足用戶不斷提升的大數(shù)據(jù)應(yīng)用需求。
四、提高服務(wù)能力,拓展大數(shù)據(jù)服務(wù)市場
在大數(shù)據(jù)浪潮中,已經(jīng)有許多傳統(tǒng)的信息技術(shù)企業(yè)啟動了其轉(zhuǎn)型步伐,并將大數(shù)據(jù)服務(wù)定位為企業(yè)未來的重要發(fā)展方向。
2012年7月,NEC宣布推出“大數(shù)據(jù)發(fā)現(xiàn)項目”,為企業(yè)提供如何利用爆發(fā)性持續(xù)增長的大數(shù)據(jù)進行業(yè)務(wù)創(chuàng)新、擴大銷售以及改善業(yè)務(wù)流程等咨詢服務(wù)。其服務(wù)內(nèi)容主要包括三個方面,一是參考大數(shù)據(jù)應(yīng)用案例及技術(shù)動向,明確用戶應(yīng)用大數(shù)據(jù)的目的和目標,進而確定數(shù)據(jù)應(yīng)用對象業(yè)務(wù)和課題;二是整理用戶的業(yè)務(wù)方針、重要評價指標,對內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)組合而成的數(shù)據(jù)分析、模擬應(yīng)用立案;三是使用用戶的內(nèi)部已有數(shù)據(jù),實施模擬立案的數(shù)據(jù)分析,驗證數(shù)據(jù)的意義和分析工具、手法的有效性。為推動該項目的實施,NEC計劃在未來3年內(nèi)增加大數(shù)據(jù)業(yè)務(wù)的專門人才200名,同時通過培養(yǎng)各方面人才以及尋求企業(yè)合作等方式擴大其咨詢服務(wù)規(guī)模。
IBM則將大數(shù)據(jù)服務(wù)列為2013年最為關(guān)注的首要業(yè)務(wù),不僅提供直接的大數(shù)據(jù)服務(wù),幫助企業(yè)用戶和個人用戶挖掘大量的信息,從而幫助用戶作出更好的決策,而且將基于大數(shù)據(jù)服務(wù)能力將IBM的信息服務(wù)領(lǐng)域拓展到流量管理、天氣監(jiān)控、人力管理等領(lǐng)域。為此,IBM將2015年的數(shù)據(jù)分析業(yè)務(wù)預(yù)期銷售額從此前制定的160萬美元提升至200億美元。IBM在北京成立的全球首個大數(shù)據(jù)智慧賦能中心就專注于為企業(yè)用戶提供大數(shù)據(jù)服務(wù),包括幫助企業(yè)對規(guī)?;⒍鄻踊?、高速化的海量數(shù)據(jù)進行有效整合與管理,并應(yīng)用先進的分析方法對數(shù)據(jù)進行智慧洞察;幫助企業(yè)對數(shù)據(jù)進行及時的分析與預(yù)測,實現(xiàn)大數(shù)據(jù)的清晰呈現(xiàn);確保企業(yè)信息的可信性和企業(yè)敏感數(shù)據(jù)的安全性,合理管理企業(yè)數(shù)據(jù);為企業(yè)提供豐富的開發(fā)工具來開發(fā)分析應(yīng)用,合理優(yōu)化和調(diào)整企業(yè)工作,最終幫助企業(yè)從大數(shù)據(jù)中產(chǎn)生商業(yè)價值。
我國部分企業(yè)也開始重視大數(shù)據(jù)服務(wù)的提供。例如,榮之聯(lián)已將數(shù)據(jù)服務(wù)定義為面向生物行業(yè)提供的主要服務(wù)內(nèi)容;上海寰融則依托SAP HANA實時內(nèi)存計算技術(shù),將面向金融行業(yè)的數(shù)據(jù)服務(wù)定位為公司的核心業(yè)務(wù)。相信未來,隨著大數(shù)據(jù)概念的普及和深入人心,隨著大數(shù)據(jù)應(yīng)用需求的旺盛,面向用戶提供定制化服務(wù)的大數(shù)據(jù)服務(wù)提供商將會越來越多。
為提升我國信息技術(shù)企業(yè)的大數(shù)據(jù)服務(wù)能力,更好地滿足用戶的大數(shù)據(jù)分析與應(yīng)用需求,推動大數(shù)據(jù)服務(wù)發(fā)展和大數(shù)據(jù)應(yīng)用,需要從四個方面開展工作。
工作之一是加快布局大數(shù)據(jù)關(guān)鍵技術(shù)研發(fā),增強大數(shù)據(jù)服務(wù)支撐能力。一要加強人工智能、商業(yè)智能、機器學(xué)習等領(lǐng)域的理論研究和技術(shù)研發(fā),提高數(shù)據(jù)分析挖掘能力。二要加快非結(jié)構(gòu)化數(shù)據(jù)處理技術(shù)、非關(guān)系型數(shù)據(jù)庫管理技術(shù)、可視化技術(shù)等技術(shù)研發(fā),并推動與云計算、物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)的融合,提高大數(shù)據(jù)處理與應(yīng)用能力。三要加快提高非關(guān)系型數(shù)據(jù)庫管理系統(tǒng)、分布式文件系統(tǒng)、分布式處理系統(tǒng)、數(shù)據(jù)挖掘與分析軟件、商業(yè)智能軟件、多媒體加工處理軟件、可視化軟件等軟件產(chǎn)品的研發(fā)水平,形成有針對性的、完整的、可實用的數(shù)據(jù)分析挖掘軟件,推動提高大數(shù)據(jù)服務(wù)的精確度、匹配度與時效性。
工作之二是加強指導(dǎo)重點企業(yè)大數(shù)據(jù)建設(shè),夯實大數(shù)據(jù)服務(wù)應(yīng)用基礎(chǔ)。一要加強企業(yè)專業(yè)知識庫、數(shù)據(jù)庫與規(guī)則庫建立規(guī)范的制定,為企業(yè)級用戶建設(shè)和維護大數(shù)據(jù)集合提供參考與指導(dǎo)。二要選擇重點領(lǐng)域、重點企業(yè),鼓勵其應(yīng)用數(shù)據(jù)清洗等手段,對企業(yè)積累的數(shù)據(jù)進行初步分析整理,去除重復(fù)數(shù)據(jù),減少噪音數(shù)據(jù),提高大數(shù)據(jù)集合的建設(shè)質(zhì)量。三要研究推進物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)環(huán)境下大數(shù)據(jù)集合的建立模式與建立規(guī)范,為新興領(lǐng)域大數(shù)據(jù)的使用提供幫助。四要開發(fā)經(jīng)過深度加工的行業(yè)公共數(shù)據(jù)庫、規(guī)則庫,提供相關(guān)增值服務(wù),為實現(xiàn)大數(shù)據(jù)的處理、管理、應(yīng)用提供支撐。
工作之三是加速推進重要領(lǐng)域大數(shù)據(jù)應(yīng)用,拓寬大數(shù)據(jù)服務(wù)發(fā)展空間。一要加速推動大數(shù)據(jù)在移動互聯(lián)網(wǎng)、電信、交通、醫(yī)療家電等行業(yè)領(lǐng)域的應(yīng)用普及,形成涉及數(shù)據(jù)監(jiān)測、商業(yè)決策、數(shù)據(jù)分析、橫向擴展存儲等功能的軟硬件一體化行業(yè)應(yīng)用解決方案和綜合服務(wù)方案。二要推動培育形成一批具有較高集成水平、較強市場能力的大數(shù)據(jù)服務(wù)提供商,為大數(shù)據(jù)在各行業(yè)領(lǐng)域的應(yīng)用提供高質(zhì)量的服務(wù)。三要以百度、騰訊、阿里巴巴等企業(yè)牽頭,基于開源、開放操作系統(tǒng)或應(yīng)用平臺,整合優(yōu)勢資源,聚集一批有實力、有特色的中小互聯(lián)網(wǎng)信息服務(wù)提供商,加速本土化大數(shù)據(jù)服務(wù)的開拓與整合,形成良性發(fā)展的生態(tài)系統(tǒng)。
工作之四是注重建立健全相關(guān)政策法規(guī)體系,優(yōu)化大數(shù)據(jù)服務(wù)發(fā)展環(huán)境。一要明確大數(shù)據(jù)服務(wù)的價值和作用,支持從事數(shù)據(jù)加工處理、數(shù)據(jù)分析挖掘的大數(shù)據(jù)服務(wù)企業(yè)發(fā)展,將具備一定服務(wù)能力的企業(yè)的大數(shù)據(jù)服務(wù)業(yè)務(wù)列入營業(yè)稅優(yōu)惠政策享受范圍。二要完善相關(guān)體制機制,以政府應(yīng)用為切入點,推動信息資源的集中共享,夯實大數(shù)據(jù)的應(yīng)用基礎(chǔ)。