大數(shù)據(jù)人才的就業(yè)方向及前景怎么樣?
發(fā)布時間:2020-05-22
隨著云計算、人工智能等技術的不斷深入發(fā)展,以及底層芯片和內存端的變化還有視頻應用的普及,都給大數(shù)據(jù)帶來新的發(fā)展要求。
未來大數(shù)據(jù)技術會沿著異構計算,批流融合,云化,兼容AI,內存計算等方向持續(xù)更迭,即將到來的5G時代讓4G時代積累的指數(shù)級用戶數(shù)據(jù)擁有了更多可能性,以“萬物互聯(lián)”為特征的物聯(lián)網(wǎng)拓寬了數(shù)據(jù)源頭與數(shù)據(jù)類型,智能算法挖掘出數(shù)據(jù)的多元應用形態(tài)。
5G和物聯(lián)網(wǎng)應用的成熟,又將帶來海量視頻和物聯(lián)網(wǎng)數(shù)據(jù),支持這些數(shù)據(jù)的處理也會是大數(shù)據(jù)技術未來發(fā)展的方向。
1、大數(shù)據(jù)人才需求及現(xiàn)狀
據(jù)統(tǒng)計,2019年新增設2072個本科專業(yè),其中數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)備受歡迎,共有196所高校新增該專業(yè)。
根據(jù)根據(jù)清華大學經(jīng)管學院2017年11月發(fā)布的《中國經(jīng)濟的數(shù)字化轉型:人才與就業(yè)》報告中顯示,當前我國大數(shù)據(jù)領域人才缺口高達150萬,到2025年將達到200萬。
就目前的技術發(fā)展速度及大數(shù)據(jù)的前景來看,未來大數(shù)據(jù)相關人才的需求量相當大,正是學習轉型的好機會。
2、大數(shù)據(jù)與信息的關系
大數(shù)據(jù)有5V特點,即Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。
但從信息論的角度,大數(shù)據(jù)通常是具備三個主要特征,數(shù)據(jù)量大,多樣性和完備性。
(1)大數(shù)據(jù)的體量足夠大
我國僅北京的國家超級大數(shù)據(jù)中心占地面積就達8萬平方米,包含9棟數(shù)據(jù)機房和1棟感知體驗中心。但過去數(shù)據(jù)支持量不足,數(shù)據(jù)能夠傳達的信息相對有限,很多人低估了它的價值。像語音識別領域就是因為早期積累大量的音頻數(shù)據(jù),后來才能捷足先登第一批嘗到數(shù)據(jù)驅動方法的甜頭。
(2)大數(shù)據(jù)的多維度足夠多
目前谷歌的人工智能走在前沿,AlpahaGo、無人駕駛、IT醫(yī)療公司Calico,都是建立在多維度的大數(shù)據(jù)基礎之上的。例如谷歌會根據(jù)用戶的搜索詞,多維度為用戶展現(xiàn)更多的信息內容,包括主要搜索詞內容以及邊緣內容。大數(shù)據(jù)的多維度,統(tǒng)計學中稱為相關性,信息論中稱為互信息;バ畔,它在信息論中,實現(xiàn)了對信息相關性的度量。
(3)大數(shù)據(jù)的完備性
所有數(shù)據(jù)驅動的方法,建立模型使用的數(shù)據(jù)和使用模型的數(shù)據(jù)需要有一致性。當數(shù)據(jù)具備完備性之后,就相當于訓練模型的數(shù)據(jù)集合和使用這個模型的測試集合是同一個集合,或者是高度重復的。這樣的數(shù)據(jù)驅動方法才是有效的。
3、大數(shù)據(jù)專業(yè)人才的就業(yè)方向
大數(shù)據(jù)作為一門基礎科學,無論在數(shù)據(jù)開發(fā)及分析、物聯(lián)網(wǎng)和人工智能算法訓練領域,都有著核心技術和職位訴求,主要來說的話,當下,大數(shù)據(jù)方面的就業(yè)主要有三大方向:1.數(shù)據(jù)分析類大數(shù)據(jù)人才、2.系統(tǒng)研發(fā)類大數(shù)據(jù)人才、3.應用開發(fā)類大數(shù)據(jù)人才。相關崗位包括Hadoop開發(fā)、可視化工具開發(fā)、信息架構開發(fā)、數(shù)據(jù)倉庫研究、數(shù)據(jù)科學研究、數(shù)據(jù)預測分析、企業(yè)數(shù)據(jù)管理、數(shù)據(jù)安全研究。