?

美國大數據專業碩士研究生教育的背景、現狀、特色與啟示
——全美23所知名大學數據分析碩士課程網站及相關信息分析研究

2014-04-14 07:53何海地
圖書與情報 2014年2期
關鍵詞:碩士大學專業

何海地

(電子科技大學中山學院 廣東中山 528403)

·前沿與熱點·

美國大數據專業碩士研究生教育的背景、現狀、特色與啟示

——全美23所知名大學數據分析碩士課程網站及相關信息分析研究

何海地

(電子科技大學中山學院 廣東中山 528403)

圍繞大數據的開發和應用,美國政府在政策上積極鼓勵各大學開展跨學科的大數據專業碩士研究生教育,以培養下一代數據科學家和工程師,企業和研究機構也在積極配合推動。美國目前有超過四十多所大學開設了大數據專業碩士研究生課程,其中有二十多所知名大學的課程內容值得仔細研究,經過深入分析這些課程網站信息,總結出美國大數據專業碩士研究生課程的一些特點。文章還介紹了美國專家學者關于大數據的最新觀點,以及美國各大學大數據專業碩士研究生課程設置內容,結合中國大數據專業碩士研究生教育現狀等幾個方面的問題進行研究,從而為中國的大數據專業碩士教育提供非常有價值的參考。

美國 大數據 碩士研究生課程 數據分析商業數據分析 研究生教育

1 背景

2009年IBM首次提出“智慧星球”概念,大數據的開發和應用受到人們關注,為了彌補大數據相關人才的缺口與技能的缺乏,IBM目前已經與世界超過一千所大學在大數據和分析方面開展合作,IBM賦予大數據“Data savvy.Insight driven.”的內涵,中文可以意譯為“領悟數據,提升見識,洞察秋毫,驅動優化”,這四個英文單詞已成為各美國大學大數據與分析專業的課程描述中使用頻率非常高的詞匯。目前,在大數據開發與應用方面企業是主力軍,幾家著名互聯網公司成功地將其產品和服務與大數據和數據分析結合,成為業界典范和研究對象。伴隨著企業對大數據的開發和應用的深入,對相關人才產生需求,一批知名企業開設了自己的大數據研究中心,與大學開展合作,催生了大學大數據專業教育。

1.1 美國政府的“大數據研究與開發計劃”直接推動

2012年3月29日,美國總統奧巴馬宣布啟動“大數據研究與開發計劃”(Big Data Research and Development Initiative),旨在提高從海量數字數據中獲取知識和觀點的能力,從而加快科學與工程發現的步伐,加強美國的國家安全,實現教育與學習的變革。對于未來大數據人才的缺乏,美國國家科學基金會正在實施一項全面的長期戰略,包括從數據中獲取知識的新方法、管理數據的基礎設施、教育和隊伍建設的新途徑,尤其是:(1)鼓勵科研院校開展跨學科的研究生課程,以培養下一代數據科學家和工程師;(2)向加州大學伯克利分校提供1,000萬美元的資助,將機器學習、云計算、眾包三種方法整合起來,用于將數據轉變為信息等與教育行業有關的六條措施。在此計劃背景下,美國有數十所大學紛紛開辦了大數據及其分析等相關專業的碩士研究生課程。

1.2 政府部門和研究機構對未來大數據人才缺口的預測

2011年麥肯錫全球研究所(MGI)發布的《大數據:下一個創新,競爭和生產力前沿》(后簡稱為《大數據》)非常具有影響力,該報告討論了大數據給商業和經濟發展帶來的新的可能性,并預測,至2018年美國需要44至49萬大數據深入分析人才,存在14萬至19萬缺口;需要400萬名具備基于大數據分析而且能熟練并進行決策的經理和分析師,這一類人才缺口在2018年將達到150萬人,《大數據》報告建議要解決未來人才缺口,需要加快擴大專業教育和職業培訓,以及引進海外人才。根據美國勞工局2014年1月最新的統計數據,2012年市場雇用了718,700名具有管理分析技能的專業人員,平均年薪是78,600美元,2022年市場將需要852,500名這方面的專業技術人員,未來八年將有19%的需求增長。這些報告中提及的未來大數據相關人才缺口的數據,在美國各大學大數據相關專業的碩士研究生課程描述中被頻頻引用。

1.3 對大數據人才知識結構與綜合能力的討論

在大數據分析和應用中的各種數據與決策模型需要被不斷地測試和優化,同時,更需要相應人員高質量的計劃和執行力,因此,對大數據人才的知識結構與綜合能力提出了很高的要求。除了大數據相關書籍外,幾位知名學者和專家在美國主流媒體上發表的文章對大數據相關專業的開設和發展起了推波助瀾的作用。例如:2012年10月托馬斯·達文波特(Thomas Davenport)和帕蒂爾(D.J. Patil)在《哈佛商業評論(Harvard Business Review)》雜志上發表的《數據科學家:21世紀最受歡迎的職業(Data Scientist:The Sexiest Job of the 21st Century)》文章,指出大數據科學家應該具備的基本知識結構與綜合能力:沉浸在大數據中時能有價值發現;會編寫程序代碼;充滿好奇心;具備數據分析和交流溝通能力等。還有文章對數據科學家的知識結構與綜合能力提出看法:要成為大數據科學家,學生僅具備良好的數學、統計學和計算機科學等專業知識還不夠,還要具備其他專業領域較深的知識背景,例如:生物或物理專業領域知識,最重要的是要有創造故事的能力(ability to create narrative-to create story telling),數據是冰冷的,強調只有專業人才能使數據有生命有利用價值。對大數據及相關人才應具備知識結構與綜合能力的廣泛研究討論,給美國大數據相關專業的開設提供了非常有價值的參考。

2 美國大數據相關專業碩士研究生課程的開設情況

據不完全統計全世界有近170所大學開設了大數據相關專業,其中約150所大學開設了碩士研究生以上的學位課程。還有資料顯示,美國有超過60所大學開設了大數據相關專業,在歐洲有30多所大學,其中英國有13所,占了近一半,中國境內有2所,分別是香港中文大學的數據科學與商業統計(Data Science&Business Statistics)碩士課程和紐約大學上海分校的商業數據分析科學(Master of Science in Business Analytics)碩士課程。

美國大學開設大數據與數據分析相關專業的碩士研究生課程的確切數字我們沒有查到官方的正式統計,但一些研究機構或學者在自己的研究網站上進行收集統計并予以公布,例如:北卡羅萊納州立大學(North Carolina State University)高級數據分析研究院(Institute for Advanced Analytics)的統計資料較為全面可靠,他們將全美的大數據分析碩士學位課程按三個類型進行統計,即:數據分析科學碩士學位課程(MSA,Master of Science in Analytics)有14所大學,共性是屬新開發的跨學科課程,將應用數學、統計學、計算機科學,以及各種商業學科諸如營銷、財務等融合在一起,即使一些學位使用預測分析(Predictive Analytics)或數據分析(Data Analytics)冠名其課程內容也大致相同;商業數據分析碩士學位課程(MSBA,Master of Science in Business Analytics)有17所大學,其特點基本上是由各大學商學院新開設或改名而來的,也會有與其他學院聯合辦學的情況,和MSA類似面向技術的課程稍少一些,但也并不意味著MSBA就完全偏向商科;屬其他學科的碩士學位但主修方向是數據分析(Other M.S.Programs,Analytics Tracks and Concentrations)的有14所,常冠以數據科學(Data Science)這個名稱,一般開設在商學院以外的學院,將數據分析課程與其他學科結合的碩士學位,還有的情況是將原有的舊專業改為數據分析專業,有時還可能沿用原有的專業名稱,目標是從龐大數量與種類的數據中去獲得能有效溝通的可執行見解。這45所大學相對集中在美國的東部與北部區域。

2.1 本文分析研究對象

在廣泛收集相關資料全面分析后發現,一些較少數量、較窄范圍的統計分析名錄受到各大學的普遍關注和認可。2013年1月7日道格·漢斯肯(Doug Henschen)在《大數據分析碩士學位課程之排名前20(Big Data Analytics Masters Degrees:20 Top Programs)》文章中詳細介紹了北美地區20所大學的大數據分析專業的情況,雖然作者強調只是收錄不涉及排名,但因為有一定影響力,許多大學以被列入此名錄為榮。同樣重要的一個排行名錄發表在一個叫Degree Prospects,LLC團隊開辦的名為masters in data science的網站上,這個網站專門幫助大數據專業的學生解決各種專業知識和學習問題,該教育服務科研團隊最新收集的《全美23所知名大學數據科學碩士課程(23 Great Schools with Master's Programs in Data Science)》(見表1)名錄,較有代表性地羅列了全美大學中重要的數據科學碩士研究生學位課程。本文就以這23所大學的數據科學專業為主要研究對象,綜合其他信息源展開分析。

2.2 美國23所大學大數據專業碩士課程概況(詳情見表一)

美國最早開辦數據分析專業的是北卡羅萊納州立大學。2005年6月北卡羅萊納州立大學首次提出申請,由北卡理事會授權在2007年2月成立高級數據分析研究院(Institute for Advanced Analytics,后簡稱為IAA),成為美國正式的第一個數據分析碩士研究生(M.S.in Analytics)學位授予單位。著名的決策支持大型集成信息系統SAS(Statistics Analysis System)早期時段(1966~1976年)就是由北卡羅來納大學開發的,IAA與SAS保持的密切合作成為其辦學的特色優勢。在這23個知名的數據分析科學專業中,有11個開設在商學院,絕大多數稱為商業數據分析碩士(Master of Science in Business Analytics);有6個開設在工學院,以計算機或工程學院為主,多數是計算機科學碩士學位主修(Concentration)數據分析方向;設在管理學院的有4個,多數為商業管理碩士學位主修數據分析方向;其余2個分別由專設的數據分析研究所和研究生院開辦。除了專業課程外,許多大學還成立有專門的大數據研究所配合教研活動,例如:哥倫比亞大學的數據科學研究所(Institute for Data Sciences)、哈佛的應用計算科學研究所(Institute for Applied Computational Science)、加州大學伯克利分校的算法·機器與人實驗室(AMPLab)等等。

2.3 美國23所大學數據科學專業碩士課程設置特點

2.3.1 入學要求、學制、課程持續時間、學分和學費方面的情況

各大學對報考學生的數學和計算機知識結構都有較為統一的明確要求,諸如工程、計算機科學、數學、信息技術等專業的學士,最理想的是商業知識和數據分析技能都具備的學生。例如:田納西大學(University of Tennessee)要求學生具備數學和計算機背景知識;不具備相關知識的會被要求補齊相關課程學分,賓利大學(Bentley University)要求學生在進入核心階段前要完成經濟學、統計學和市場營銷的學分。德雷塞爾大學(Drexel University)的課程是針對那些有興趣于定量方法、通過數據分析探索和揭示內在關系、利用數據來解決商業問題,希望提升能力或從事商業分析的職業人,所以提出有工作經驗的學生會有較強的入學競爭力。普杜大學(Purdue University)將傳統商業咨詢與數據分析結合,即利用集成的分析方法和現代信息技術來生成商業情報和解決特定行業的問題,因此要求入學學生具有很強的分析、量化、團隊領導、組織和溝通能力。西北大學(Northwestern University)則明確提出將班級人數控制在23人,并集中個人指導,有機會形成良好的同學關系,有助于將這種關系超越學術帶到工作關系中去。紐約大學(New York University)在6國家的9個城市有分校,要求學生有兩個學習單元可以在紐約以外分校完成,其他的三個須在紐約大學本部完成。加州大學伯克利分校開設在線網絡教學,但也要求學生在校園有4-5天的體驗。學制有全日制(Full Time)、在職教育(Part Time)和網絡教育(Online)三種,所有23所大學都提供全日制課程,其中有12所大學同時提供在職教育,8所大學同時提供網絡教育。學制時長為1至2年,最短的為期9個月有3所大學,近11所大學須時2年。需要修滿的學分多數在30個以上,最高的德保羅大學(DePaul University)需要52個學分。學費普遍在4萬以上,最貴是麻省理工的92,827萬美元。

2.3.2 各大學充分利用校內的資源優勢來開展教學

北卡羅萊那州立大學是最早獲得數據分析碩士授予權的大學,號稱要培養世界上最好的數據分析專業人才,《哈佛商業評論》認定該校的專業與斯坦福大學、麻省理工學院、加州大學伯克利分校、哈佛大學和卡內基梅隆大學等名校的專業齊名,歷屆畢業生就業率都超過90%,與SAS結成合作伙伴關系,在SAS的幫助下結合實際項目對學生進行教學,提高學生畢業后求職的競爭力,學校還鼓勵學生開展四五人的團隊合作,許多畢業生獲得SAS產品證書。例如:全球前25大醫療計劃和生物制藥公司以及醫藥研發外包組織都在使用SAS來獲得醫療效果、利潤、客戶行為偏好方面的戰略洞察,北卡羅萊那州立大學與SAS聯手開展抗癌項目,由此帶來的分析智能幫助這些公司組織實現業務轉型和持續增長。

哥倫比亞大學(Columbia University)的課程自稱為“大雜燴”,目標是為那些希望擴大和深化理解計算機科學的學生,研究方向非常多,諸如:計算生物學、計算機安全、計算機應用基礎、應用生物信息學、欺詐檢測、智能系

統、感知、金融、信息檢索等領域的機器學習、自然語言處理、軟件系統、視覺和圖形,以及網絡系統等研究方向。課程特色是強調個性化,學生可選擇自己需要的主修方向。

表1 全美23所知名大學數據科學碩士課程一覽表

表1 全美23所知名大學數據科學碩士課程一覽表(續)

卡耐基梅?。–arnegie Mellon University)大學的學生可通過iLab的實驗室系統開展應用研究,獲得實踐知識經驗。

麻省理工學院斯?。⊿loan)管理學院的MBA項目包含了一個無與倫比的深度案例研究與實時案例討論組合、令人振奮的合作項目;整合杰出的教師授課、提供與非凡業界領袖的接觸機會,利用行動學習實驗室(Action Learning Lab),提供引人入勝的課程。研究方向包括企業管理、金融、創業和創新。麻省理工還配備了許多研究中心,如:數字化商業中心(Center for Digital Business)、計算機科學與人工智能實驗室(Computer Science and Artificial Intelligence Laboratory),以及經濟學和管理科學計算研究中心(Center for Computational Research in Economics and Management Science),組合廣泛的學習機會讓學員處于令人羨慕的地位和體驗中,使學生在學術、人脈、專業方面獲得巨大收益。

2.3.3 各大學非常重視通過與校外合作來提高學生的實際應用能力

這23所大學中有9所僅提供全日制課程,其余的大學都在提供全日制課程的同時,還提供在職教育或網絡教育,特別為在職人員提供學習機會,結合學生的工作經驗,可以縮短人才培養的周期,紐約大學和羅格斯大學(Rutgers University)將數據分析與信息管理專業列為MBA課程。

麻省理工的課程以專業、多樣、嚴謹出名,培養領導型人才,其特色是允許學生在導師的指導下訂制自己的課程,特別安排眾多實踐課程,注重與世界各地的行業領袖交流,例如:提供斯隆創新期計劃(SIP,The Sloane Innovation Period),即一周密集的經驗領導學習;行動學習實驗室(Action Learning Labs)計劃,即結合課堂學習和真實的商業經驗的實踐機會,其中在中國實驗室(China Lab)會安排與在MBA國際班學習的中國行業領袖級企業家合作共同應對挑戰;以及四周時間的獨立活動期(IAP,Independent Activities Period)。

路易斯安那州立大學(Louisiana State University)的課程受SAS的贊助,故其課程是模仿北卡羅萊納州立大學(North Carolina State University)高級數據分析研究院(Institute for Advanced Analytics)的課程。

斯坦福大學(Stanford University)所處的地理位置在硅谷使它大獲益處,該校的學生被允許使用Amazon的EC2云平臺做大規模計算。

賓利大學(Bentley University)地處美國128號公路高科技密集帶,眾多高科技公司對這個課程的需求,使得賓利大學的課程實現跨越式發展。

康涅狄格大學(University of Connecticut)課程建立在與通用電器(General Electric)的10年伙伴關系之上,與SAS和IBM也有技術合作,畢業生在商業分析和項目管理方面展現出與現實社會緊密結合的扎實基礎。

2012年舊金山大學(University of San Francisco)的MSA(Master of Science in Analytics)開始招收學生,一直與眾多知名公司保持著良好關系,例如:貝寶(Paypal)、湯森路透(Thomson Reuters)、“調查猴子”(SurveyMonkey)、思科(Cisco)和摩斯拉(Mozilla)等等。

2.3.4 各大學將數據分析與原有特色專業結合,開設相關領域的大數據分析課程

這23所大學開辦數據分析課程還有一個特征就是,許多學校將原有的特色專業與數據分析相結合,在各自領域的基礎上關注數據分析。北卡羅萊納州立大學、德雷克塞爾大學(Drexel University)、路易斯安那州立大學(Louisiana State University)將目光聚焦商業與數據分析的結合;辛辛納提大學(University of Cincinnati)、田納西大學(University of Tennessee)的統計與運營管理系將應用學習課程打造成為面向商業與大數據的課程。

舊金山大學(University of San Francisco)的MSA(Master of Science in Analytics)專業是由文理學院和管理學院聯合提供的一個創新的跨學科課程,為與大數據有關的各種數學、計算技能與方法進行嚴格的訓練,讓學生熟練地將數據分析與戰略決策關聯起來,以及將分析結果在商業場景中有效溝通。

辛辛納提大學(University of Cincinnati)的商業數據分析專業碩士研究生課程(Master of Science in Business Analytics)也頗有歷史淵源,前身的定量分析專業(M.S.in Quantitative Analysis)從1970年代就已經開始由該校的運營、商業分析與信息系統系(Department of Operations, Business Analytics,and Information Systems)開辦,它將自己的數據分析學位的課程解釋為運營研究和應用數據統計的結合(A Master of Science degree in operations research and applied statistics),在商業環境中開展應用數學和計算機的應用,這獨特的專業課程已經幫助畢業生在專業工作中獲得回報,并在商業世界的各個角落都表現出色。

田納西大學(University of Tennessee)的課程強調對商業了解的重要性,學生要學習大型商業背景下的技術技能,采用數據分析方式優化商業流程。除了提升分析技能的核心課程外,學生須在數據分析與實用統計或過程優化兩個領域的結合選擇其一作為主修。2013年田納西大學打算增加更多的研究方向,包括:供應鏈、客戶分析、醫療和金融方面的數據分析。

普渡大學(Purdue University)善長于咨詢業與數據分析結合,培養商業分析咨詢、金融咨詢與市場營銷咨詢方面的人才。

密歇根州立大學(Michigan State University)商業數據分析專業(MS in Business Analytics)的特色是由布羅德商學院(Broad College of Business)、工程學院(College of Engineering)和自然科學學院(College of Natural Science)三院合辦。

德保羅大學(DePaul University)應社會對大數據科學家的各種需求,課程強調技術能力和行業實踐經驗,為學生在數據挖掘高級技能、多元統計、機器學習和數據庫處理方面提供培訓。通過各行業贊助提供的數據分析項目,學生必須完成現實中的數據分析問題研究或參與數據分析領域的實習,專業研究方向涉及計算方法(Computational Methods)、醫療保?。℉ealth Care)、酒店管理(Hospitality)和市場營銷(Marketing)等。

馬里蘭大學(University of Maryland)的課程以市場營銷為目的,讓學生綜合全面地理解所需的數學和統計模型,以及用于分析客戶數據的工具,重點在于教授學生如何利用和處理大量的數據,設計強大的分析模型,有效地幫助客戶解釋并幫助他們設計產品,預測營銷活動的影響,更好地了解客戶,史密斯商學院(Robert H.Smith School of Business)是十個研究中心的匯集地,其中包括著名的復雜商業研究中心(Center for Complexity in Business)。

康涅狄格大學(University of Connecticut)的項目管理是其特色專業,所修的課程要求有四門商業分析、四門項目管理。

2.3.5 關注不同層次人才的培養

各學校都有不同的人才培養目標,配備不同層次課程供學生選擇。麻省理工斯隆管理學院MBA是培養領導型的專業人才,課程能賦予學生領導能力和信心,以及迎接各種挑戰的能力,并推動學生實現職業目標和抱負。

卡耐基梅隆大學(Carnegie Mellon University)則專注技術人才的培養,畢業生將成為掌握商業流程分析、預測建模技術、地理信息系統映射(GIS mapping)、分析報告、市場細分分析和數據可視化的跨學科精英。

普渡大學(Purdue University)的每個學生也將參與普渡推出的全球領導人計劃(Global Leaders initiative),項目致力于領導、溝通和職業發展培訓。

羅格斯大學(Rutgers University)則培養結合型人才,將目光投向信息與數據發現科學(Discovery Informatics& Data Sciences),目標是培養學生分析數據驅動決策的能力,課程匯集了數據管理、統計、機器學習和計算領域知識,學生將獲得各種技能包括:分析大型數據集的能力,開發建模解決方案來支持決策和很好地理解數據分析驅動的業務決策,形成的特色是將數據分析、各種學科融合于商業,為學生在依靠數據驅動的行業(如:金融、醫療、生物科技等行業就業)打下基礎,成為預測建模師,數據挖掘工程師或數據分析師等。

印第安納大學(Indiana University)課程關注培養學生的人文軟件實力,安排有戰略性思維這門課,內容涉及博弈論和商務策略內容。

2.3.6 各大學都非常重視實踐課程

幾乎所有的大學都將畢業實踐計劃或實踐提至很高的位置,課程中都將它列為必修課,有9所大學將畢業設計(Capstone)作為明確的要求寫在課程安排中,Capstone(也稱為頂點計劃)是在畢業前為進一步培養學生研究能力與交流技能的一個必須環節,是美國大學教育的重要特色。有的大學則采用畢業實踐(Practicum)或畢業實習(Internship)的方式去實現理論學習與實際操作的對接,例如:西北大學(Northwestern University)提供長達8個月的行業實踐項目。但是,有兩所大學卻稍有不同,例如:賓利大學(Bentley University)由于80%的學生是在職教育、50%是國際學生,都在晚上上課,所以無實習計劃的強制要求;斯坦福大學(Stanford University)建議學生要完成畢業研究計劃和實習,但不是必須的條件。

3 美國大數據碩士專業教育給我們的啟示

3.1 正視數據經濟“分析3.0(Analytics 3.0,Data Economy)”時代的來臨

如果我們比喻大數據是“智慧星球”中流動的血液和養分,圍繞對大數據的分析、應用、人才培養的研究則是讓“智慧星球”健康發展的基礎工作。美國著名學者托馬斯·達文波特(Thomas Davenport)集研究、教學和商業管理于一身,對數據分析研究有獨特的見解,提出“分析3.0(Data Analytics 3.0)”的觀點,他認為:傳統(1950~2000年)的數據分析是對過去數據的回顧屬于描述型,其類型95%屬于報導和描述、5%屬于預測和指導,稱為“分析1.0(Analytics 1.0,Traditional Analytics)”時代;當前(2000年至今)熱門的大數據分析是運用模型根據過去的數據預測未來屬于預測型,其類型95%屬于報道和數據可視化描述、5%屬于預測和指導,稱為“分析2.0(Analytics 2.0,Big Data)”時代;而我們正在進入的“分析3.0(Analytics 3.0,Data Economy)”時代被定義為“數據經濟快速影響(Fast Impact for the Data Economy)”背景下使用模型來規范最優行為和行動,屬于規范指導型,其類型90%屬于預測和規范指導性質,是經過系統運算后自動生成的內容?!胺治?.0”時代最重要的特征就是數據經濟,不僅網絡公司,任何行業任何類型的公司都可能參與到數據經濟中來,將數據分析嵌入到公司的關鍵過程和員工行為中。托馬斯作為有影響力、敏捷和多產的思想家,他的“分析3.0”的觀點對美國大學的大數據專業教育有深刻影響。因此,我們應該看到數據分析與應用的發展趨勢,以及其更深入和更廣泛的未來,中國需要類似這樣的專家,也需要這樣的研究討論氛圍,這對中國的大數據人才培養極為重要。

3.2 清晰了大數據科學家應具備的知識結構與綜合能力

數據科學家應具備的知識與技能要求非常高,美國有許多學者進行了討論,中國要培養自己的大數據人才需要參考美國的做法。從美國各大學的專業課程中的核心、必修、選修科目加上畢業設計(Capstone)的設置情況,我們可以獲得一些啟示,可將數據科學家應具備的知識與技能歸納為“技術硬指標”和“人文軟實力”兩個方面。

技術硬指標方面主要有以下要求:(1)數學。微積分和線性代數是大多數數據挖掘應用程序需要矩陣計算的基本算法。(2)統計學。掌握相關性分析、多元回歸,揉合各種數據從不同角度進行預測性和指導規范性建模,會使用R、SAS、SPSS、SciPy、Stata等統計工具軟件。(3)編程和寫腳本。掌握編程語言可以更具競爭力,如:Python、C/ C++、Java、Ruby、Perl、MATLAB、Pig等。(4)數據庫。熟練掌握SQL,關注NewSQL這類高擴展、高性能數據庫,如:Cloudera Impala、Clustrix、VoltDB等。(5)分布式計算系統:熟悉Apache產品族,鉆研NoSQL平臺,了解Apache Cassandra和MongoDB的優缺點,動手實踐Hadoop、HBase、Cassandra、MapReduce、Hive等不斷出現的新系統。(6)數據挖掘。數據挖掘是跨學科的,借鑒人工智能和機器學習、統計數據和數據庫系統等。(7)數據建模。從ERWin、Agile Data Modeling、ORM Diagrams、UML class diagrams、 CRC cards、Conceptual/logical/physical schema、DDL、Bachman diagrams、Zachman Framework等數據建模工具開始,掌握建模技術和方法。(8)預測建模。(9)機器學習。(10)數據可視化。選擇掌握Flare、HighCharts、AmCharts、D3.js、Processing、Google Visualization API、Raphael.js、Tableau等其中一些可視化工具。

人文軟實力方面主要有以下要求:(1)專業領域知識。對某行業及其數據非常了解,諸如醫藥、政府、零售、制造業等。(2)創造力和求知欲。有創造力的數據科學家都是充滿好奇心的,需要出眾的發現能力。(3)善于包裝會編故事。將復雜的數據包裝后像講故事般娓娓敘述出來。(4)順利執行項目、保證實現目標的項目管理能力。(5)保護數據隱私的道德。(6)通過簡短的交流能達到目的的能力,稱為電梯間交流(elevator speech)能力。

3.3 為跨學科開設大數據碩士研究生課程提供參考

中國在2004年開始數據分析人才的考培工作,首批項目數據分析師(CPDA,Certificate of Projects Data Analysis)誕生。目前,國內數據分析師較為擅長的是處理已經發生的問題,找出問題源頭,并且盡快排除問題,但是,相對缺乏發掘未知問題的能力。大數據的應用價值在于預測未來,這樣的應用需求與國內數據科學家不匹配,這將成為國內發展大數據應用的最大挑戰。2013年1月,國內首個“大數據技術與應用”軟件工程碩士項目在北京航空航天大學正式啟動。在國務院學位辦正式批準設立的專業碩士學位中“應用統計學碩士”(Master of Applied Statistics)是與大數據最相關的專業,目前,統計專業在全國至少有五六個培養方向,例如:廈門大學側重經濟統計;中央財經大學、西南財經大學側重金融統計;中國人民大學門類比較齊全,涉及經濟、生物與衛生流行病、風險管理等多個方面;南開大學側重工業統計;北京大學和北京師范大學側重理論統計;復旦大學側重管理統計;首都經貿大學側重金融統計分析和市場調查與分析,實踐比例占大部分。眾多開辦統計學專業的大學中,只有中國人民大學、南開大學、天津財經大學、西南財經大學、廈門大學五所大學的統計學屬于國家重點學科。另外,一些知名大學還建立了大數據研究中心,如清華大學、北京大學、中國人民大學、北京航空航天大學、北京郵電大學、廈門大學等,背后支撐的是各校統計分析、計算機和經濟管理專業,有研究生參與大數據研究與實踐工作。中國大數據碩士專業教育剛剛起步,我們需要啟動類似美國的“中國大數據科學與工程研究計劃”綱領性文件,國家在大數據平臺的構建、典型行業的應用以及研發人才的培養等方面應提供相應的財力、物力與人力支持,明確鼓勵科研院校開展跨學科合作來培養下一代數據科學家。大數據專業課程跨學科非常明顯,無論中國將來的大數據專業集中出現在商學院還是計算機學院,或是完全新設專業,在未來中國如何跨學科合作培養出足夠數量的、有發現能力的大數據人才是值得我們認真思考的。

4 結語

麥肯錫的《大數據》報告顯示至2018年美國大數據資深分析專家存在14萬至19萬缺口,決策經理和分析師缺口將達到150萬人。美國各大學的大數據碩士課程從2011、2012年開始大量招生,對于報考學生的教育背景和知識結構要求比較高,但要成為真正的數據科學家,如果沒有數年的內在數學能力訓練和行業實踐磨練,難以成為合格的數據科學家,因此,報告也強調即使在加快開展專業教育和職業培訓的前提下,未來仍然存在人才缺口,那么吸引海外技術人才就是一個必然,中國是赴美留學生最多的國家,這將會給中國的高端人才競爭形成壓力,我們必須要高度重視。

[1]IBM.Narrows Big Data Skills Gap By Partnering With More Than 1,000 Global Universities[EB/OL].[2013-11-04]. http://www-03.ibm.com/press/us/en/pressrelease/41733.wss.

[2]OBAMA ADMINISTRATION UNVEILS“BIG DATA”INITIATIVE:ANNOUNCES$200 MILLION IN NEW R&D INVESTMENTS[EB/OL].[2013-12-04].http://ww w.whitehouse.gov/sites/default/files/microsites/ostp/big_da ta_press_release_final_2.pdf.

[3]Big data:The next frontier for innovation,competition, and productivity.Deep analytical talent:Where are they now?[EB/OL].[2013-12-18].http://www.mckinsey.com/ features/big_data.

[4]Management Analysts[EB/OL].[2014-1-18].http:// www.bls.gov/ooh/business-and-financial/managementanalysts.htm.

[5]About Thomas Davenport[EB/OL].[2014-12-18].http:// www.tomdavenport.com/about/.

[6]Thomas H.Davenport,D.J.Patil.Data Scientist:The Sexiest Job of the 21st Century[EB/OL].[2013-11-16]. http://hbr.org/2012/10/data-scientist-the-sexiest-job-ofthe-21st-century/ar/1.

[7]Maureen Mackey.Why this Nerd Has the Sexiest Job in the Science[EB/OL].[2013-10-01].http://www.thefisca ltimes.com/Articles/2013/01/22/Why-This-Nerd-Hasthe-Sexiest-Job-in-Science.

[8]Ryan Swanstrom.Colleges with Data Science Degrees[EB/OL].[2013-10-19].http://datascience101.wordpres s.com/2012/04/09/colleges-with-data-science-degrees/.

[9]Gregory Piatetsky-Shapiro.Education in Analytics,Data Mining,and Data Science[EB/OL].[2013-10-29].http: //www.kdnuggets.com/education/index.html.

[10]INSTITUTE FOR ADVANCED ANALYTICS.Survey of Graduate Degree Programs in Analytics[EB/OL].[2013 -11-17].http://analytics.ncsu.edu/?page_id=4184.

[11]Michael Goldberg.Data Informed's Map of University Programs in Big Data Analytics[EB/OL].[2013-09-30]. http://data-informed.com/bigdata_university_map/.

[12]Doug Henschen.Big Data Analytics Master's Degrees: 20 Top Programs[EB/OL].[2013-09-30].http://www. informationweek.com/big-data/big-data-analytics/bigdata-analytics-masters-degrees-20-top-programs/d/did/1108042?page_number=1.

[13]Degree Prospects,LLC,.23 Great Schools with Master' s Programs in Data Science[EB/OL].[2013-12-30]. http://www.mastersindatascience.org/schools/23-greatschools-with-masters-programs-in-data-science/.

[14]Thomas Davenport.THE RISE OF ANALYTICS 3.0:How to Compete in the Data Economy[EB/OL].[2013 -11-04].http://iianalytics.com/.

[15]Soumen Chakrabarti,Martin Ester,Usama Fayyad,Johannes Gehrke,Jiawei Han,Shinichi Morishita,Gregory Piatetsky-Shapiro,Wei Wang.Data Mining Curriculum:A Proposal(Version 1.0)[EB/OL].[2013-12-24].http://www.kdnuggets.com/education/index.html.

[16]DS Examiner.Data Scientist Foundations:The Hard and Human Skills You Need[EB/OL].[2013-12-25]. http://www.mastersindatascience.org/blog/data-scientist -foundations-the-hard-and-human-skills-you-need/.

[17]人民郵電報.韓國將建首個開放大數據中心中國應未雨綢[EB/OL].[2013-11-04].http://news.xinhuanet.co m/fortune/2013-07/15/c_116544578.htm.

[18]北京考試報.應用統計學專業碩士讓數據“活”起來[EB/OL].[2014-01-03].http://yz.chsi.com.cn/kyzx/kyzy/ 201312/20131209/676148831.html.

[19]李國杰,程學旗.大數據研究:未來科技及經濟社會發展的重大戰略領域——大數據的研究現狀與科學思考[J].中國科學院院刊,2012,(6):647-657.

The Status and Suggestions of American Great Universities with Master's Programs in Big Data Analytics

As the development and application of big data increases,the U.S.government has actively encouraged universities in policy to carry on interdisciplinary graduate programs to train the next generation of data scientists and engineers.Companies and research institutions are also actively cooperating to promote such programs.In the United States, more than forty universities have started their Master's Programs in Big Data Analytics;there are currently over twenty great Programs available at these universities,all of which deserve careful researching.After in-depth analysis of these Programs' websites,sharing the view of American experts on big data will provide a valuable reference for the Chinese Master's Programs in Big Data Analytic

The United States;Big Data;Master's Programs;data science;business analytics;graduate program

G250.252

A

1003-6938(2014)02-0048-09

何海地,男,電子科技大學中山學院副研究館員。

2014-01-20;責任編輯:宋戈

猜你喜歡
碩士大學專業
山東藝術學院作品精選
“留白”是個大學問
一句話惹毛一個專業
The varieties of modern English and how does this range affect teaching English as a foreign language
部分專業介紹
專業修腳店
至善
探秘那些不冷不熱的專業
法國優秀碩士獎學金項目:France Excellence”
門檻最高的大學(前10名)
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合