?

大數據時代經管類本科專業統計學教學內容完善的思考

2019-04-22 09:42李冠軍
科教導刊 2019年3期
關鍵詞:統計學教學內容大數據

摘 要 當前大數據發展對經管類本科專業統計學教學已經帶來一定影響,傳統的統計學教學內容不能很好的反應時代變化帶來的新要求。本文從數據性質差異、獲取數據方式的不同、研究對象重點的差異和統計分析思路差異四方面,闡述了傳統統計學教學內容對大數據的不適應。最后提出應在相應的教學內容部分增加補充有關大數據的基礎知識,完善教學內容。

關鍵詞 大數據 統計學 教學內容

統計學是教育部規定的經濟管理類專業的核心課程之一,是所有經管類本科專業的專業必修課。統計學課程主要是培養學生的統計思維和基礎的數據統計分析能力,同時為其他專業課程的學習做好知識準備。

大數據的量、數據獲取方式以及數據分析的方式等方面對傳統的統計學教學帶來不小的影響,尤其是近兩年在教學過程中學生對所學內容的有用性產生質疑,無疑使得對經管類本科專業統計學教學內容的改革和完善變得迫切和必要。但是具體探討統計學教學內容中增加關于大數據相關內容的研究還比較缺乏。

1 大數據及應用對社會發展的影響

大數據從“Big Data”直譯過來,是“海量數據”的升級版,最初主要指數據量龐大和復雜。維基百科給出的定義:“大數據是指無法使用傳統和常用的軟件技術和工具在一定時間內完成獲取、管理和處理的數據集?!毕鄬τ趥鹘y數據而言,大數據具有:數據量大、數據類型多、數據價值密度低、數據增長速度快和時效性高、能隨時調用和計算等特征。當前“大數據”一詞的內涵延展至“大數據時代”:代表大數據帶來的技術挑戰和困難;大數據處理的技術和方法;大數據分析和應用帶來的新發明、新服務和新的發展機遇。

從理論來講,大數據發展能惠及所有產業。目前我國的零售業、金融業、政府政務、醫療行業、能源行業、制造業、物流行業以及媒體傳播等領域已經有很多具體的大數據應用。大數據的應用呈現出較快的發展趨勢。伴隨著云計算、物聯網、人工智能等技術發展的深化,大數據應用將會成為影響社會發展的重要因素。

2 統計思維的建立對經管類專業學生培養的重要性

統計思維是人們主動運用數據對客觀事物進行描述、分析、判斷和推理,進而發現事物發展規律的思維方式,是比形象思維和邏輯思維更為復雜的一種思維方式,本質上屬于創造性思維。大數據時代,人們對數據的重要性認識已經上升到一個新的高度,而統計思維是在對數據不斷的分析和應用中逐步培養形成的。

從專業角度講,經管類專業的學生未來大部分將會從事經濟管理類的工作,而經濟管理類的許多工作需要一定的數據理解能力和分析能力。在大數據時代,這種要求會更加廣泛。

從素質培養角度來講,統計思維本質上屬于創造性思維,統計思維的建立過程是對經管類專業學生學科知識融通能力、觀察能力和抽象能力的綜合培養。

從統計學課程教學角度來講,教學的主要目的就是幫助學生建立統計思維,培養學生的數據解讀和數據分析應用能力。以提高學生自主利用統計分析方法解決專業學習以及日常生活遇到的經濟和管理實際問題的能力。

3 大數據發展對傳統統計學教學的影響

3.1 數據性質差異

傳統統計學所涉數據以結構化數據為主,對于非結構化數據需要先轉化為結構化數據;另外,對于傳統統計對數據錯誤容忍度很低。在教學過程中很明確地告訴學生對于不能轉化為結構化的數據,是無法處理的;對于有錯誤的數據,統計分析結果是不能采信的。

大數據則包含結構化和非結構化數據,其中絕大部分數據為非結構化數據,而且很多用傳統統計方法是無法轉化為結構化數據的。另外,大數據分析有高度容錯機制,更為接近現實世界存在大量錯誤和混亂數據的實際。因而,大數據預測比傳統統計預測有更高的精度。

3.2 獲取數據的方式不同

傳統統計學教授的數據獲取方式為定向式搜集,不論是一手的調查和實驗數據,還是二手資料的獲取,都是為了明確目的而去主動搜集獲取的,對數據來源的可靠性有很高要求。

大數據屬于多源數據,對數據來源和產生沒有過多要求,也不是為了特定的目的才產生的數據。大數據產生于互聯網和移動互聯網的應用普及,數據實時產生。隨著物聯網和人工智能的發展,數據增速大幅提升,主動連接、定向匯集和數據共享將更加明顯。

3.3 研究對象重點有差異

傳統統計學教學內容中有關抽樣分析的比重很高,這與數據的可獲得性有極大關系:隨機樣本數據較總體數據更容易。通過較低成本的隨機抽樣,實現以樣本數據窺探研究總體的面貌。但是要從實際總體中進行完全隨機抽樣又是相當困難的,結果往往不能很好反映總體全貌,調查分析結果缺乏延展性。

大數據的多源性、實時性和可被共享性等特征使得大數據分析可以不再依賴隨機抽樣,實現“樣本即總體”的全數據分析模式。避免了傳統統計中樣本代表性不強產后的“后遺癥”,也不再需要根據分布的假設來推斷總體特征。

總結來講,傳統統計學是先直接研究樣本,在間接研究總體;大數據分析則是直接研究總體。另外,大數據分析更注重不同總體間相關關系的研究,而傳統統計對因果關系更為看重。

3.4 統計分析思路有差異

傳統統計分析思路是先假設再進行驗證。具體來說,就是先根據研究目的提出假設,然后在通過收集來的數據進行驗證假設是否成立。傳統統計研究方法較為單一,主要是依據統計方法和相關理論建立模型,而后進行分析。如果假設本身存在問題,或者樣本數據有問題,那么統計模型必將產生偏差,影響結果分析。

大數據直接研究總體,分析思路是先發現再總結。具體來說,就是通過數據挖掘和智能算法,對海量數據進行分析發現,找出有用的特征和關系,進而發現事物或現象的規律,然后指導決策和判斷。大數據分析不需要先提出假設,也不需要理論模型,快速、高效,而且對數據有高的容錯度。

4 統計學教學內容應增加對大數據基礎知識的補充

基于前節的分析和教學實踐反饋,現在統計學教學內容急需補充大數據分析的一些基本知識,讓學生更好認識統計思維的重要性,數據量的變化帶來的只是統計分析方法的進步。在大數據時代對傳統統計的學習仍是必要的,兩者在現實世界都有重要價值。筆者認為可在以下教學內容中進行補充:

4.1 統計數據類型

在以往統計數據類型的不同分類中,增加按照數據量和處理方法不同,可將統計數據分為:傳統數據和大數據。完善以前按計量尺度不同、按數據來源的不同、按數據的收集方法不同、按數據描述的現象與時空關系不同等數據類型分類方式。

4.2 統計數據的收集

過去教學內容中,這部分主要講第一手和第二手數據的搜集。大數據的搜集方式與其傳統數據收集顯著差異,但也有第一手(利用網絡技術直接收集獲?。祿偷诙郑ㄩg接收集獲?。祿?。

4.3 統計數據處理

傳統統計學教學中數據處理部分主要講述數據的預處理和數據的圖表可視化。在此部分可增加大數據處理的基本知識,如數據清潔、大數據可視化處理等內容。

4.4 統計分析方法

在統計分析方法部分,傳統統計學教學內容主要分描述統計和推斷統計兩部分內容,重點講授推斷統計。推斷統計從基礎的參數估計和假設檢驗出發,到方差分析、相關及回歸分析、聚類分析、因子分析等應用方法。

大數據分析也要用到描述統計的內容,但重點在數據挖掘。由于大數據使用全數據分析模式,所以假設檢驗及應用方法就不在適用,但聚類分析等方法的原理仍然適用。另外,關聯分析、決策樹分析(原理在管理學課程有講授)、隨機森林、人工神經網絡等數據挖掘算法也可做簡單介紹。

4.5 應用軟件介紹

傳統統計學教學會介紹一些常用的統計應用軟件,如Excel、SPSS、Eviews等。那么在這部分,也可以增加一些大數據研究常用的應用軟件介紹,如做海量數據處理有優勢的Python軟件和進行數據分析有優勢的R軟件,引導和鼓勵學生自己探索學習。

5 結束語

大數據正在影響和改變著我們的工作和生活方式。統計學作為經管類專業基礎的數據分析類課程,其教學要能跟得上時代的發展,使學生統計思維的學習和培養能較好適應時代的變革。傳統統計學仍有很大價值,大數據的發展將會促進和推動統計學科的更好發展。

參考文獻

[1] 游士兵,等.統計學(第三版)[M].武漢:武漢大學出版社,2018.

[2] 李金昌.大數據與統計新思維[J].統計研究,2014(1).

[3] 惠琦娜.統計思維是創造性思維[J].中國統計,2009(8).

[4] 陳超,沈思鵬,趙楊,陳峰,魏永越.大數據思維與傳統統計思維差異的思考[J].南京醫科大學學報(社會科學版),2016(12).

[5] 徐德義,林志恒.對大數據時代大學統計教學的認識與思考[J].大學教育,2015(11).

[6] 李冠軍,賀世紅.對大數據時代物流專業統計學課程教學內容改革的思考[J].廣西師范學院學報(哲學社會科學版),2015(9).

[7] 劉素榮.大數據思維下經管專業統計學課程教學改革研究[J].高教學刊,2018(10).

猜你喜歡
統計學教學內容大數據
新冠疫情期間小學信息技術在線教學內容的選擇和實踐
大數據的統計學基礎分析
統計學教學與實驗實踐的一體化整合初探
等差數列教學內容的深化探究
省屬地方高校應用統計學專業人才培養模式研究
基于大數據背景下的智慧城市建設研究
難以一致的統計結果
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合