?

屬性數據分析教學改革初探

2019-04-26 10:06劉曉梅
教育界·下旬 2019年1期
關鍵詞:屬性數據教學內容教學方法

劉曉梅

【摘要】課程以案例為抓手,以數據分析和統計軟件為兩翼,形成“統計分析-軟件操作-結果解讀”三位一體的教學體系,實行對比式、啟發式、互動式、點評式的課程教學模式,旨在提高學生的統計分析能力和創新能力,為后續參加統計類大賽和本科畢業設計打下堅實基礎。

【關鍵詞】教學方法;教學內容;屬性數據;統計分析能力;統計軟件

【基金項目】上海第二工業大學校重點課程建設(A01GY18F014-02)。

一、引言

隨著大數據時代、智能化時代的到來,只要掌握好數據分析的理論和技術,就能夠從數據中挖掘出所蘊藏的統計規律,就能夠給人們的生活與工作帶來極大的便利。統計學依據數據的計量尺度可分為定距型數據(interval scale)、定序型數據(ordinal scale)、定類型數據(nominal scale)與定比型數據(ratio scale),定距數據和定比數據統稱為定量數據(quantitative data),定類數據與定序數據又統稱為定性數據或者屬性數據(categorical data)。因此,絕大部分數據集里都含有屬性數據,也就是說,數據分析基本上離不開對屬性數據的分析,屬性數據分析得好壞直接影響到對問題的分析和結果的解讀。

但是,在屬性數據分析的教學中,存在學生對課程重要性的認知不夠,理論與實踐結合不緊密,統計軟件應用不夠,課程教學活動中學生的參與度不夠等一些問題,以至于學生沒能把知識轉化為能力,沒能把能力轉化為技能,影響了統計人才的培養,也影響了創新能力的培養。故,課程教學中需要抓住基本思想、基本方法、基本步驟的講解,突出屬性數據分析的理論與方法的介紹,突出屬性數據與定量數據的聯系與區別,注重對案例的分析,注重對統計軟件的分析與操作,使學生能夠構建起自己的知識體系,以便達到知識融會貫通,方法靈活運用。

二、屬性數據分析的教學改革

結合統計學科和本校應用統計學專業學生的特點,在屬性數據分析的教學改革中提出了以下幾點想法,旨在提高學生應用統計知識解決實際問題的能力和統計素養。

(一)構建合理的教學體系,注重對比式教學

第一,本課程遵循由淺入深,由定性到定量,層層遞進的分析模式,分別從低維到高維,從描述性分析到數據建模,從描述性統計到推斷性統計三個維度進行闡述,使其形成一個統一有機的整體。

第二,屬性數據與定量數據是兩大數據類型,它們的統計分析之間既有相似之處又有區別。因此,課程中采用對比式的講授方式。譬如,在講述一維屬性數據的描述性分析(表1)過程中,屬性數據可以類似于定量數據,首先將其數值化,但是需要注意的是這個數值僅僅代表的是一個類別,并不具有實際的含義。其次,類比于定量數據,一維數據可以采用數值法、圖表法進行描述性分析,而在數值法的描述性分析中需要強調的是屬性數據不能用均值、方差等來刻畫,因為屬性數據的數值不具有實際意義,而定量數據的數值具有實際的意義,其就有實際的含義,就可用均值、方差等來描述。再者,定類和定序的數值化還有一定的區別,定序的數值可以代表大小關系,所以可用中位數刻畫,而定類的數值只代表類別,不能用中位數刻畫。進而,在理解是否具有實際意義的基礎上,給出了屬性數據離散程度的三種刻畫方式——離異比率、熵、GS指數,這是與定量數據完全不同的,需要學生額外注意的。圖表法的講述也是如此,要特別關注屬性數據的特別之處——帕累托圖,這也是尋找重要影響因素的一種手段。因此,通過這樣對比式的學習,既復習了定量數據的內容,又加強了對屬性數據的學習與鞏固,還可避免在實際應用中混淆,從而提高學生的歸納能力、統計分析能力和實踐能力。

第三,屬性數據分析的內容繁多,又是一個統一的整體,需要學生自己歸納,總結,建立起每個章節的思維導圖。通過反復幾章思維導圖的訓練,學生在學習過程中不再只是單獨地訓練技能,而是積極地構建自己的知識體系,形成獨立的思考能力。

(二)以問題為導向,進行案例式教學設計

屬性數據分析課程的理論部分邏輯性強,公式復雜繁多,抽象而難以理解。通過板書可以加強學生對重要結論和重要思想的理解;通過案例教學,可以激發學生學習統計的興趣,啟發學生思考,從而鞏固學生的理論基礎和提高解決實際問題的能力。譬如,在講述高維列聯表獨立性檢驗時,考慮大學專業錄取是否存在性別歧視這樣一個貼近身邊的問題。這是一個高維(性別*專業*錄?。┝新摫淼膯栴},分層和壓縮是處理高維問題的兩個常用手段,壓縮后發現錄取時存在明顯的性別歧視。這個結論對嗎?可以引導學生去分析。按照專業分層后發現,錄取時并不存在性別歧視,那如何解釋這一現象?如何解釋暗含在這里面的原因?這就需要教師逐步啟發學生思考。通過啟發、思考,完成對這一現象原因的闡述,從而例證了條件獨立性檢驗和獨立性檢驗的聯系和區別,并且還可以將這一類現象進行歸納總結,進而給出辛普森悖論可能發生的條件。除此以外,本課程還結合我校參加統計類大賽的問卷數據,在相應的章節中結合所學知識完成案例的分析,最后形成一個統計大賽的實例分析??偠灾?,通過案例教學可以讓學生理論結合實際,更加直接、更加通俗易懂地理解相關理論和分析思路。

(三)多種教學手段交叉運用,注重統計素養培養

本課程在教學過程中采用啟發式、互動式、點評式、對比式等多種教學手段,充分調動學生的積極性,完成教學內容和案例分析。通過啟發式教學,可以引導學生思考,培養學生的分析能力和獨立創新能力;通過互動式教學,可以增強學生的學習興趣;通過點評式教學,可以讓學生學會用批判的眼光看待問題,更加全面地分析問題;通過對比式教學,可以促使學生建立自己的思維導圖,構建自己的知識體系,以便更加靈活地掌握數據分析的思想和內容。

(四)加強軟件實踐操作,注重統計分析能力培養

時代在不斷前進,社會在不斷進步,企業對人才的要求也在不斷提升,軟件應用能力更是社會所看重的一項重要指標。大數據時代,海量的科學數據,其分析必須借助計算機軟件來實現。常用的統計軟件有SPSS、SAS、R、Eviews、Stata、Python、Excel、Matlab等,其中,SPSS界面化的操作,上手快,操作簡單,對于初學者非常合適;R軟件是近年來流行的一款統計軟件,因其開源性受到廣大統計研究者的歡迎,公司職位招聘中也要求熟練應用R軟件。因此,本門課程著重講述SPSS和R這兩款常用的統計軟件,數值計算方面則介紹Matlab的相關函數,旨在讓學生可以熟練運用SPSS軟件和R軟件的相關操作及命令,完成數據分析的任務。除此之外,還要培養學生結合實際案例背景進行統計分析的能力,而不是單純為了用統計方法而用統計方法,提高學生對軟件結果的解讀能力,從而提高學生分析解決問題的能力、實踐能力與就業能力。

(五)以項目和論文為抓手,注重創新能力培養

市級、校級創新項目和統計類大賽的設置為提高本科生的統計素養提供了一個很好的平臺。通過參加項目和比賽,學生可以提高分析問題和解決實際問題的能力、與人溝通的能力、團隊合作能力,豐富統計分析的經歷,為將來畢業找工作提供一塊敲門磚。另外,從統計類大賽的論文、科研論文入手,通過對這些論文的分析、解讀、提問、總結,可以鞏固課上所學的知識,使學生熟悉論文寫作的基本格式,鍛煉提出問題、思考問題、分析問題、解決問題的能力,提高撰寫報告、論文的能力,為后續本科畢業設計打下良好的基礎。

三、結論

屬性數據分析作為統計專業重要的基礎課之一,需要在教學內容、教學手段、教學方法等方面不斷改進,故本課程提出了“統計分析-統計軟件-結果解讀”三位一體的教學體系,運用啟發式、互動式、點評式、對比式的教學手段,理論和實踐相結合的教學方法,注重統計軟件操作,進而提高學生分析問題和解決問題的能力,從創新、實踐、理論、素養等全方位多維度培養學生的綜合實力,使學生能夠應對社會發展所帶來的挑戰,成為國家所需要的應用型人才。

【參考文獻】

[1]王靜龍,粱小筠,王黎明.屬性數據分析[M].北京:高等教育出版社,2013.

[2]陳華舟,石凱,唐國強,等.“數據分析”課程理論與實踐相結合的教學改革思路[J].時代教育,2017(17):44-45.

[3]李軍,朱永偉,孫玉利.基于案例教學的課程改革探索[J].課程教育研究,2016(09):33-34.

[4]史希來.屬性數據分析引論[M].北京:北京大學出版社,2006.

[5]張學新.大數據時代本科應用統計學專業課程改革探索[J].陰山學刊,2016,30(03):143-146.

[6]薛薇.基于R的統計分析與數據挖掘[M].北京:中國人民大學出版社,2014.

[7]Alan Agresti.An introduction to categorical data analysis[M].2nd edition.America: Wiley InterScience, 2007.

[8]薛薇.SPSS統計分析方法及應用[M].第三版.北京:電子工業出版社,2013.

猜你喜歡
屬性數據教學內容教學方法
基于GIS的房產測繪管理信息系統架構研究
教學方法與知識類型的適宜
“啟蒙運動”一課教學內容分析
“清末新政”也可作為重要的教學內容
網絡中多敏感屬性數據發布隱私保護研究
我的教學方法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合