中正大學課程大綱
Introduction to Machine Learning- Using Python資料科學分析與應用
一、課程概述
資料科學(Data science)是一門利用資料學習知識的學科,其目標是通過從資料中提取出有價值的部分來生產資料產品。資料科學一詞的重點在於「科學」,其意味著透過系統性的研究,以可檢驗的解釋與預測來建立與組織知識[1]。它結合了諸多領域中的理論和技術,包括大數據、人工智慧、機器學習、數據統計分析、資料視覺化及高速運算等等。
資料科學的重要性之一在於其與掌握競爭優勢有很大關係:當一切人類與非人類活動都可以被量化,能掌握並善用大量數據的人等於掌握優勢[2]。資料科學就是從大數據中汲取知識,將大數據作為資料來源,資料科學作為方法,將資料轉換為知識[3]。使用機器學習作為大數據資料處理方法,藉以萃取出複雜的規則,讓電腦展現出擬似人類智慧的行為(AI),是目前資料科學研究最為熱門的議題[4]。
依照台灣資料科學協會的學習地圖[5],學習資訊科學首先應先掌握Python或R程式語言作為工具,然後了解機器學習相關理論,再進而學習網路爬蟲等資料工程的相關知識技術,或進入深度學習了解資料探勘相關技術,最後實際運用於製造資料分析、金融工程、程式交易與物聯網及智慧程式等運用。
本課程作為資料科學的入門課程,依據資料科學學會的學習地圖建議,分成三部分的主軸:掌握工具、資料整理與視覺化、機器學習。本課程選用的程式語言為Python,他是在資料科學中最受歡迎、使用最廣的程式語言。除了Python我們將介紹正規表示式並示範如何快速清除與比對出我們所需的資訊。資料清理後我們將介紹Pandas, Numpy, Matplotlib等資料處理分析與圖形化的套件,最後藉由Scikit-learn的範例介紹機器學習的相關理論知識。
本課程適合非理工學院學生,但並不是一門程式入門基礎的課程,建議同學先具備基礎程式撰寫能力,如撰寫過選擇結構、循序結構的程式。但你不一定事先要熟悉Python,我們會利用幾週的時間協助同學掌握使用Python來體驗資料科學必要的技能。
二、課程大綱說明文件2026_資料科學導論_通識教育課程教學大綱.pdf
三、教材編選
四、教學教法
五、評量工具
請尊重智慧財產權,不得非法影印教師指定之教科書籍