2月看板人物— 田弘華副教授

有同學問:什麼是資料科學?有什麼重要性?學什麼?怎麼學呢?

這些關於資料科學的問題好回答,也不好回答。顧名思義,資料科學是關於資料的科學,學習用科學的方法分析資料。這說法算是共識,不過有回答和沒回答差不多,想當然耳罷了。其實,資料科學目前還沒有一個明確的定義,每個人認為資料科學的範圍和內容不盡相同,所以也無法給同學確切的答案。

不過,回答為什麼「資料科學」會紅,還變成了近年來的流行語呢?這就簡單多了。由於網際網路與通信科技的蓬勃發展,我們的日常生活與資料息息相關,已經陷入了沒有資料就無法工作或生活狀態。比如同學早上起床後,會上網看看新聞嗎?要用手機查看公車資訊,並透過Line與人聯絡嗎?用電腦學習或工作嗎?會追劇和打電動嗎?如果答案是肯定的,那麼我們是對資料高度需求的消費者了!在這個資料化的社會,懂資料變成了現代人必備的素養。除此之外,也自然有人會想進一步成為運用資料創造價值的生產者,把遍地的資料變成黃金吧!

對現代社會而言,「資料」的價值與重要性與日俱增。在這種情況下,資料分析的科學應運而生,提供現代人運用資料需要的基本知識與技能,是理所當然的結果,而這門科學就稱為資料科學(data science)。可以這麼說,在時代的驅動下,資料分析已經成為一門顯學。對於同學們來說,資料分析是職業生涯中非常有用的技能,無論是在業界或政府部門工作,應該都需要具備資料分析的能力來提升職場上的競爭力。

對我而言,資料科學最重要的是用資料去分析一個真實世界的問題,提供一個解決問題的答案,讓資料產生價值,而不是像過去一樣,用玩具案例學習各種分析方法。也因此,能夠瞭解資料、整理資料是重要的第一步;然後為了分析真實的案例、解決實際的問題,再去學習或創新需要的方法。

個人不認為真實世界的資料,或者能夠提供解決問題答案的資料一定是大數據,資料科學分析的資料可以是傳統的問卷資料,甚至是實驗資料、模擬資料。要瞭解與運用真實世界的資料,需要從研究方法與統計觀念開始學起,知道如何用資料去衡量一個觀念,瞭解資料的特性差異,而能依照資料的性質進行分析。統計學並不因為大數據、資料科學的興起,就被宣告死亡。事實上,統計學是數據分析之鑰。至於程式語言則是因為能隨心所欲的創新,滿足不同的需求,所以功能強大。處理真實世界的資料,會遇到的問題千奇百怪,而解決問題的分析方法更是推陳出新,需要一個用的順手、彈性較大的工具。如果同學覺得資料分析很重要,建議在大學就學好程式,就像學好英文一樣,會是現代人必備的利器。


.田弘華副教授