微軟的 Azure Cloud Advocates 很高興提供一個為期10週、共20課的數據科學課程。每課包含課前及課後小測驗、完成課程的書面指引、解決方案和作業。我們採用基於項目的教學法,讓你在實作中學習,是讓新技能「牢記」的有效方式。
衷心感謝我們的作者們: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison。
🙏 特別感謝 🙏 我們的 Microsoft 學生大使 作者、審核者和內容貢獻者, 尤其是 Aaryan Arora、Aditya Garg、Alondra Sanchez、Ankita Singh、Anupam Mishra、Arpita Das、ChhailBihari Dubey、Dibri Nsofor、Dishita Bhasin、Majd Safi、Max Blum、Miguel Correa、Mohamma Iftekher (Iftu) Ebne Jalal、Nawrin Tabassum、Raymond Wangsa Putra、Rohit Yadav、Samridhi Sharma、Sanya Sinha、 Sheena Narula、Tauqeer Ahmad、Yogendrasingh Pawar 、Vidushi Gupta、Jasleen Sondhi
![]() |
|---|
| 初學者數據科學 - 草圖筆記由 @nitya 繪製 |
阿拉伯語 | 孟加拉語 | 保加利亞語 | 緬甸語 | 中文(簡體) | 中文(繁體,香港) | 中文(繁體,澳門) | 中文(繁體,台灣) | 克羅地亞語 | 捷克語 | 丹麥語 | 荷蘭語 | 愛沙尼亞語 | 芬蘭語 | 法語 | 德語 | 希臘語 | 希伯來語 | 印地語 | 匈牙利語 | 印度尼西亞語 | 義大利語 | 日語 | 坎納達語 | 韓語 | 立陶宛語 | 馬來語 | 馬拉雅拉姆語 | 馬拉地語 | 尼泊爾語 | 奈及利亞皮欽語 | 挪威語 | 波斯語(法爾西語) | 波蘭語 | 葡萄牙語(巴西) | 葡萄牙語(葡萄牙) | 旁遮普語(古爾穆克希) | 羅馬尼亞語 | 俄語 | 塞爾維亞語(西里爾字母) | 斯洛伐克語 | 斯洛文尼亞語 | 西班牙語 | 斯瓦希里語 | 瑞典語 | 他加祿語(菲律賓語) | 泰米爾語 | 泰盧固語 | 泰語 | 土耳其語 | 烏克蘭語 | 烏爾都語 | 越南語
想要本地端克隆?
本儲存庫包含50餘種語言翻譯,會大幅增加下載大小。若想不帶翻譯檔案克隆,可使用稀疏檢出:
Bash / macOS / Linux:
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'CMD(Windows):
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone "/*" "!translations" "!translated_images"這樣讓你以更快的速度取得完成課程所需所有資源。
如欲增加其他翻譯語言,請參閱此處列出的支援語言清單 here
我們目前正在進行 Discord AI 學習系列,歡迎了解並於 2025 年 9 月 18 日至 30 日加入我們:Learn with AI Series。你將學到使用 GitHub Copilot 進行數據科學的秘訣與技巧。
開始使用以下資源:
- 學生中心頁面 在此頁面,你會找到初學者資源、學生包甚至免費證書兌換券的取得方式。這是你想要加入書籤並定期查看的頁面,因為我們至少每月更換內容一次。
- Microsoft Learn 學生大使 加入全球學生大使社群,這可能是你進入微軟的橋樑。
完全初學者:剛開始接觸數據科學?請先從我們的 初學者範例 開始!這些簡單且附有良好註解的範例,將幫助你在深入完整課程前,理解基本概念。 學生們:想要自行使用本課程,請複製整個倉庫,並自行完成練習,從課前小測驗開始。然後閱讀課程並完成其他活動。盡量透過理解課程來創建專案,而非直接複製解答程式碼;不過每個基於專案的課程都在 /solutions 目錄備有程式碼。另一個方式是和朋友組成學習小組,一同進行內容。進一步學習我們推薦使用 Microsoft Learn。
快速開始:
- 查看 安裝指南 以設定你的環境
- 閱讀 使用指南 以學習如何使用課程
- 從第一課開始,按順序完成各課
- 加入我們的 Discord 社群 尋求支援
動圖由 Mohit Jaisal 製作
🎥 點擊上方圖片觀看關於專案和創作者們的影片!
在設計本課程時,我們選擇了兩個教學原則:確保課程以專案為基礎,並包含頻繁的測驗。到本系列課程結束時,學生將學會資料科學的基本原理,包括倫理概念、資料準備、不同的資料處理方式、資料視覺化、資料分析、資料科學的實際應用案例等。
另外,課前的低壓力測驗可幫助學生設定學習主題的意圖,而課後的第二次測驗則確保持續記憶。此課程設計具彈性且有趣,可整體或部分學習。專案從簡單開始,並在十週的學習週期結束時逐漸增加難度。
- 選用的手繪筆記
- 選用的補充影片
- 課前暖身測驗
- 書面課程
- 專案課程包含的逐步專案建置指引
- 知識檢測
- 挑戰題
- 補充閱讀
- 作業
- 課後測驗
關於測驗的說明:所有測驗均位於 Quiz-App 資料夾中,共有40個,每個包含三個問題。測驗連結嵌入於課程中,但測驗應用程式可本地執行或部署至 Azure;請參考
quiz-app資料夾中的說明。測驗正在逐步本地化。
剛接觸資料科學? 我們建立了特殊的範例目錄,包含簡單且詳盡註解的程式碼幫助您入門:
- 🌟 Hello World - 您的第一個資料科學程式
- 📂 資料載入 - 學習讀取與探索資料集
- 📊 簡單分析 - 計算統計並尋找模式
- 📈 基礎視覺化 - 創建圖表與圖形
- 🔬 實務專案 - 從頭到尾完整工作流程
每個範例均包含詳細註解解說每步驟,適合完全的新手!
👉 從範例開始 👈
![]() |
|---|
| 資料科學初學者:路線圖 - 手繪筆記由 @nitya |
| 課程編號 | 主題 | 課程分組 | 學習目標 | 連結課程 | 作者 |
|---|---|---|---|---|---|
| 01 | 定義資料科學 | 介紹 | 了解資料科學的基本概念及其與人工智慧、機器學習和大數據的關聯。 | 課程 影片 | Dmitry |
| 02 | 資料科學倫理 | 介紹 | 資料倫理概念、挑戰與架構。 | 課程 | Nitya |
| 03 | 定義資料 | 介紹 | 資料的分類及其常見來源。 | 課程 | Jasmine |
| 04 | 統計與機率導論 | 介紹 | 使用機率與統計的數學技術來了解資料。 | 課程 影片 | Dmitry |
| 05 | 使用關聯式資料 | 資料處理 | 關聯式資料介紹及使用結構化查詢語言(SQL,發音為 “see-quell”)探索和分析關聯式資料的基礎。 | 課程 | Christopher |
| 06 | 使用 NoSQL 資料 | 資料處理 | 非關聯式資料介紹、種類及探索和分析文件型資料庫的基礎。 | 課程 | Jasmine |
| 07 | 使用 Python | 資料處理 | 使用 Python 進行資料探索的基礎,包含 Pandas 等函式庫。建議具備 Python 程式基礎。 | 課程 影片 | Dmitry |
| 08 | 資料準備 | 資料處理 | 資料清理與轉換技術,應對缺失、不準確或不完整資料的挑戰。 | 課程 | Jasmine |
| 09 | 量化視覺化 | 資料視覺化 | 學習使用 Matplotlib 來視覺化鳥類資料 🦆 | 課程 | Jen |
| 10 | 資料分佈視覺化 | 資料視覺化 | 在區間內視覺化觀察與趨勢。 | 課程 | Jen |
| 11 | 比例視覺化 | 資料視覺化 | 視覺化離散和分組百分比。 | 課程 | Jen |
| 12 | 關係視覺化 | 資料視覺化 | 視覺化資料集及其變量間的連結和相關性。 | 課程 | Jen |
| 13 | 有意義的視覺化 | 資料視覺化 | 創造有價值視覺化的技巧與指導,有助於有效解決問題和獲得見解。 | 課程 | Jen |
| 14 | 資料科學生命週期導論 | 生命週期 | 資料科學生命週期介紹及其第一步驟:取得與提取資料。 | 課程 | Jasmine |
| 15 | 分析 | 生命週期 | 資料科學生命週期中著重於資料分析的階段。 | 課程 | Jasmine |
| 16 | 溝通 | 生命週期 | 資料科學生命週期中專注於以便於決策者理解的方式呈現資料洞見的階段。 | 課程 | Jalen |
| 17 | 雲端資料科學 | 雲端資料 | 介紹雲端資料科學及其好處。 | 課程 | Tiffany 及 Maud |
| 18 | 雲端資料科學 | 雲端資料 | 使用低碼工具訓練模型。 | 課程 | Tiffany 及 Maud |
| 19 | 雲端資料科學 | 雲端資料 | 使用 Azure 機器學習工作室部署模型。 | 課程 | Tiffany 及 Maud |
| 20 | 實務資料科學 | 實務 | 實際世界中由資料科學驅動的專案。 | 課程 | Nitya |
按照以下步驟在 Codespace 中開啟此範例:
- 點擊 Code 下拉選單,選擇 Open with Codespaces。
- 在面板底部選擇 + New codespace。 欲了解更多,請參考GitHub 文件。
使用您的本機電腦和 VSCode 搭配 VS Code Remote - Containers 擴充功能,在容器中打開此儲存庫,步驟如下:
- 若您是首次使用開發容器,請確保系統符合先決條件(例如已安裝 Docker),請參考入門文件。
使用此儲存庫,您可以選擇在獨立 Docker 卷中開啟儲存庫:
注意:底層將使用 Remote-Containers 的 Clone Repository in Container Volume... 指令,將原始碼克隆到 Docker 卷中,而非本地檔案系統。 卷 是持久化容器資料的首選機制。
或是開啟本地克隆或下載的儲存庫副本:
- 將儲存庫克隆至本地檔案系統。
- 按 F1,選擇 Remote-Containers: Open Folder in Container... 指令。
- 選擇剛剛克隆的資料夾,等待容器啟動,開始嘗試。
您可以使用 Docsify 進行離線瀏覽此文件。將此儲存庫分叉,於本機安裝 Docsify,然後在本儲存庫根目錄輸入 docsify serve,網站將於本地主機的3000端口執行:localhost:3000。
注意,筆記本不會透過 Docsify 呈現,當您需要執行筆記本時,請在 VS Code 中使用 Python 核心單獨執行。
我們團隊也製作其他課程!歡迎參考:
遇到問題嗎? 請查看我們的 疑難排解指南 來尋找常見問題的解決方法。
如果你在建構 AI 應用程式時遇到阻礙或有任何疑問,歡迎加入 MCP 學習者與經驗豐富的開發者討論社群。這是一個支持性強的社區,任何問題都可提出,並且知識會自由分享。
如果你有產品反饋或在建構過程中發現錯誤,請訪問:
免責聲明:
本文件係使用 AI 翻譯服務 Co-op Translator 翻譯而成。雖然我們致力於確保準確性,但請注意,自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應被視為權威版本。對於重要資訊,建議採用專業人工翻譯。我們不對因使用此翻譯而引起的誤解或曲解承擔任何責任。



