微軟 Azure 雲端倡導者很榮幸提供一個為期 10 週、共 20 堂課的完整資料科學課程綱要。每堂課包含課前和課後測驗、完成課程的書面說明、解答以及作業。我們採用專案導向教學法,讓你邊學邊做,這是讓新技能「深植」的有效方式。
誠摯感謝我們的作者: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison。
🙏 特別感謝 🙏 我們的 Microsoft 學生大使 作者、審稿人與內容貢獻者, 尤其是 Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi
![]() |
|---|
| 初學者資料科學 - 手繪筆記由 @nitya 製作 |
阿拉伯文 | 孟加拉文 | 保加利亞文 | 緬甸文 | 中文(簡體) | 中文(繁體,香港) | 中文(繁體,澳門) | 中文(繁體,台灣) | 克羅埃西亞文 | 捷克文 | 丹麥文 | 荷蘭文 | 愛沙尼亞文 | 芬蘭文 | 法文 | 德文 | 希臘文 | 希伯來文 | 印地文 | 匈牙利文 | 印尼文 | 義大利文 | 日文 | 坎那達文 | 韓文 | 立陶宛文 | 馬來文 | 馬拉雅拉姆文 | 馬拉地文 | 尼泊爾文 | 奈及利亞派金語 | 挪威文 | 波斯文(法爾西) | 波蘭文 | 葡萄牙文(巴西) | 葡萄牙文(葡萄牙) | 旁遮普文(古爾穆奇) | 羅馬尼亞文 | 俄文 | 塞爾維亞文(西里爾) | 斯洛伐克文 | 斯洛文尼亞文 | 西班牙文 | 斯瓦希里文 | 瑞典文 | 他加祿文(菲律賓語) | 泰米爾文 | 泰盧固文 | 泰文 | 土耳其文 | 烏克蘭文 | 烏爾都文 | 越南文
偏好在本機端克隆?
本專案包含 50 多種語言的翻譯,這會大幅增加下載大小。若要不含翻譯檔案克隆,請使用稀疏檢出:
Bash / macOS / Linux:
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'CMD (Windows):
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone "/*" "!translations" "!translated_images"這樣將為你提供完成課程所需的所有內容,而且下載速度更快。
如果你希望支援其他翻譯語言,請參考 此處
我們有一個持續進行中的 Discord 「與 AI 一起學習」系列講座,詳情與加入請訪問 與 AI 一起學習系列,時間為 2025 年 9 月 18 日至 30 日。你將獲得使用 GitHub Copilot 進行資料科學的技巧與秘訣。
開始使用以下資源:
- 學生中心頁面 在此頁面中,你會找到初學者資源、學生包甚至免費證書優惠券。這是一個你應該加入書籤並定期查看的頁面,因為我們每月至少會更新內容一次。
- Microsoft Learn 學生大使 加入學生大使全球社群,這可能是你進入微軟的管道。
完全初學者:資料科學新手?請先從我們的初學者友善範例開始!這些簡單且有詳細註解的範例將幫助你理解基本概念,再進入完整課程。 學生:自行使用本課程綱要,請 Fork 整個倉庫並獨立完成練習,從課前測驗開始。然後閱讀課程內容並完成其餘活動。盡量透過理解課程自行建立專案,而非直接複製解答程式碼;不過,每個專案導向課程中 /solutions 資料夾提供了完整程式碼解答。另一個方法是和朋友組成讀書會,一起學習內容。深入研究建議透過 Microsoft Learn。
快速開始:
- 查看 安裝指南 以設定環境
- 閱讀 使用指南 了解課程使用方式
- 從第 1 課開始,按順序完成
- 加入我們的 Discord 社群 尋求支援
動圖作者 Mohit Jaisal
🎥 點擊上方圖片觀看關於此專案及其創作者的影片!
我們在建立這個課程時選擇了兩個教學原則:確保它以專案為基礎,且包含頻繁的小測驗。在本系列課程結束時,學生將學會數據科學的基本原則,包括倫理概念、數據準備、處理數據的不同方式、數據視覺化、數據分析、數據科學的真實案例等。
此外,課前的小測能使學生設定學習主題的目標,而課後的第二次小測則確保進一步記憶。這個課程設計靈活且有趣,您可以全部學習或部分選擇學習。專案從簡單開始,到第10週結束時會逐漸複雜。
- 選擇性手繪筆記
- 選擇性補充影片
- 課前熱身小測
- 書面課程內容
- 專案課程附上逐步專案建置指南
- 知識檢測
- 挑戰題
- 補充閱讀
- 作業
- 課後小測
關於小測的說明:所有小測均位於 Quiz-App 資料夾中,共40個小測,每個含三題。課程中有連結,且小測應用可以本機執行或部署至 Azure;請參照
quiz-app資料夾中的說明。小測正在逐步本地化。
剛接觸數據科學嗎? 我們特別建立了一個範例目錄,提供簡單且註解良好的程式碼,幫助您入門:
- 🌟 Hello World - 您的第一個數據科學程式
- 📂 讀取資料 - 學習閱讀與探索資料集
- 📊 簡單分析 - 計算統計資料與尋找模式
- 📈 基礎視覺化 - 建立圖表與繪圖
- 🔬 實務專案 - 從開始到完成的完整工作流程
每個範例都包含詳細註解,說明每一步驟,是絕對初學者的理想教材!
👉 從範例開始 👈
![]() |
|---|
| 數據科學初學者路線圖 - 手繪筆記作者 @nitya |
| 課程編號 | 主題 | 所屬單元 | 學習目標 | 連結課程 | 作者 |
|---|---|---|---|---|---|
| 01 | 定義數據科學 | 簡介 | 學習數據科學背後的基本概念,以及它與人工智慧、機器學習和大數據的關係。 | 課程 影片 | Dmitry |
| 02 | 數據科學倫理 | 簡介 | 數據倫理的概念、挑戰與框架。 | 課程 | Nitya |
| 03 | 定義數據 | 簡介 | 數據如何分類及其常見來源。 | 課程 | Jasmine |
| 04 | 統計學與機率入門 | 簡介 | 使用機率與統計的數學技術來理解數據。 | 課程 影片 | Dmitry |
| 05 | 使用關聯式資料庫 | 處理資料 | 關於關聯式資料庫的介紹,以及使用結構化查詢語言(SQL,讀作“see-quell”)探究與分析關聯資料的基礎。 | 課程 | Christopher |
| 06 | 使用非關聯式資料庫 | 處理資料 | 非關聯式資料的介紹、不同類型及探究與分析文件型資料庫的基礎。 | 課程 | Jasmine |
| 07 | 使用 Python | 處理資料 | 使用 Python 進行資料探索的基礎,包含 Pandas 等函式庫。建議具備 Python 程式設計的基礎認識。 | 課程 影片 | Dmitry |
| 08 | 資料準備 | 處理資料 | 探討清洗與轉換資料的技術,以應對缺失、不準確或不完整資料的挑戰。 | 課程 | Jasmine |
| 09 | 數量視覺化 | 資料視覺化 | 學習使用 Matplotlib 來視覺化鳥類資料 🦆 | 課程 | Jen |
| 10 | 資料分布視覺化 | 資料視覺化 | 視覺化區間內的觀察與趨勢。 | 課程 | Jen |
| 11 | 比例視覺化 | 資料視覺化 | 視覺化離散及分組百分比。 | 課程 | Jen |
| 12 | 關係視覺化 | 資料視覺化 | 視覺化數據集及其變數間的關聯與相關性。 | 課程 | Jen |
| 13 | 有意義的視覺化 | 資料視覺化 | 製作有效且有助於問題解決與洞察的視覺化技巧與指導。 | 課程 | Jen |
| 14 | 數據科學生命週期入門 | 生命週期 | 介紹數據科學生命週期及其第一步:獲取與擷取資料。 | 課程 | Jasmine |
| 15 | 分析階段 | 生命週期 | 數據科學生命週期中專注於資料分析的方法。 | 課程 | Jasmine |
| 16 | 溝通階段 | 生命週期 | 專注於將數據洞察以便決策者理解的方式呈現。 | 課程 | Jalen |
| 17 | 雲端數據科學 | 雲端資料 | 本系列課程介紹雲端數據科學及其優勢。 | 課程 | Tiffany 與 Maud |
| 18 | 雲端數據科學 | 雲端資料 | 使用低代碼工具訓練模型。 | 課程 | Tiffany 與 Maud |
| 19 | 雲端數據科學 | 雲端資料 | 使用 Azure Machine Learning Studio 部署模型。 | 課程 | Tiffany 與 Maud |
| 20 | 野外的數據科學 | 實戰 | 真實世界中由數據科學推動的專案。 | 課程 | Nitya |
按照以下步驟在 Codespace 中開啟此範例:
- 點選 Code 下拉選單,並選擇 Open with Codespaces。
- 在視窗下方選擇 + New codespace。 更多資訊,請參考GitHub 文件。
遵循以下步驟,使用您的本機電腦與 VSCode 中的 VS Code Remote - Containers 延伸功能,在容器中開啟此倉庫:
- 若您是首次使用開發容器,請確認您的系統符合前置需求(如已安裝 Docker),詳見快速入門文件。
使用此倉庫,您可選擇在獨立 Docker 卷中打開:
注意:此操作底層會使用 Remote-Containers 的 Clone Repository in Container Volume... 指令,將原始碼克隆至 Docker 卷,而非本地檔案系統。卷 是持久化容器資料的建議方式。
或打開本地已克隆或下載的倉庫副本:
- 將此倉庫克隆至本地檔案系統。
- 按 F1,選擇 Remote-Containers: Open Folder in Container... 指令。
- 選擇此資料夾的克隆副本,等待容器啟動,然後開始使用。
您可以使用 Docsify 離線瀏覽本文件。請 fork 此倉庫,並在您的本機安裝 Docsify,接著在此倉庫根目錄中輸入 docsify serve。網站將以本機端口3000提供服務:localhost:3000。
注意,筆記本文件無法用 Docsify 呈現,若需運行筆記本,請在 VS Code 中使用 Python 核心另行執行。
我們團隊還有其他課程!請參考:
遇到問題嗎? 請查看我們的故障排除指南,尋找常見問題的解決方案。
如果您在建立 AI 應用程式時遇到困難或有任何疑問,歡迎加入學習者與經驗豐富的開發者一起討論 MCP。這是一個支持您的社群,歡迎提問並自由分享知識。
如果您在開發過程中有產品回饋或發現錯誤,請造訪:
免責聲明:
本文件係使用 AI 翻譯服務 Co-op Translator 進行翻譯。雖然我們努力追求準確性,但請注意自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應被視為權威來源。對於重要資訊,建議採用專業人工翻譯。我們不對因使用本翻譯而引起的任何誤解或誤釋承擔責任。



