Skip to content

Latest commit

 

History

History
264 lines (186 loc) · 25.5 KB

File metadata and controls

264 lines (186 loc) · 25.5 KB

初學者數據科學課程綱要

在 GitHub Codespaces 開啟

GitHub 授權 GitHub 貢獻者 GitHub 問題 GitHub 拉取請求 歡迎 PR

GitHub 觀察者 GitHub 派生 GitHub 星標

Microsoft Foundry Discord

Microsoft Foundry 開發者論壇

微軟的 Azure Cloud Advocates 很高興提供一個為期10週、共20課的數據科學課程。每課包含課前及課後小測驗、完成課程的書面指引、解決方案和作業。我們採用基於項目的教學法,讓你在實作中學習,是讓新技能「牢記」的有效方式。

衷心感謝我們的作者們: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison

🙏 特別感謝 🙏 我們的 Microsoft 學生大使 作者、審核者和內容貢獻者, 尤其是 Aaryan Arora、Aditya GargAlondra SanchezAnkita SinghAnupam MishraArpita Das、ChhailBihari Dubey、Dibri NsoforDishita BhasinMajd SafiMax BlumMiguel CorreaMohamma Iftekher (Iftu) Ebne JalalNawrin TabassumRaymond Wangsa PutraRohit Yadav、Samridhi Sharma、Sanya SinhaSheena NarulaTauqeer Ahmad、Yogendrasingh Pawar 、Vidushi GuptaJasleen Sondhi

由 @sketchthedocs 繪製草圖筆記 https://sketchthedocs.dev
初學者數據科學 - 草圖筆記由 @nitya 繪製

🌐 多語言支援

透過 GitHub Action 支援(自動及持續更新)

阿拉伯語 | 孟加拉語 | 保加利亞語 | 緬甸語 | 中文(簡體) | 中文(繁體,香港) | 中文(繁體,澳門) | 中文(繁體,台灣) | 克羅地亞語 | 捷克語 | 丹麥語 | 荷蘭語 | 愛沙尼亞語 | 芬蘭語 | 法語 | 德語 | 希臘語 | 希伯來語 | 印地語 | 匈牙利語 | 印度尼西亞語 | 義大利語 | 日語 | 坎納達語 | 韓語 | 立陶宛語 | 馬來語 | 馬拉雅拉姆語 | 馬拉地語 | 尼泊爾語 | 奈及利亞皮欽語 | 挪威語 | 波斯語(法爾西語) | 波蘭語 | 葡萄牙語(巴西) | 葡萄牙語(葡萄牙) | 旁遮普語(古爾穆克希) | 羅馬尼亞語 | 俄語 | 塞爾維亞語(西里爾字母) | 斯洛伐克語 | 斯洛文尼亞語 | 西班牙語 | 斯瓦希里語 | 瑞典語 | 他加祿語(菲律賓語) | 泰米爾語 | 泰盧固語 | 泰語 | 土耳其語 | 烏克蘭語 | 烏爾都語 | 越南語

想要本地端克隆?

本儲存庫包含50餘種語言翻譯,會大幅增加下載大小。若想不帶翻譯檔案克隆,可使用稀疏檢出:

Bash / macOS / Linux:

git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
cd Data-Science-For-Beginners
git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'

CMD(Windows):

git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
cd Data-Science-For-Beginners
git sparse-checkout set --no-cone "/*" "!translations" "!translated_images"

這樣讓你以更快的速度取得完成課程所需所有資源。

如欲增加其他翻譯語言,請參閱此處列出的支援語言清單 here

加入我們的社群

Microsoft Foundry Discord

我們目前正在進行 Discord AI 學習系列,歡迎了解並於 2025 年 9 月 18 日至 30 日加入我們:Learn with AI Series。你將學到使用 GitHub Copilot 進行數據科學的秘訣與技巧。

Learn with AI 系列

你是學生嗎?

開始使用以下資源:

  • 學生中心頁面 在此頁面,你會找到初學者資源、學生包甚至免費證書兌換券的取得方式。這是你想要加入書籤並定期查看的頁面,因為我們至少每月更換內容一次。
  • Microsoft Learn 學生大使 加入全球學生大使社群,這可能是你進入微軟的橋樑。

入門指南

📚 文件資料

👨‍🎓 學生專區

完全初學者:剛開始接觸數據科學?請先從我們的 初學者範例 開始!這些簡單且附有良好註解的範例,將幫助你在深入完整課程前,理解基本概念。 學生們:想要自行使用本課程,請複製整個倉庫,並自行完成練習,從課前小測驗開始。然後閱讀課程並完成其他活動。盡量透過理解課程來創建專案,而非直接複製解答程式碼;不過每個基於專案的課程都在 /solutions 目錄備有程式碼。另一個方式是和朋友組成學習小組,一同進行內容。進一步學習我們推薦使用 Microsoft Learn

快速開始:

  1. 查看 安裝指南 以設定你的環境
  2. 閱讀 使用指南 以學習如何使用課程
  3. 從第一課開始,按順序完成各課
  4. 加入我們的 Discord 社群 尋求支援

👩‍🏫 教師專區

教師:我們已包含一些建議說明如何使用此課程。歡迎您在討論區留下您的意見!

認識團隊

宣傳影片

動圖由 Mohit Jaisal 製作

🎥 點擊上方圖片觀看關於專案和創作者們的影片!

教學法

在設計本課程時,我們選擇了兩個教學原則:確保課程以專案為基礎,並包含頻繁的測驗。到本系列課程結束時,學生將學會資料科學的基本原理,包括倫理概念、資料準備、不同的資料處理方式、資料視覺化、資料分析、資料科學的實際應用案例等。

另外,課前的低壓力測驗可幫助學生設定學習主題的意圖,而課後的第二次測驗則確保持續記憶。此課程設計具彈性且有趣,可整體或部分學習。專案從簡單開始,並在十週的學習週期結束時逐漸增加難度。

請參閱我們的行為準則貢獻指南翻譯指南。歡迎您提供建設性的回饋!

每堂課包含:

  • 選用的手繪筆記
  • 選用的補充影片
  • 課前暖身測驗
  • 書面課程
  • 專案課程包含的逐步專案建置指引
  • 知識檢測
  • 挑戰題
  • 補充閱讀
  • 作業
  • 課後測驗

關於測驗的說明:所有測驗均位於 Quiz-App 資料夾中,共有40個,每個包含三個問題。測驗連結嵌入於課程中,但測驗應用程式可本地執行或部署至 Azure;請參考 quiz-app 資料夾中的說明。測驗正在逐步本地化。

🎓 初學者友善範例

剛接觸資料科學? 我們建立了特殊的範例目錄,包含簡單且詳盡註解的程式碼幫助您入門:

  • 🌟 Hello World - 您的第一個資料科學程式
  • 📂 資料載入 - 學習讀取與探索資料集
  • 📊 簡單分析 - 計算統計並尋找模式
  • 📈 基礎視覺化 - 創建圖表與圖形
  • 🔬 實務專案 - 從頭到尾完整工作流程

每個範例均包含詳細註解解說每步驟,適合完全的新手!

👉 從範例開始 👈

課程列表

 Sketchnote by @sketchthedocs https://sketchthedocs.dev
資料科學初學者:路線圖 - 手繪筆記由 @nitya
課程編號 主題 課程分組 學習目標 連結課程 作者
01 定義資料科學 介紹 了解資料科學的基本概念及其與人工智慧、機器學習和大數據的關聯。 課程 影片 Dmitry
02 資料科學倫理 介紹 資料倫理概念、挑戰與架構。 課程 Nitya
03 定義資料 介紹 資料的分類及其常見來源。 課程 Jasmine
04 統計與機率導論 介紹 使用機率與統計的數學技術來了解資料。 課程 影片 Dmitry
05 使用關聯式資料 資料處理 關聯式資料介紹及使用結構化查詢語言(SQL,發音為 “see-quell”)探索和分析關聯式資料的基礎。 課程 Christopher
06 使用 NoSQL 資料 資料處理 非關聯式資料介紹、種類及探索和分析文件型資料庫的基礎。 課程 Jasmine
07 使用 Python 資料處理 使用 Python 進行資料探索的基礎,包含 Pandas 等函式庫。建議具備 Python 程式基礎。 課程 影片 Dmitry
08 資料準備 資料處理 資料清理與轉換技術,應對缺失、不準確或不完整資料的挑戰。 課程 Jasmine
09 量化視覺化 資料視覺化 學習使用 Matplotlib 來視覺化鳥類資料 🦆 課程 Jen
10 資料分佈視覺化 資料視覺化 在區間內視覺化觀察與趨勢。 課程 Jen
11 比例視覺化 資料視覺化 視覺化離散和分組百分比。 課程 Jen
12 關係視覺化 資料視覺化 視覺化資料集及其變量間的連結和相關性。 課程 Jen
13 有意義的視覺化 資料視覺化 創造有價值視覺化的技巧與指導,有助於有效解決問題和獲得見解。 課程 Jen
14 資料科學生命週期導論 生命週期 資料科學生命週期介紹及其第一步驟:取得與提取資料。 課程 Jasmine
15 分析 生命週期 資料科學生命週期中著重於資料分析的階段。 課程 Jasmine
16 溝通 生命週期 資料科學生命週期中專注於以便於決策者理解的方式呈現資料洞見的階段。 課程 Jalen
17 雲端資料科學 雲端資料 介紹雲端資料科學及其好處。 課程 TiffanyMaud
18 雲端資料科學 雲端資料 使用低碼工具訓練模型。 課程 TiffanyMaud
19 雲端資料科學 雲端資料 使用 Azure 機器學習工作室部署模型。 課程 TiffanyMaud
20 實務資料科學 實務 實際世界中由資料科學驅動的專案。 課程 Nitya

GitHub Codespaces

按照以下步驟在 Codespace 中開啟此範例:

  1. 點擊 Code 下拉選單,選擇 Open with Codespaces。
  2. 在面板底部選擇 + New codespace。 欲了解更多,請參考GitHub 文件

VSCode 遠端容器

使用您的本機電腦和 VSCode 搭配 VS Code Remote - Containers 擴充功能,在容器中打開此儲存庫,步驟如下:

  1. 若您是首次使用開發容器,請確保系統符合先決條件(例如已安裝 Docker),請參考入門文件

使用此儲存庫,您可以選擇在獨立 Docker 卷中開啟儲存庫:

注意:底層將使用 Remote-Containers 的 Clone Repository in Container Volume... 指令,將原始碼克隆到 Docker 卷中,而非本地檔案系統。 是持久化容器資料的首選機制。

或是開啟本地克隆或下載的儲存庫副本:

  • 將儲存庫克隆至本地檔案系統。
  • 按 F1,選擇 Remote-Containers: Open Folder in Container... 指令。
  • 選擇剛剛克隆的資料夾,等待容器啟動,開始嘗試。

離線存取

您可以使用 Docsify 進行離線瀏覽此文件。將此儲存庫分叉,於本機安裝 Docsify,然後在本儲存庫根目錄輸入 docsify serve,網站將於本地主機的3000端口執行:localhost:3000

注意,筆記本不會透過 Docsify 呈現,當您需要執行筆記本時,請在 VS Code 中使用 Python 核心單獨執行。

其他課程

我們團隊也製作其他課程!歡迎參考:

LangChain

LangChain4j for Beginners LangChain.js 入門 LangChain 入門

Azure / Edge / MCP / Agents

AZD 入門 Edge AI 入門 MCP 入門 AI Agents 入門


生成式 AI 系列

生成式 AI 入門 生成式 AI (.NET) 生成式 AI (Java) 生成式 AI (JavaScript)


核心學習

機器學習入門 數據科學入門 人工智能入門 網絡安全入門 網頁開發入門 物聯網入門 XR 開發入門


Copilot 系列

Copilot 供 AI 配對編程 Copilot 供 C#/.NET Copilot 探險

尋求協助

遇到問題嗎? 請查看我們的 疑難排解指南 來尋找常見問題的解決方法。

如果你在建構 AI 應用程式時遇到阻礙或有任何疑問,歡迎加入 MCP 學習者與經驗豐富的開發者討論社群。這是一個支持性強的社區,任何問題都可提出,並且知識會自由分享。

Microsoft Foundry Discord

如果你有產品反饋或在建構過程中發現錯誤,請訪問:

Microsoft Foundry 開發者論壇


免責聲明
本文件係使用 AI 翻譯服務 Co-op Translator 翻譯而成。雖然我們致力於確保準確性,但請注意,自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應被視為權威版本。對於重要資訊,建議採用專業人工翻譯。我們不對因使用此翻譯而引起的誤解或曲解承擔任何責任。