电子书《IntroductiontoMachineLearningSys

蚁工厂 2025-12-30 10:00:24

电子书《Introduction to Machine Learning Systems》(机器学习系统导论)github.com/harvard-edge/cs249r_book这个 GitHub 仓库(harvard-edge/cs249r_book)托管的是一本关于机器学习系统工程的开源教科书,以及相关的配套动手实践框架。该项目起源于哈佛大学 Vijay Janapa Reddi 教授开设的 CS249r 课程,现在已经发展成为一个支持全球课堂和独立学习者的教育项目。本书旨在弥补“算法”与“系统”之间的鸿沟。很多课程教学生如何训练模型(如 CNN、Transformer),但很少有课程教如何设计支撑这些模型在实际中运行的系统。 本书教你如何思考机器学习与系统工程的交叉领域,例如: 如何将大型模型塞进资源受限的设备(内存限制)? 如何利用硬件加速器(GPU/TPU)降低推理延迟? 如何在保护隐私的前提下进行端侧学习(On-device Learning)?全书分为六大部分,系统地涵盖了从基础到前沿的内容: Part I: Foundations (基础) - 核心概念、深度学习入门、模型架构。 Part II: Design (设计) - 工作流、数据工程、框架、训练。 Part III: Performance (性能) - 高效 AI、优化技术、硬件加速、基准测试。 Part IV: Deployment (部署) - MLOps、端侧学习、隐私、鲁棒性。 Part V: Trust (信任) - 负责任的 AI、可持续 AI。 Part VI: Frontiers (前沿) - 新兴趋势与未来方向。这个项目不仅仅是一本书,它提供了一个完整的“阅读-探索-构建-部署”的学习路径: READ (读):在线阅读教科书 (mlsysbook.ai),理解理论和最佳实践。 EXPLORE (探索):通过软件 Co-Labs 实验(计划 2026 年推出),调整参数(如批处理大小、精度)来观察延迟、内存和准确率的权衡。 BUILD (构建):使用 TinyTorch 框架。这是一个从零开始构建的 ML 框架,让你通过亲手实现自动微分(Autograd)、优化器和注意力机制,来深入理解 PyTorch 或 TensorFlow 的内部工作原理。 DEPLOY (部署):硬件实验室。将模型部署到真实的边缘设备(如 Arduino, Raspberry Pi)上,面对真实的功耗、内存和延迟约束。科技先锋官AI创造营

0 阅读:0
蚁工厂

蚁工厂

感谢大家的关注