电子书《SpeechandLanguageProcessing》(语音与语

蚁工厂 2026-01-07 23:02:36

电子书《Speech and Language Processing》(语音与语言处理)的第三版刚发布啦web.stanford.edu/~jurafsky/slp3/600多页的大部头。作者Daniel Jurafsky,他是 NLP 领域的泰斗级人物,目前任教于斯坦福大学。James H. Martin,任教于科罗拉多大学博尔德分校。第三版相比之前的版本进行了彻底的重写,以反映深度学习和大语言模型(LLM)在 NLP 领域的统治地位。目前的内容分为两卷: 第一卷:大语言模型 (Large Language Models) 这部分是本书的核心更新,涵盖了现代 NLP 的基础和前沿技术: 基础:文本处理(词与Token)、N元语法、逻辑回归、词嵌入(Embeddings)。 深度学习架构:神经网络、Transformer(核心章节)、RNNs 和 LSTMs。 大模型技术:大语言模型(LLMs)、掩码语言模型(如 BERT)、后训练(Post-training)(包括指令微调、对齐、DPO等)、RAG(检索增强生成)。 语音与应用:机器翻译、语音识别(ASR)、语音合成(TTS)。 第二卷:标注语言结构 (Annotating Linguistic Structure) 这部分涵盖了传统的 NLP 任务和语言学结构分析: 序列标注(词性标注、命名实体识别)。 句法分析(成分句法、依存句法)。 信息抽取(关系、事件)、语义角色标注。 共指消解、篇章连贯性、对话结构等。 附录 包含隐马尔可夫模型(HMM)、朴素贝叶斯等经典算法。AI创造营科技先锋官

0 阅读:0
蚁工厂

蚁工厂

感谢大家的关注