大規模言語モデル入門 山田 育矢 (監修), 鈴木 正敏 (著), 山田 康輔 (著), 李凌寒 (著) 出版社 : 技術評論社 (2023/7/29) ISBN-10 : 4297136333 ISBN-13 : 978-4297136338本の情報: Amazon Japan (Amazonの説明より抜粋) 大規模言語モデルの理論と実装の両方を解説した入門書。大規模言語モデルの技術や自然言語処理の課題について理解し、実際の問題に対処できるようになることを目指す。 本の情報: 技術評論社 サポートページ(ソースコード、正誤表含む): github 学内のみアクセス可: ソースコード (zipファイル  展開) 個人メモ(nitta) |
前半では、word2vec から ChatGPT に至るまでの技術的な変遷を系統立てて理解する。
後半では、代表的な自然言語処理タスクについて transformers などを使って手を動かしながら、 自然言語処理モデルの開発を学ぶ。
目次