# DeepMind
## 概要
DeepMind(現 Google DeepMind)は英国ロンドンを拠点とする人工知能研究機関であり、Google(Alphabet)の傘下にある。強化学習・大規模言語モデル・科学応用 AI など幅広い研究分野で著名な成果を出してきた。本 wiki では主に大規模言語モデル研究の文脈で登場する。(Source: [[@2022__arXiv__Training Compute-Optimal Large Language Models]])
## 大規模言語モデル研究
DeepMind は 2021〜2022 年にかけて以下の主要モデルを発表した:
- **Gopher (280B)**(Rae et al., 2021):MassiveText で約 3,000 億トークン訓練した 2,800 億パラメータの密なトランスフォーマー
- **Chinchilla (70B)**(Hoffmann et al., 2022):Gopher と同一計算予算で訓練した計算最適モデル。700 億パラメータ・1.4 兆トークン。(Source: [[@2022__arXiv__Training Compute-Optimal Large Language Models]])
Chinchilla の結果は「より大きなモデルを少ないデータで訓練する」という当時の業界のトレンドを覆し、[[計算最適訓練]]という概念を確立した。
## 関連
- エンティティ: [[Jordan Hoffmann]] / [[Sebastian Borgeaud]] / [[Arthur Mensch]]
- 概念: [[スケーリング則]] / [[計算最適訓練]]
- ソース: [[@2022__arXiv__Training Compute-Optimal Large Language Models]]
## 出典
- [[@2022__arXiv__Training Compute-Optimal Large Language Models]](著者所属、Table 1、§4 Chinchilla、Acknowledgements)