LLM
Large Language Model(大規模言語モデル)。大量のテキストデータで学習した、自然言語を理解・生成するAIモデル。
主要な特徴
- コンテキスト学習: プロンプトに含まれる情報から学習
- Few-shot学習: 少数の例から汎化
- 多様なタスク対応: 翻訳、要約、コード生成など
コンテキストウィンドウの制約
ワーキングメモリと同様、一度に処理できる情報量に上限がある。人間の認知負荷と類似した制約。
ソフトウェア開発への応用
コードベースの理解、コード生成、レビュー支援など。モジュール化され、限定されたコンテキストで理解可能なコードは、LLMにとっても扱いやすい。
非決定性
LLMの重要な特性として非決定性がある。同じプロンプトでも、実行のたびに異なる出力を生成する可能性がある。
これは仕様駆動開発において致命的な問題:
- どれだけ詳細な仕様を書いても、再現性が保証されない
- 実装を見て修正するフィードバックループが不可欠
温度パラメータ(temperature)を0に設定しても、完全な決定性は保証されない。
代表的なモデル
- GPT-4(OpenAI)
- Claude(Anthropic)
- Gemini(Google)
関連
- コンテキスト
- ワーキングメモリ
- 認知負荷
- Claude Code
- 仕様駆動開発
- フィードバック
- Chain-of-Thought - 推論を明示的に行わせる手法
- RAG - 外部知識を用いた生成