LLM

#ai #機械学習 #自然言語処理

Large Language Model（大規模言語モデル）。大量のテキストデータで学習した、自然言語を理解・生成するAIモデル。

主要な特徴

コンテキスト学習: プロンプトに含まれる情報から学習
Few-shot学習: 少数の例から汎化
多様なタスク対応: 翻訳、要約、コード生成など

コンテキストウィンドウの制約

ワーキングメモリと同様、一度に処理できる情報量に上限がある。人間の認知負荷と類似した制約。

ソフトウェア開発への応用

コードベースの理解、コード生成、レビュー支援など。モジュール化され、限定されたコンテキストで理解可能なコードは、LLMにとっても扱いやすい。

非決定性

LLMの重要な特性として非決定性がある。同じプロンプトでも、実行のたびに異なる出力を生成する可能性がある。

これは仕様駆動開発において致命的な問題：

どれだけ詳細な仕様を書いても、再現性が保証されない
実装を見て修正するフィードバックループが不可欠

温度パラメータ（temperature）を0に設定しても、完全な決定性は保証されない。

代表的なモデル

GPT-4（OpenAI）
Claude（Anthropic）
Gemini（Google）

関連

コンテキスト
ワーキングメモリ
認知負荷
Claude Code
仕様駆動開発
フィードバック
Chain-of-Thought - 推論を明示的に行わせる手法
RAG - 外部知識を用いた生成