AIとは何か?
人工知能(AI)は、パターンを認識し、データから学習し、有用な出力を生成できるソフトウェアの広範なカテゴリです。日常的な場面でAIを目にしたことがあるでしょう:
- マップアプリが交通渋滞を避けてルートを変更する時
- 銀行が購入を「異常」としてフラグを立てる時
- カスタマーサポートのチャットボットが一般的な質問に答える時
AIは一つの単一ツールではなく、カテゴリです。そのカテゴリ内にはモデルがあります:データから学習し、学んだことを新しい状況に適用する訓練されたシステムです。一部のモデルは音声、視覚、または予測に特化しています。
あなたはおそらくChatGPTのような対話型AIツールを使用してAIの旅を始めているでしょう。ChatGPTの背後にあるモデルは言語に特化しており、これらは大規模言語モデルと呼ばれます。
大規模言語モデルの仕組みを理解する
大規模言語モデル(LLM)は言語を扱うように設計されたモデルです。多くのソースからの大量のテキストからパターンを学習し、有用な方法でテキストを生成・変換できます。
LLMは人間のように物事を「知っている」わけではありません。代わりに、文脈に基づいて最も可能性の高い次の言語の断片を予測します。
時間の経過とともに、コンピューティングパワー、訓練方法、大規模データセットへのアクセスの進歩により、より大きく、より能力の高い大規模言語モデルを構築することが可能になりました。
OpenAIやその他の最先端研究ラボは、これらのモデルを提供の中核部分として構築し、ユーザー向け製品(ChatGPTやCodexなど)やAPI経由で利用可能にしています。APIにより、開発者はこれらのモデルを使用して独自のAIツールを構築し、既存のソフトウェアにAIを統合できます。
モデルの時間経過による進化
新しいモデルは、訓練され、内部評価と安全性テストに合格した時に、これらの研究ラボから利用可能になります。
AIモデルが「訓練された」と聞く場合、通常は2つの段階を指します—誰かが学習し、仕事が上達することのように考えてください。
事前訓練
最初の段階は事前訓練で、モデルが膨大な量のテキストから一般的なパターンを学習し、要約、下書き、翻訳、説明などの幅広いスキルを身につけます。新入社員が数週間かけてマニュアル、優秀な作品の例、過去のプロジェクト、FAQなど、読めるものすべてを読んで、仕事の「形」を理解するようなものです。
後訓練
今度は「従業員」が実際に仕事を始め、「マネージャー」がコーチします:より明確に、良いフォローアップ質問をし、適切なトーンに合わせ、会社のポリシーに従う。これが後訓練です。
この段階は、モデルがより確実に指示に従い、有用なスタイルでコミュニケーションを取り、困難な状況をより適切に処理するのに役立ちます。後訓練は安全性チェックが強調される段階でもあります—有害な出力を減らし、望ましくない要求を避け、トピックが敏感または不確実な場合により慎重に応答するように設計された訓練です。
モデルが更新・訓練されると、トーンや応答の変化に気づくかもしれません。一貫した結果を得たい場合は、目標、対象者、形式、制約を明確にし、安全性や不確実性が関わる場合にモデルがより慎重になることを期待してください。
推論モデルと非推論モデル
異なるモデルは、速度、深度、複数ステップの指示にどれだけ注意深く従うかなど、異なるトレードオフに調整されています。
非推論モデル
一部は日常的なタスク(下書き、要約、書き直し、ブレインストーミング)に対して迅速かつスムーズに応答するように設計されています。
非推論モデル(「Instant」とラベル付けされることもある)は、高速で流暢な出力に最適化されています。タスクが単純で、主に勢いが欲しい場合の良いデフォルトです:メモをメッセージに変換、文言を洗練、選択肢を生成、要点を抽出など。
推論モデル
その他は答える前に問題をより多くの計算で考え抜くように設計されており、より困難で複数ステップの作業の信頼性を向上させることができます。
推論モデル(「Thinking」とラベル付けされることもある)は、計画、複雑な分析、困難なデバッグ、制約やエッジケースのある決定など、意図的で段階的な問題解決により優れるように訓練されています。時間はかかるかもしれませんが、複数の動く部分を追跡し、浅い間違いを避けることに優れていることが多いです。
始めたばかりの場合、モデルの選択について心配する必要はありません—デフォルトのChatGPT体験は自動切り替えするように設計されているため、設定ではなく質問に集中できます。
時間が経つにつれて、好み(速度対深度、迅速な下書き対慎重な分析)を学ぶと、オプションのコントロールを試し始めることができます:例えば、ほとんどの時間はAutoを選択し、タスクが複雑または重要な場合にThinkingに切り替えるなど。
まとめ
シンプルな階層は以下の通りです:
- AI = 全体的な分野
- モデル = 特定のタスクを実行する訓練されたシステム
- 大規模言語モデル(LLM) = 言語の理解と生成に焦点を当てたモデル、AI研究ラボによって時間をかけて訓練される
- ChatGPT = LLMを効果的に使用するのに役立つ製品
この全体像を頭に入れておけば、ChatGPTのようなツールで素晴らしい結果を得る方法を学ぶ準備が整います—まずは望む結果を得るためにどのように話しかけるかから始まります。
ChatGPTの使い始めとプロンプトエンジニアリングについて学ぶ。