研究リリース — 2026年4月16日
Introducing GPT‑Rosalind(ライフサイエンス研究向け)
新たに目的特化型モデルを導入し、科学研究と創薬を加速します。
- Request access Learn more Share
本日、我々は GPT‑Rosalind を発表します。これは生物学、創薬、トランスレーショナルメディシンの研究を支援するために構築された最先端の推論モデルです。ライフサイエンス向けモデルシリーズは科学的ワークフローに最適化されており、改善されたツール利用能力と化学、タンパク質工学、ゲノミクスにわたる深い理解を組み合わせています。
新薬が米国でターゲット発見から規制承認に至るまでには、平均して約10~15年を要します。発見の初期段階で得られる改善は、下流におけるより良いターゲット選択、より強固な生物学的仮説、高品質な実験へと累積的に寄与します。ライフサイエンスの進展は、基礎科学の難しさだけでなく、研究ワークフロー自体の複雑さによっても制約されています。研究者は大量の文献、専門データベース、実験データ、変化する仮説を横断して新しいアイデアを生成・評価する必要があり、これらのワークフローはしばしば時間集約的で断片化され、スケールしにくいものです。
我々は、高度なAIシステムが研究者のワークフローをより速く進める手助けができると考えています。単に既存の作業を効率化するだけでなく、研究者がより多くの可能性を探索し、見落とされがちな関連性を浮き彫りにし、より良い仮説に早く到達することを助けます。本モデルは、エビデンスの統合、仮説生成、実験計画、その他のマルチステップな研究タスクをサポートすることで、発見の初期段階を加速することを目指しています。長期的には、これらのシステムがライフサイエンス組織にとって、そうでなければ到達し得なかったブレークスルーをより高い成功率でもたらす可能性があります。
GPT‑Rosalind は現在、研究プレビューとして資格のある顧客向けに ChatGPT、Codex、API を通じて当社の trusted access プログラムを通じて利用可能です。また、Codex 用の Life Sciences research plugin を無償で公開し、モデルを50以上の科学ツールやデータソースに接続できるようにしました。Amgen、Moderna、Allen Institute、Thermo Fisher Scientific などの顧客と協力して、研究と発見を加速するワークフローへの GPT‑Rosalind の適用を進めています。
モデル名はロザリンド・フランクリン(Rosalind Franklin)に由来します。彼女の厳密な研究はDNAの構造解明を助け、現代分子生物学の基礎を築きました。
生データから根拠に基づく発見決定まで、本目的特化型モデルが研究ワークフローをどのように加速するかをご覧ください。
科学的ワークフローのために設計
GPT‑Rosalind ライフサイエンスモデルシリーズは、公開されたエビデンス、データ、ツール、実験を横断する現代の科学的作業のために構築されています。我々の評価では、分子、タンパク質、遺伝子、経路、疾患に関連する生物学をまたいだ推論を必要とするタスクで最良の性能を発揮し、文献レビュー、配列から機能の解釈、実験計画、データ解析などのマルチステップワークフローにおける科学ツールやデータベースの利用においてより効果的でした。
これは GPT‑Rosalind ライフサイエンスモデルシリーズの最初のリリースであり、長期かつツール重視の科学的ワークフローにおける生化学的推論能力の最前線を引き続き拡張していきます。OpenAI の計算インフラは、実際の科学タスクに対してさらに能力を高めたドメインモデルを継続的に学習、評価、改善することを可能にし、ワークフロー自体がより複雑になるにつれてこれらのシステムがより有用になることを支援します。
エビデンスに基づく発見インサイトから高インパクトな実験まで、我々のソリューション群が研究ワークフローにどのように測定可能な改善をもたらすかをご確認ください。
顧客とエコシステム
我々は主要な製薬、バイオテクノロジー、研究機関、およびライフサイエンステクノロジー組織と協力し、発見を促進するワークフローへの GPT‑Rosalind の適用を進めています。
- Amgen
- Novo Nordisk
- Thermo Fisher Scientific
- Moderna
- Oracle Health and Life Sciences
- NVIDIA
- Allen Institute
- Benchling
- UCSF School of Pharmacy
「ライフサイエンス分野では、あらゆる段階で精度が求められます。問いは高度に複雑で、データは非常に特異的、そして利害は極めて大きい。我々と OpenAI の独自の協業により、彼らの最先端の能力とツールを新しく革新的な方法で適用し、患者に医薬品を届ける方法を加速する可能性があります。」
— Sean Bruich, Senior Vice President of Artificial Intelligence and Data, Amgen
性能評価
GPT‑Rosalind は科学的発見と産業研究に不可欠な一連の能力について評価されました。これらの評価は、化学反応機構、タンパク質構造、変異影響と相互作用、DNA配列の系統学的解釈など、科学サブドメインにまたがるコア推論を測定します。また、モデルが実験出力を解釈し、専門家に関連するパターンを特定し、外部情報を統合してフォローアップ実験を設計できるかどうかを評価します。さらに、モデルが適切な計算ツール、データベース、ドメイン固有の機能を選択・使用して推論を拡張できるかもテストします。
総合すると、これらの評価は科学研究のエンドツーエンドのプロセス全体での進展を示しており、研究者が難しい発見タスクを進める手助けをする能力が強化されていることを示唆します。
主な評価領域:
- Organic chemistry
- Protein understanding
- Genomics
- Experimental design and analysis
- Tool usage
例:プロンプト
I am planning a base-promoted SNAr coupling of 1-(pyridin-3-yl)ethanol with 1-fluoro-2-nitrobenzene with the goal of synthesizing 1-(pyridin-3-yl)ethyl 2-nitrophenyl ether. I found several patents that describe room-temperature O-arylation of alcohols in DMF/Cs2CO3, but the reaction is taking longer than I would like. How can I improve this reaction? Help me find any relevant literature or patents as well.
このようなマルチステップで専門的な化学プロンプトに対して、モデルは実験条件の最適化案、関連する文献や特許の探索方針、潜在的な副反応の識別などを提示できるように設計されています。
業界評価
GPT‑Rosalind は一連の公開ベンチマークで評価されました。BixBench(実世界のバイオインフォマティクスとデータ解析を想定したベンチマーク)では、公開スコアを持つモデルの中で先導的なパフォーマンスを達成しました。LABBench2(文献検索、データベースアクセス、配列操作、プロトコル設計など幅広い研究タスクを測るベンチマーク)では、11タスク中6タスクで GPT‑5.4 を上回りました。最も顕著な改善は CloningQA に見られ、これは分子クローニングプロトコル用のDNAおよび酵素試薬のエンドツーエンド設計を要求するタスクです。
また、AI設計による遺伝子治療で先駆的な Dyno Therapeutics と協力して、未公開かつ汚染されていない配列を用いた RNA の配列→機能予測および生成タスクでモデルを評価しました。性能は AIバイオ分野の人間専門家の57の履歴スコアと比較されました。Codex アプリ内で直接評価したところ、ベスト・オブ・テン(best-of-ten)モデル提出は予測タスクで人間専門家の95パーセンタイルを上回り、配列生成タスクではおおよそ84パーセンタイルでした。
これらの評価は、研究者が日常的に依存するワークフロー、すなわち証拠生成、複雑データ解析、そして実行可能な生物学的結論へ向けた進展に対する性能の有意な信号を提供します。
研究者が使うツールへの接続
研究者は Codex 用の新しい Life Sciences research plugin(現在 GitHub で利用可能)を使用できます。このパッケージは、ヒト遺伝学、機能ゲノミクス、タンパク質構造、生化学、臨床エビデンス、および公開研究の発見など、一般的な研究ワークフロー向けのモジュール化されたスキルを幅広く含んでいます。これらのスキルは、曖昧で複雑なマルチステップの問いをより効果的に処理するためのオーケストレーション層として機能します。
- 50以上の公開マルチオミクスデータベース、文献ソース、バイオロジーツールへのアクセスを提供
- タンパク質構造の検索、配列検索、文献レビュー、公開データセットの探索など、よくある再現可能なワークフローの柔軟な出発点を提供
対象となる Enterprise ユーザーは、より深い生物学的推論のために GPT‑Rosalind とともにこのプラグインを研究ワークフローで活用できます。一方で、全てのユーザーは当社のメインラインモデルと共にこのプラグインパッケージを利用できます。
Trusted access(信頼あるアクセス)
我々は、これらの機能を人類の健康向上に寄与する立場にある研究者や組織に提供したいと考えていますが、一方で生物学的悪用に対する強固な防護も維持します。ライフサイエンスモデルは、まず米国の資格のある Enterprise 顧客向けに trusted-access の展開構造で開始され、適格性、アクセス管理、組織的ガバナンスに関する管理が実装されます。
同時に、一連のコネクタと Life Sciences Research Plugin をより広く提供することで、研究者が当社のメインラインモデルをライフサイエンス研究タスクに対してより効果的に利用できるようにします。ライフサイエンスモデルは、企業向けの高度なセキュリティ制御と強化されたアクセス管理下で開発されており、管理された研究環境での専門的な科学利用を可能にします。
アクセスは次の3つの中核原則に基づき評価されます:
- 有益な利用(beneficial use)
- 強力なガバナンスと安全性監視
- 企業グレードのセキュリティによる制御されたアクセス
実務上、参加組織は正当な科学研究を行い明確な公益があること、適切なガバナンス・コンプライアンス・濫用防止の統制を維持していること、そして安全に管理された環境内で承認されたユーザーにアクセスを限定していることが求められます。組織はまたライフサイエンス研究プレビューの利用規約に同意し、OpenAI の使用ポリシーに準拠する必要があります。オンボーディングや継続的参加の一環として追加情報の提供を求める場合があります。
利用開始
組織は資格および安全審査プロセスを通じてアクセスをリクエストできます。研究プレビュー期間中、本モデルの利用は既存のクレジットやトークンを消費しません(濫用防止のためのガードレールの対象となります)。プログラム拡大に伴う価格や利用可能性の詳細は追って共有します。
ライフサイエンスモデルは、技術的能力と運用管理の双方が求められる環境で、科学組織がより高品質な業務をより速く行えるよう設計されています。当社の専任ライフサイエンスチームおよび McKinsey & Company、Boston Consulting Group (BCG)、Bain & Company などの助言パートナーは、組織が高インパクトなユースケースを特定し、モデルをエンタープライズ環境に統合し、測定可能な成果を推進するのを支援します。
OpenAI Life Sciences がどのように貴社の業務を支援できるかを検討したい場合は、当社の Life Sciences チームにお問い合わせください。
今後の展望
これはライフサイエンスモデルシリーズの最初のリリースであり、我々は人間の健康からより広範な生物学研究に至るまで、社会にとって重要な分野で科学的発見を加速する AI を構築するという長期的なコミットメントの始まりと位置づけています。今後もモデルの生物学的推論を改善し、ツール重視かつ長期的な研究ワークフローへのサポートを拡大し、主要な科学機関と緊密に協力して実世界での影響を評価していきます。
その一環として、我々は Los Alamos National Laboratory のような国立研究所との継続的なパートナーシップを含め、AIガイドによるタンパク質や触媒設計、ならびに機能特性を保持または改善しながら生物学的構造を改変する能力の評価を進めています。
時間をかけて、これらのシステムは発見におけるますます有能なパートナーになると期待しています — 研究者が問いからエビデンスへ、エビデンスから洞察へ、洞察から患者のための新しい治療へとより速く進める手助けをするでしょう。
さらに読む
- View all
- Inside our approach to the Model Spec — Research (Mar 25, 2026)
- Improving instruction hierarchy in frontier LLMs — Research (Mar 10, 2026)
- Reasoning models struggle to control their chains of thought, and that’s good — Research