OpenAICloudflare Developer Platform2026/03/04 0:00

Workers AI - New conversion options for Markdown Conversion

要点だけを先に読めるように短く再構成したセクションです。

元記事

Quick Digest

要約

要点だけを先に読めるように短く再構成したセクションです。

openaijamodel: gpt-5-mini-2025-08-07

Workers AI: Markdown Conversion に新しい変換オプションを追加

Key Points

  • 画像説明の言語指定
  • HTMLセレクタ抽出
  • PDFメタデータ除外

Summary

Workers AI の Markdown Conversion が conversionOptions を受け取り、ファイル種別ごとに変換結果を細かく制御できるようになりました。主なオプションは以下です:

  • Images: AI生成の画像説明の言語を指定(image.descriptionLanguage)。
  • HTML: CSSセレクタで抽出対象を指定、またはホスト名を与えて相対リンクを解決(html.cssSelector / html.hostname)。
  • PDF: 出力からメタデータを除外(pdf.excludeMetadata)。

SDK(env.AI.toMarkdown)と REST API の両方で利用可能です。簡単な例は以下を参照してください。

Key Points

  • SDK 例(JavaScript/TypeScript): await env.AI.toMarkdown({ name: "page.html", blob: new Blob([html]) }, { conversionOptions: { html: { cssSelector: "article.content" }, image: { descriptionLanguage: "es" } } })
  • REST 例: curl https://api.cloudflare.com/client/v4/accounts/{ACCOUNT_ID}/ai/tomarkdown -H 'Authorization: Bearer {API_TOKEN}' -F 'files=@index.html' -F 'conversionOptions={"html": {"cssSelector": "article.content"}}'
  • 実務上の注意: html.cssSelector は抽出対象の要素を正確に指定すること、descriptionLanguage は言語コード(例: es)を使用、pdf.excludeMetadata は真偽値で制御します。短い設定で出力を最適化できます。

Full Translation

翻訳

原文の流れを保ったまま読める翻訳セクションです。

openaijamodel: gpt-5-mini-2025-08-07

Workers AI - Markdown Conversion の新しい変換オプション

Workers AI - Markdown Conversion の新しい変換オプション

Markdown Conversion サービスで、ファイルタイプごとの処理を conversionOptions オブジェクトを渡してカスタマイズできるようになりました。

利用可能なオプション

  • Images: AI生成の画像説明の言語を設定できます。
  • HTML: CSS セレクタで特定のコンテンツを抽出する、または相対リンクを解決するためのホスト名を指定できます。
  • PDF: 出力からメタデータを除外できます。

env.AI バインディングの使用例

JavaScript

await env.AI.toMarkdown(
  { name: "page.html", blob: new Blob([html]) },
  {
    conversionOptions: {
      html: { cssSelector: "article.content" },
      image: { descriptionLanguage: "es" },
    },
  },
);

TypeScript

await env.AI.toMarkdown(
  { name: "page.html", blob: new Blob([html]) },
  {
    conversionOptions: {
      html: { cssSelector: "article.content" },
      image: { descriptionLanguage: "es" },
    },
  },
);

REST API の呼び出し例

ターミナル:

curl https://api.cloudflare.com/client/v4/accounts/{ACCOUNT_ID}/ai/tomarkdown \
 -H 'Authorization: Bearer {API_TOKEN}' \
 -F 'files=@index.html' \
 -F 'conversionOptions={"html": {"cssSelector": "article.content"}}'

詳しくは Conversion Options を参照してください。