openaijamodel: gpt-5-mini-2025-08-07
Workers AI: Markdown Conversion に新しい変換オプションを追加
Key Points
- 画像説明の言語指定
- HTMLセレクタ抽出
- PDFメタデータ除外
Summary
Workers AI の Markdown Conversion が conversionOptions を受け取り、ファイル種別ごとに変換結果を細かく制御できるようになりました。主なオプションは以下です:
- Images: AI生成の画像説明の言語を指定(
image.descriptionLanguage)。 - HTML: CSSセレクタで抽出対象を指定、またはホスト名を与えて相対リンクを解決(
html.cssSelector/html.hostname)。 - PDF: 出力からメタデータを除外(
pdf.excludeMetadata)。
SDK(env.AI.toMarkdown)と REST API の両方で利用可能です。簡単な例は以下を参照してください。
Key Points
- SDK 例(JavaScript/TypeScript):
await env.AI.toMarkdown({ name: "page.html", blob: new Blob([html]) }, { conversionOptions: { html: { cssSelector: "article.content" }, image: { descriptionLanguage: "es" } } }) - REST 例:
curl https://api.cloudflare.com/client/v4/accounts/{ACCOUNT_ID}/ai/tomarkdown -H 'Authorization: Bearer {API_TOKEN}' -F 'files=@index.html' -F 'conversionOptions={"html": {"cssSelector": "article.content"}}' - 実務上の注意:
html.cssSelectorは抽出対象の要素を正確に指定すること、descriptionLanguageは言語コード(例:es)を使用、pdf.excludeMetadataは真偽値で制御します。短い設定で出力を最適化できます。