ドキュメントインポート
SOP Studio は DOCX や PDF ドキュメントから既存の標準作業手順書をインポートできます。LLM がドキュメントのコンテンツからデシジョンツリー構造を抽出し、ビジュアルエディターで確認・修正できます。
対応フォーマット
| フォーマット | 拡張子 | 備考 |
|---|---|---|
| Microsoft Word | .docx | テーブル、リスト、見出しが保持されます |
.pdf | テキストベースの PDF。スキャンされたドキュメントは非対応 |
仕組み
- アップロード -- インポートエリアにファイルをドラッグするか、「Import Document」をクリックします。
- パース -- SDK がクライアントサイドで
parseDocxまたはparsePdfを使用してドキュメントをパースします。 - 抽出 -- パースされたテキストが LLM(クライアントサイド、ユーザー自身の API キーを使用)に送信され、構造化されたデシジョンツリーが抽出されます。
- レビュー -- 抽出されたツリーがビジュアルエディターに読み込まれ、確認と調整ができます。
- 保存 -- 内容に問題がなければ、SOP をレジストリに保存します。
LLM の設定
ドキュメントの抽出には LLM を使用して、非構造化テキストを構造化デシジョンツリーに変換します。LLM 呼び出しは完全にクライアントサイドで実行されます -- SOP Studio がドキュメントを KnowledgePulse サーバーに送信することはありません。
設定パネルで LLM プロバイダーを設定します:
import type { LLMConfig } from "@knowledgepulse/sdk";
const config: LLMConfig = {
provider: "openai", // "openai" | "anthropic" | "ollama"
apiKey: "sk-...", // API キー(ローカルに保存)
model: "gpt-4o", // モデル識別子
baseUrl: undefined, // カスタムエンドポイント(Ollama の場合は必須)
temperature: 0.2, // 低いほど抽出が確定的に
};
対応プロバイダー
| プロバイダー | モデル | ローカル? |
|---|---|---|
| OpenAI | gpt-4o、gpt-4o-mini | いいえ |
| Anthropic | claude-sonnet-4-20250514、claude-haiku-4-20250414 | いいえ |
| Ollama | 任意のローカルモデル | はい |
SDK 関数
ドキュメントインポートパイプラインは3つの SDK 関数を使用します:
parseDocx(buffer: ArrayBuffer): Promise<ParseResult>
DOCX ファイルをパースし、構造化テキストコンテンツを返します。
import { parseDocx } from "@knowledgepulse/sdk";
const buffer = await file.arrayBuffer();
const result = await parseDocx(buffer);
console.log(result.text); // プレーンテキストコンテンツ
console.log(result.sections); // 見出しベースのセクション
console.log(result.tables); // 抽出されたテーブル
parsePdf(buffer: ArrayBuffer): Promise<ParseResult>
PDF ファイルをパースし、構造化テキストコンテンツを返します。
import { parsePdf } from "@knowledgepulse/sdk";
const buffer = await file.arrayBuffer();
const result = await parsePdf(buffer);
extractDecisionTree(parseResult: ParseResult, config: LLMConfig): Promise<ExtractionResult>
パースされたドキュメントコンテンツを設定済みの LLM に送信し、構造化デシジョンツリーを返します。
import { extractDecisionTree } from "@knowledgepulse/sdk";
const extraction = await extractDecisionTree(result, config);
console.log(extraction.name); // 検出された SOP 名
console.log(extraction.domain); // 検出されたドメイン
console.log(extraction.decision_tree); // ExpertSOP decision_tree 配列
console.log(extraction.confidence); // 0.0 ~ 1.0
console.log(extraction.warnings); // 抽出の問題点
レビューワークフロー
抽出後、デシジョンツリーはビジュアルインジケーター付きでエディターに読み込まれます:
| インジケーター | 意味 |
|---|---|
| 緑のアウトライン | 高信頼度の抽出(0.8 以上) |
| 黄色のアウトライン | 中信頼度(0.5--0.8)、レビューを推奨 |
| 赤のアウトライン | 低信頼度(0.5 未満)、手動編集が必要な可能性 |
各ノードのプロパティを確認し、抽出エラーを修正し、不足している接続を追加してから保存してください。
ヒント
- ドキュメントの構造化 -- 番号付きステップ、見出し、テーブルを含む SOP はより良い抽出結果を生成します。
- 低い temperature を使用 -- 0.1--0.2 の temperature はより一貫したデシジョンツリーを生成します。
- 必ずレビュー -- LLM の抽出は完璧ではありません。レジストリに保存する前に必ず結果を確認してください。