- アップロード無し
- ローカル処理
- オフライン対応
- 自動クリーンアップ
convert / PDF をテキストに
PDF をテキストに
本文を .txt として抽出します。
PDF をファイルトレイに追加してください。
他のツールを探す
方法論と技術的透明性
使用ライブラリ
- pdf-lib — PDF構築・編集のコアロジック
- pdf.js — PDFレンダリングとページラスタライズ
メモリ管理戦略
各操作完了後、URL.revokeObjectURL()を即座に呼び出します。pdf.jsのドキュメントハンドルはpdfDoc.destroy()で破棄され、Workerはコンポーネントのアンマウント時または処理完了時に終了されます。
ファイルを保存しないため、恒久的な保存は保証されません。パスワード保護されたPDFのローカル処理はサポートされていません。
Key Features
pdf.js text layer extraction
Extracts the embedded text layer from digitally created PDFs with full UTF-8 support.
One-click .txt download
The extracted content is saved as a plain .txt file with page breaks indicated by section dividers.
Instant preview
Read the extracted text in the browser before downloading to verify the content.
Common Use Cases
Handy for feeding PDF content into LLMs, building full-text search indexes, copying long passages into word processors, or auditing the accessibility of a document.
Frequently Asked Questions
- Does it work on scanned PDFs?
- No. Scanned PDFs contain images, not a text layer. Use an OCR tool first, then extract text here.
- Is rich formatting preserved?
- No. Only the raw text characters are extracted. Fonts, colours, columns, and layout are not preserved in the .txt output.
- What languages are supported?
- Any language present in the PDF's embedded text layer is supported — the extraction is character-level, not language-specific.