Python - 画像よりテキスト抽出 - 準備


クラウディア 


1. 概要
2. 抽出エンジン
3. ライブラリ

1. 概要

 作成に必要なものを準備します。  さすがに、ここまでに、「python」はインストールしているものとして。  今回使う、「python」は。

python --version

Python 3.12.10

2. 抽出エンジン

 画像からテキストを抽出するエンジンとして、フリーの「Tesseract OCR」を使います。  下記からダウンロードしてインストールします。
Home · UB-Mannheim/tesseract Wiki
 2026年6月10日時点で、バージョンは、「5.5.0.20241111」でした。  ダウンロードしてインストールします。  インストーラを開いて。  悲しいかな、選択肢に日本語がないので、このまま「OK」

 「Next」


 「I Agree」


 「Next」


 ここで、「Additional script data」「Additional Language data」で「Japanese」関連と他に使いそうなものはチェックをいれておきます。
 チェックしたら、「Next」


 「Next」


 「Install」


 「Next」


 「Finish」


 これで、「Tesseract OCR」のインストールは完了です。

3. ライブラリ

 必要となる「python」のライブラリをインストールしておきます。

pip install pillow pytesseract tkinterdnd2

audiobook.jp
AbemaTV 無料体験
アフィリエイトのアクセストレード
TikTok Shop 【リピート用プログラム】
EaseUS
ベルリッツ
それがだいじWi-Fi
健康サポート特集
ネットオークションの相場、統計、価格比較といえばオークファン
サウンドハウス
Amazonギフトカード
5G CONNECT
ハイスピードプラン
EMEET 1
JETBOY
U-NEXT
earthcar(アースカー)
葬送のフリーレン Prime Video
薬屋の独り言
損保との違い
【usus ウズウズ】