Googleドキュメントで画像ファイルから文字列を抜き取ってみる - saitodev.co

プログラミング教室

最近興味があることや肥料教室についてのメルマガを配信しています

Googleドキュメントで画像ファイルから文字列を抜き取ってみる

更新日:2025-11-12 (作成日:2017-11-30)

コンピュータ Google

Faxで送られてくる書類から文字列を抜き出したいということで、光学文字認識(Optical character recognition：OCR)ができるオープンソースを探していたところGoogleドライブのGoogleドキュメントでできるよという情報を見つけ、早速試してみることにした。

光学文字認識 - Wikipedia

saito_frame

早速このように適当な位置に名前を書いた画像ファイルを用意する。

このファイルを

ocr_in_google_drive

Googleドライブ内でOCR用で作成したフォルダに先程のファイルを入れてみる。

ocr_in_google_drive_1

画像のアイコンにカーソルを当て、右クリックでGoogleドキュメントを選択してみると、

ocr_in_google_drive_2

待機中の画像が表示されるのでしばし待つと

ocr_in_google_drive_3

画像の下に解析結果の文字列が表示されていた。

文字データがすべて取得できてた。

OCRを調べている時、最初はオープンソースを探していて、NHocrという日本語用のOCRのライブラリを見つけ試してみたが、ここまでの精度はなかった。

NHocr: 日本語文字認識プログラムプロジェクト日本語トップページ - OSDN

しかしNHocrはGoogle Codeで管理されているところを見ると、GoogleドキュメントはNHocrを組み込んでいるのだろうな。

そう思うと、Googleが出しているOCR用のAPIを利用した方が良いのだろうな。

最近興味があることや肥料教室についてのメルマガを配信しています

大規模稲作の慢性的な鉄欠乏の問題に取り組んでいます(外部サイト)

畑作の減肥減農薬に取り組んでいます(外部サイト)

土を理解する為の探求マップを開く

生成AIのGeminiのAPIを活用して、XでAI広報の試験を行っています。

Xで@saitodevをフォロー

ツイートシェア

キーワード検索

画像文字列 API 認識 Googleドキュメント OCR Googleドライブ抜き取り精度オープンソース NHocr

上のキーワード検索はGeminiを利用して自動生成されています。

詳細記事 : SOY CMSのキーワード自動抽出プラグインで入力補完機能を追加しました

← 前の記事へ

次の記事へ →

植物のミカタの掲示板

当サイトで行っているSEO対策をまとめました。

SEO - saitodev.co

著者紹介記事

読んで欲しい記事

りょうことつよしの食べ歩きマップ新着

りょうことつよしの食べ歩きマップ

ブログ内検索
プログラミング教室
みんなでプログラミング！
植物のミカタの掲示板

プロフィール
- 齋藤毅(ツヨシ)
- 仕事内容
- Twitter
- DocsWell
- YouTube
- GitHub
- お問い合わせ
大学院で植物の細胞学(主に形)を専攻し、大学院在学中(後に中退)に今で言うところのスタートアップの初期メンバーとして参画し、農薬を使わない栽培の調査と技法の開発を行っていました。
(資金調達まで経験。上場未経験)
栽培の調査と並行で野菜の販売からネットショップのCMSのSOY CMS/Shopの開発を開始しました。
※前職の話で詳しくはこちらをご覧ください。
以前、神奈川県の養鶏場、株式会社コトブキ園さんで高品質な鶏糞堆肥の製造に関わらせていただきました。
株式会社京都農販で技術顧問をしています。
稲作の省力化に取り組んでいます。
フリーランスのプログラマとしてSOY CMS/Shopの開発も引き続き行っていますので、サイト構築やプラグインの開発をしています。
他にTera schoolの小中学生向けのプログラミング教室で教えています。
リンク



特定商取引法に関する表示
カテゴリー
月別アーカイブ
- 2026年
  - 8月
  - 7月
  - 6月
  - 5月
  - 4月
  - 3月
  - 2月
  - 1月
- 2025年
  - 12月
  - 11月
  - 10月
  - 9月
  - 8月
  - 7月
  - 6月
  - 5月
  - 4月
  - 3月
  - 2月
  - 1月
- 2024年
  - 12月
  - 11月
  - 10月
  - 9月
  - 8月
  - 7月
  - 6月
  - 5月
  - 4月
  - 3月
  - 2月
  - 1月
- 2023年
  - 12月
  - 11月
  - 10月
  - 9月
  - 8月
  - 7月
  - 6月
  - 5月
  - 4月
  - 3月
  - 2月
  - 1月
- 2022年
  - 12月
  - 11月
  - 10月
  - 9月
  - 8月
  - 7月
  - 6月
  - 5月
  - 4月
  - 3月
  - 2月
  - 1月
- 2021年
  - 12月
  - 11月
  - 10月
  - 9月
  - 8月
  - 7月
  - 6月
  - 5月
  - 4月
  - 3月
  - 2月
  - 1月
- 2020年
  - 12月
  - 11月
  - 10月
  - 9月
  - 8月
  - 7月
  - 6月
  - 5月
  - 4月
  - 3月
  - 2月
  - 1月
- 2019年
  - 12月
  - 11月
  - 10月
  - 9月
  - 8月
  - 7月
  - 6月
  - 5月
  - 4月
  - 3月
  - 2月
  - 1月
- 2018年
  - 12月
  - 11月
  - 10月
  - 9月
  - 8月
  - 7月
  - 6月
  - 5月
  - 4月
  - 3月
  - 2月
  - 1月
- 2017年
  - 12月
  - 11月
  - 10月
  - 9月
  - 8月
  - 7月
  - 6月
  - 5月
  - 4月
  - 3月
  - 2月
  - 1月
- 2016年
  - 12月
  - 11月
  - 10月
  - 9月
  - 8月
  - 7月
  - 6月
  - 5月
  - 4月
  - 3月
  - 2月
  - 1月
- 2015年
  - 12月
  - 11月
  - 10月
  - 9月
  - 8月
  - 7月

Powered by SOY CMS ↑トップへ