古い山行記録をヤマレコに入れるのに、スキャナーで取り込みOCRでテキストにして入力というのをよくやっております。
20年前の珠玉の山行記録(青森秋田県境大縦走)をいれたいのですが、1月にPCを新しくpowermacG4→macbook proに変えた折、2003年頃買ったフィルムスキャナーcanoscan 9950Fのドライバを消してしまいました。もう古いのか、簡単な最低限のドライバcanoscan toolboxはキャノンからダウンロードできるのですが、付録だった、フィルムのゴミ除去機能のついたもう一つのドライバcanoscan Imagebrowser(だったか)と、OCRソフト、e.typistというのが見つかりませぬ。インストールCDもあちこちさがしても行方不明です。どうにかなりませんでしょうか。詳しい方いらっしゃいましたら教えてください。
それとも、こんな古いスキャナ、もう使っていてはいかんのでしょうか。
コンバンワ。
残念ながら私、全くわかりません
yoneyamaさんの子供時代からの
山登りの記録、見始めたら止まりません
写真もよく残っていましたね。
しかもカラー
yoneyamaさん、こんばんは。
(1)「ゴミ除去してくれるソフトでフィルムスキャンをやりたい」、かつ、
(2)「スキャンしたあとでOCRソフトを使ってテキストだけを取り出したい」
ということでよろしいでしょうか?
(1)の方法。うまい方法は思いつかないです。申し訳ないです。
「町の写真やさんにフィルムを持ち込んでCDに焼いてもらう」
という方法がありますけど、少々、出費してしまいます。
(2)テキストを取り出したいのでしたら、
OCRにたよらないで、いったんPDFファイルにするという手を思いつきます。
お手持ちのスキャナで、
まず、出力ファイル形式を「PDF」になるように設定してスキャンします。
つぎに、できあがったPDFファイルをダブルクリックしてプレビューを起動、
文字の部分をマウスでたどれば文字の部分だけコピー&ペーストできると思います。
あっ
ひょっとして、元の原稿が「手書き」ということなのでしょうか。
うんむむむ、それなら、
それならやはり、OCRでということになるのかもしれませんね。
ええっと、知り合いにOCRソフト(e.typist)を提供してくれる人がいないかどうか相談してみます。
yabukogiさま
驚きです!PDFってこんなことができるものとは知りませんでした!!!20年程前高いパソコン買って、OCRの魔力に感動して以来、画像→文字化の手段はこればかりのものと信じきっておりました。ありがとうございます。全面解決です。道理で最近は日本語OCRソフトがあまり出回っていないわけですね。どうもありがとうございました。
sakusakuさま
sakusakuさんは奇特な読者様ですね。昔の記録はやはり20年程まえワープロを買ったときに記憶と記録をたどって思い出し記述しておいたもので、今やるよりは多くを残せたと思います。自分のカラー写真が色あせる時が来るとは考えなかったです。
90年代の古い写真をスキャンがてらアップしたので今月は月間許容量に達してしまいましたが、中学高校時代の山写真をスキャンしましたので6月に更新いたします。燕岳集団登山の写真も発見しました〜。
薮コギさま
お詳しいようならお聞きしたいのですが、同じPDFでもスキャナーから取りたてほやほやのものは(2)の方法で文字を選択コピーできるのですが(実用レベルではなくとも手書きでさえできました!)、JPGをPDFに変換した物は選択できませんでした。そこらへんのしくみ、ご存知なら教えてください。
yoneyamaさん、
うまくできたようでよかったです。
きょうは会社から昼間こっそりヤマレコにアクセスしました。
解決というコメントをみて、少しほっとできました。
それからさらにお尋ねの件。
いったんJPGにしてしまうと、文字情報が欠落してしまうから難しいかなと思います。JPGを紙に印刷してそれをもう一度スキャナで読み取ってPDFにするとできるかも知れません。いや、できないかも知れません。いや、なにもそこまでしなくてもとも思います^^;
すいません、わたしも詳しいことはよくわからないです。
ほかに、PDFについて私が知っていること。
WindowsユーザがPDFファイルを作る時によく使っているAdobe Acrobatというソフトがあるということをご存知かと思います。このソフトは今までにバージョンアップが何度もあって、バージョン4辺りからOCRの機能も組み込んでいたかと思います。そして、スキャナ(今回はCanoScan)がPDFファイルを作る時にもたぶんOCRがの機能が実行されていて、それで文字情報を含んだPDFファイルを作り出しているのだと思います。
なので、もしも昔に別の方法で作成された古いPDFファイルだと、あるいは変換の方法が古いやり方だったりすると、OCRの機能が実装されていなくてそのPDFファイルから文字を読み取る事ができないということがあるかも知れませんね。
ところで、これはすでにご存知かも知れませんが、PDFはMacOSとの親和性が高いということがあります。これは例えば、MacOSでPDFファイルを作る時にAcrobatが要らない(MacOSがPDFファイルを作る機能を持っている)とか、プリンタで印刷する前にプレビューするとMacOSではPDFファイルが作成されていてユーザはそのファイルを見ているとか。
私もMacユーザーでして、こんな時にはちょっと嬉しいのです^^;
今回はPDFというものを見直しました。ありがとうございました。内面的にOCR機能がなされているというわけですか。
マックでPDFがほいほいできるのも昨年知りました。ヤマレコの計画書、PDFで一枚紙にできるので重宝しています。
何ごともパソコン界は驚くようなことばかり。僕にとっては魔法です。
コメントを編集
いいねした人
コメントを書く
ヤマレコにユーザー登録いただき、ログインしていただくことによって、コメントが書けるようになります。ヤマレコにユーザ登録する