私の職場は製造関係なのでモノ相手の仕事でありあまりAIの出番は無いが、珍しく使う場面があった(業務では初めての使用)。その結果は人間以上で現在のAIの実力に驚かされた。
AIにやってもらったのは所謂「文字起こし」。紙に書かれた手書きの文字をテキストデータに変換する作業だ。
現場作業の要点メモを漢字、ひらがな、カタカナ、アルファベット(大文字、小文字)、数字混じりの1000文字くらいで自分で判読できる程度の乱れた文字で殴り書きし、自分でPCに打ち込もうとしたのだが、ここでAIが使えるのではと思い付いた。ちょうど当日に社内でAIの教育があったばかりだったからだ。この教育で文字起こしの例は出てこなかったが、AIなど通常は使わない人間でも文字起こしができそうだとは思いつくだろう。
使ったのはchatGPT。まずメモをスキャナでPDF化して読み込ませたらエラー表示が出た(なぜか英語で)。FAQで同類のトラブルが無いか確認したら、PDFファイルの場合は例えばワードからPDFに変換したような、元から文字が電子データだったものをPDF化したものしか文字として認識しないとのこと(意外と不便)。じゃ手書き文字はどうすればいいか対応策が書かれていなかったが、いっそのことJPEG等の画像ファイルにしてしまったらどうかと考えてPNG形式に変換して読み込ませたら認識してくれた。
手書きの内容は主にリナックスのコマンド。乱暴に殴り書きしたので、おそらくリナックスのコマンドを知らない人だと2割くらいの文字は読めないレベル。コマンドの解説に書いた漢字はさらに乱暴で一部簡略化したもので、単純に画像から文字を起こしたら間違いなく誤り多発するものだが、驚いたことに約1000文字中、誤りは僅かアルファベットの1文字だけで漢字は全部合っていた! しかもアルファベットの大文字/小文字も完璧に識別していた。これは単純に画像から文字を判別したのではなく、文脈からの推測が入っているに違いない。リナックスのコマンドなんかはAIの学習データの中に入ってるだろう。
自分でこれをPCから入力したら10分、20分くらいかかるだろうと思われたが、AIだと数10秒で「解読」完了。まさかこれほどの完成度とは予想外の結果。今までは手書きメモはスキャナでPDF化していたが、この場合は電子化したと言っても文字は画像のままで検索はできないが、文字起こししてテキストデータに変換できれば検索が使えるようになり格段に便利になる。今後はこのやり方で行こう。
なお、一般的にAIには機微な情報は入力してはいけないのだが(学習に使われて他のユーザーの生成結果に反映されて外部に漏れる危険性がある)、今回使ったAIは会社専用の独立したものであり問題なし。皆さんがもし仕事で一般的なAIを使う場合はプロンプトやアップロードするファイルの内容には注意しましょう。
仕事でGoogle翻訳の精度が爆上がりしていることで驚いています。文字の世界ではもう言葉のバリアは激減しています。ただし、文字の世界だけで、人と人の会話は全くできない状況。ちょっとした誤解が生じるような繊細な部分は要注意です。
将来どうなるのかという大きな不安感を感じませんか?
今回の私の要素では人間的要素は皆無な使い方ですが、今の時代だと相談事の相手がAIなんて話が現実化しているのですから驚きです。
でもAIは言葉の意味を理解しているわけではなく、ネットの膨大な文字データからある言葉の次に来る確率が高い言葉を選んでいるだけ。ましてや人間の気持ちを理解しているわけではないので、相談相手に使うにも注意が必要でしょうね。でもそういう知識をユーザー全員が持っているかといえば・・・
コメントを編集
いいねした人
コメントを書く
ヤマレコにユーザー登録いただき、ログインしていただくことによって、コメントが書けるようになります。ヤマレコにユーザ登録する