こんにちは!井上咲です✨
縁あってソフトウェア周りを少しだけ手伝わせてもらってます!
まだまだ新米ですが、ちょっぴり技術系のことも紹介していきたいです!

これまでの記事

 

これまで、KuroNetとKogumaNetという、ROIS-DS人文学オープンデータ共同利用センター様が公開しているソフトウェアを使ってきました。

ただ、これらのソフトウェアはIIIFという形式でしか画像を受け付けないようになっていいます。
公開されている画像であれば解析は簡単なのですが、手持ちの画像を解析させるには一旦ウェブ上に公開する必要もあり、その分の手間やハードルがありました。

もっと使いやすくしたソフトウェアもリリースしたいという旨は以前よりCODH様のページに書かれていたのですが、
ついにスマホアプリ版がリリースされたようです🥳

今回の記事では、この「みを」を使ってみたいと思います!

みを の使い方

AIによる文字認識

動画を見て頂いたほうがよさそうですが、一応。
読み込ませて、真ん中のアイコンをタップするだけ!これだけで解析できます。

みをに画像を読み込ませた状態

そうすると認識結果が表示されます。

一文字ずつの修正や確認

表示された文字をタップすると、1文字が選択された状態になります。

ここで文字を修正することもできますし、虫眼鏡マークをタップすると、他の文献の文字と見比べることができます。

認識結果

 

みをによる新撰増補大全商売往来の解析結果

今回使った画像では、51文字中、正解44文字が不正解が7文字でした。
上の資料は分かりやすくするために、正解を赤丸、誤りを青丸で塗っています。

少なくとも、くずし字の自動認識にチャレンジ!⑥〜くずし字認識の精度検証〜を書いたときのKuroNetよりも遥かに精度が上がっています!
以前のKuroNetでは、「商」とか「教」といった漢字が重なって表示されていましたが、その点も修正されているようです。

スマホアプリとして使いやすくなっただけでなく、精度向上も進めているみたいですね!

 

使ってみて

一言で言うと、「すばらしい」だと思います!

ページ毎の解析から、1文字ずつの検証に至るまでが簡単

特に、手元に資料がある場合には、非常にスムーズに解読のサポートをしてくれそうです!

  1. カメラで撮影して1ページまるごとAI解析
  2. 他の資料の文字と1文字ずつ比較

これが一つのアプリにまとまっているのがすごい便利ですね!
今回は使いませんでしたが、解析結果の共有などもできるようです。

精度向上もされている

これは上で説明した通り。使い勝手だけでなく、精度も上がっていたのは驚きでした。

プライバシーポリシーの扱い的にも使いやすくなった

以前のKogumeNet、KuroNetでは、Webサーバ上に公開が必要なので、URLさえ知っていれば誰でも画像データを取得できる状態に晒す必要がありました。
また、IIIFホスティングサービスを使った場合では、外部のサーバー上に画像を保存させている点も嬉しくない点でした。

この点「みを」は、データをWeb上に晒す必要も無くなり、画像や認識結果が外部サーバー上に保存されなくなりました

本アプリは、端末に保存された画像またはカメラで撮影した画像を、本センターが管理するサーバに送信し、サーバ上でくずし字を認識して結果を返送し、本アプリ上で認識結果を表示する仕組みを用いています。この際にサーバに送信された画像、およびその認識結果は、サーバ上には保存しません。(みをのプライバシーポリシーより)

古文書であれば、下手に公開できない資料の画像も多いと思います。
こういった画像にKuroNetやKogumaNetを適用させるのはハードルがあったと思いますが、この点も非常に良くなったと思います。

 

今回、スマホアプリ版のくずし字認識を試してみました。どうだったでしょうか?
私としては、改善も相当されており、非常に「アリ」だと思います!

オープンなプロジェクトでここまで無料で使わせてもらえるのは非常にありがたいですよね。
井上会の活動としても、ぜひ活用していければと思います。