こんにちは!井上咲です✨
縁あってソフトウェア周りを少しだけ手伝わせてもらってます!
まだまだ新米ですが、ちょっぴり技術系のことも紹介していきたいです!

これまでの記事

④と⑤で、自前の画像をIIIFで公開するための手順を説明してきました。
今回はいよいよ、KuroNetのくずし字認識サービスにかけていきます!

 

今回は既に解読された文章を使い、AIの結果の答え合わせします。
KuroNetの使い方については、くずし字の自動認識にチャレンジ!③〜くずし字認識のお試し〜を御覧ください。

では、解析結果を確認してみましょう😆

画像の引用元
出典:八潮市立資料館寄託 大瀬高橋義一家文書2061(複製本CH1309)『れきナビ』講座:くずし字にチャレンジ! 往来物

結構な割合の文字が認識されてますね!
八潮市立資料館様が公開している文章と比較してみます。

 

赤丸が正解、青丸が不正解としました。
全部で50文字の文章の中、正解33文字、不正解17文字でした。
※ 最後の「録」の字は文字が切れていたためカウントしていません。
※ 重複や文字の誤検出はカウントしていません。

どうでしょう?なかなか合っていると思いませんか?!
一行目のタイトルなんて1文字除いて全て正解しています!
1ページまるごと解析してこの精度なら、十分に解読する際の助けになるのではないでしょうか?

こちらの文章は横に読みがなが書いてあり、もしかすると精度が低く出るかもしれないと不安でしたが、読みがなでの文字誤検出は見られませんでした。
「往来」のところなど、文字が重複して検出されてしまうというのは見られますが、これぐらい目で見て判断レベルです(あえて残しているのかな?)。
解析するときに矩形領域を選択するのですが、少し範囲を変えてみるとまた少し結果が変わりました。

 

②~⑥までの記事を通して、KuroNetくずし字認識サービスを使うための手順を説明し、とりあえず自前で用意した画像に対して解析するところまでやりました。
こんなにもよくできたツールを無料で使えるのは本当にありがたい限りです。
今回誤認識が少しだけ出ていましたが、CODH様は他にも1文字ずつの認識サービスも別途用意しています。
これを使えば、また別の文字を出してくれるはずなので、もしかすると正解を弾き出してくれるかもしれません。