※本記事は先日「順天堂大学 助教 佐藤皓也 様」にインタビューをした際の記事を掲載しております。
「Ambient Intelligenceによって新たな世界を実現する」をビジョンに掲げ、画像解析に関する様々なAIサービスを展開する株式会社モルフォAIソリューションズ。
その中でも「FROG AI OCR」は、旧字旧仮名を含んだ明治期から昭和期までの複雑な資料のテキスト化をすることが可能であり、歴史的な旧文書の研究や、電子図書館(デジタルアーカイブ)化、読書バリアフリー法対応などの支援をしています。
今回のインタビューでは、順天堂大学 助教 佐藤皓也 様に「FROG AI OCRを活用した武道史研究」の詳細について伺いました。
インタビュイー 佐藤 皓也 様(Sato Koya) 所属:順天堂大学スポーツ健康科学部 スポーツ科学科 助教 学位:博士(スポーツ科学)(2020年1月 早稲田大学) 修士(教育学)(2015年3月 埼玉大学) 研究分野: ・スポーツ史 ・武道史 ・デジタル人文学 ・旧制中学・高校 ・武道・古武道 論文: デジタル技術を用いた武道史研究:『嶽水會雑誌』の計量テキスト分析 佐藤皓也, 小林勝法 スポーツ科学研究 2023年(Vol.20)1-15 科研費: 近代日本における学生武道の実相:質的および量的解析手法を用いた武道史研究 日本学術振興会: 科学研究費助成事業 若手研究 2023年4月-2026年3月 佐藤 皓也 (研究代表者) |
インタビュアー 石崎 滝(Ishizaki Ryo) 所属:株式会社モルフォAIソリューションズ 役職:マネジャー 担当分野:画像処理、AI(人工知能)の事業開発、営業推進 |
佐藤先生の今までの取り組みと研究内容
本日はよろしくお願いいたします。まずは佐藤先生の今までの取り組みをご紹介いただけますでしょうか。
私は、これまで「剣道」を事例に武道史を探求してきました。現在は、その中でも学生剣道史に注目しています。
基本的に歴史研究は、古い資料を収集したあとで史実を認識し、解釈を加えるかたちで研究を進めることが一般的です。
しかし、資料が残っていない場合もあるため、史実に関連のある人物を訪問し、当時の考え方などを伺うこともあります。
学生剣道史には不明瞭な部分があり、その時代の歴史研究を行うことで、当時の実践や考え方は現在に繋がっているということが分かりました。
例えば、私は以前、競技スポーツとしての剣道の発展過程を敗戦前の西日本における学生剣道の実態から明らかにしたことがあります。この結果は、「剣道の競技スポーツ化が敗戦によるGHQの指導によってのみ進展したものではなく、競技スポーツ化の萌芽はすでに敗戦前の学生剣道にあった」という先行研究の史実認識に繋がりました。また、そうした実践は敗戦後の剣道の一部をかたちづくったということもわかりました。
こういったように歴史の一部を解明できれば、全体の考え方や、現在に至るまでの変化などが少しずつ分かってきます。
ありがとうございます。武道史研究の中でも、特に「学生武道」について研究されてきたということですが、現在はどんな分野に着目していますでしょうか。
現在も引き続き、「近代日本の学生剣道史」を探求するとともに、歴史の質的・量的な併用分析について着目しています。
「近代日本の学生剣道史」については、これまで明治期から大正末期までを取り扱ってきましたが、今回はそれ以降の歴史について探求しています。
例えば、当時の学生剣道界では戦争の影響により実戦に見立てて「三本勝負」から「一本勝負」にルール変更された経緯があります。こういった歴史の背景に関連して、学生剣道の取り組み(試し切りや古武道の実践など)や考え方(競技スポーツと実戦の関係性など)の実態を明らかにしたいと考えております。
研究方法については、古い資料の読み込みに加えて、近代文献のテキスト化ソフト(FROG AI OCR)と量的分析手法(樋口耕一氏らの計量テキスト分析)を用いています。
「FROG AI OCR」をどう活用しているか(計量テキスト分析とは)
次に、佐藤先生が現在行っている剣道史研究の量的分析方法について、もう少し詳しく伺えますでしょうか。
私はFROG AI OCRと計量テキスト分析(PCを使った統計的なテキスト分析技術)を使って研究しています。
こうした分析を着想したきっかけは、「古い資料の内容を数字やグラフで説明し、異分野の人々に対してもっとわかりやすく歴史を説明できないか」と考えたことにあります。
その背景には、今なお言われ続けていますが、「武道という特殊な世界を誰にでもわかるように説明せねばなりません」という恩師の言葉や、自然科学系の研究が多い環境に所属していることの影響があります。
昨年、学会に参加したところ、武道関係資料を計量テキスト分析によって解明しようとした発表がありました。そこで、これまでにはほとんど行われてこなかった日本の古い文献で計量テキスト分析を実践してみようと思い、今回のような量的分析方法の着想に至りました。
計量テキスト分析は文字データを必要とします。当時、私が分析しようとした古い文献の文字は大量にあり、文字を手入力でデータ化しなければなりませんでした。時間や依頼コスト等を考慮すると現実的ではなかったため、自動で文字を抽出でき、しかも旧字旧仮名をデータ化できるOCR技術を探していました。
実際いろいろ試してみましたが、従来のOCR処理では厳しかったですね。
そんな中、研究の種になるものはないかと探していたところ、他にはない旧字旧仮名をデータ化できるOCR技術「FROG AI OCR」を見つけたという流れです。
率直な意見として、「FROG AI OCR」はどうですか?
正直50%くらいの文字をデータ化できれば嬉しいと思っていたら、ほとんどできてしまったので、非常に驚きました。
もちろん100%ではないため、自分の目で最終確認は必要ですが、今まで自分の手でやってきた作業を考えると、大変な発見ですよ。
嬉しいお言葉ですね。ありがとうございます。
逆に、改良点などはありますか?
AIで分析しているため、一度にたくさんの資料をアップロードすると、処理時間が重いときがあります。
しかし、授業や会議、部活などPCから離れている時間を利用すれば、その時間で分析してくれるため、今のところ不便さは感じていません。
今後一度に複数のデータを処理できると、更に嬉しいですね。
また、武道史研究に限らず、旧字旧仮名を使っていた時代の研究については、同様の分析ができると思っています。
「FROG AI OCR」で歴史研究が変わるとさえ考えています。ちょっと言い過ぎましたかね。
歴史研究については、AIの活用に対して否定的な意見も一部ありますが、これまでの研究方法と相互補完的に用いてこそ有意義な知見が得られると考えています。
最近では2021年にデジタル社会実現の司令塔として「デジタル庁」が設立され、2022年には「デジタル社会の実現に向けた重点計画」が閣議決定されました。こうした流れをみると、今後、様々な研究でAIがさらに活用されることを予想しています。
現状、AIでは歴史の内容や意味までは分かりませんが、前段階の情報収集や分析については、無くてはならない存在となるでしょう。
AIは作業効率化に大幅な影響を与え、その後の研究者による「史実認識と解釈」について大きな助けになると思っています。
今後の研究で実現したいこと
最後に、今後の研究で実現したいことについて、お伺い出来ますか?
今回の「FROG AI OCR」を活用した論文の分野と同内容の深堀もできますし、他種目・他分野への横展開もできると考えています。
将来的には、「武道」概念の解明 や、スポーツ・武道の歴史に関する分析データ(図やグラフ)をプラットフォーム化できればと考えています。
貴重なお時間をいただきありがとうございました。
今回の様に、AI-OCRという最新の技術が歴史にも影響する可能性があることを実感しました。
弊社では、AI技術はもちろんですが、その前段にあたってお客様が対峙する課題の本質と、その解決に繋がるAIソリューションの設計部分にも特に強みを持っております。弊社ではAIを活用した研究を今後も支援させていただければと思います。
改めて、本日はありがとうございました。