\ 2023年10月24日(火)12時からウェビナー開催! /
※本記事は先日「沖縄県豊見城市 教育委員会 教育部 文化課 主査 島袋幸司 様」にインタビューをした際の記事を掲載しております。
「Ambient Intelligenceによって新たな世界を実現する」をビジョンに掲げ、画像解析に関する様々なAIサービスを展開する株式会社モルフォAIソリューションズ。
その中でも「FROG AI-OCR」は、旧字旧仮名を含んだ明治期から昭和期までの複雑な資料のテキスト化をすることが可能であり、歴史的な旧文書の研究や、電子図書館(デジタルアーカイブ)化、読書バリアフリー法対応などの支援をしています。
今回のインタビューでは、沖縄県豊見城市 教育委員会 教育部 文化課 主査 島袋幸司 様に「FROG AI-OCRを活用した自治体DX(公文書等のデジタル化)」の詳細について伺いました。
インタビュイー 島袋 幸司 様(Shimabukuro Koji)
所属:沖縄県豊見城市 教育委員会 教育部 文化課 役職:主査 担当分野:沖縄県豊見城市デジタルアーカイブ事業担当 ・沖縄エイサー研究部代表 ・沖縄国際大学 南島文化研究所 特別研究員 ・沖縄民俗学会 運営委員(2019年~) ・沖縄県地域史協議会 代表(2021~2022年度) ・南城市史編集委員会 委員(2022~2024年度) ・久米島研究会 会員 |
インタビュアー 石崎 滝(Ishizaki Ryo)
所属:株式会社モルフォAIソリューションズ 役職:マネジャー 担当分野:画像処理、AI(人工知能)の事業開発、営業推進 |
「沖縄県豊見城市 教育委員会 教育部 文化課」の今までの取り組み
【石崎】
はじめに、「沖縄県豊見城市 教育委員会 教育部 文化課」としてどのような取り組みをしてきたかお伺いできますか。
【島袋様】
文化課では、文化財保護や博物館運営、自治体史編さんに文化振興等の業務を担当しております。そのなかで自治体史編さんでは、住民と共に編む地域史づくりを行っています。沖縄戦ではたくさんの人命とともに、文書資料や物等の歴史資料も多く失われてしまいました。そのため、多くの住民が語り部になり、自分たちの歴史を自らの手で記録する取り組みを行ってきました。
その中で、いままでは沖縄戦以前のもの(古文書や、戦争体験者の方、海外移民をされた方の証言集など)を中心に進めてきました。
現在は、沖縄戦以後についてもまとめているところですが、資料の量が膨大であり、文書の形式なども様々です。アメリカ軍や琉球政府の公文書、住民や団体で作成した文書で、手書きやガリ版刷りなどもあります。新聞のような体裁で文書を残しているものもあります。
多くの戦後史をまとめた本では、政治と行政の動きが中心でした。その中で、市民がどのような生活・活動をしてきたかを知るためには、大量の資料に目を通す必要があり、時間等の制約から確認する資料数を取捨選択するしかなく、公的記録に残りにくい情報がこぼれがちでした。
しかし、「地域史の編さん」においては、国・行政など「中央」の情報よりも、当時の市民の動きの方が重要であり、主権者である市民の活動の歴史を未来に残すことが目的です。
そこで、デジタルアーカイブ事業を進めてきました。
まずは、過去のことを知りたいという市民のニーズに応えるために、デジタルアーカイブ上で資料そのものとその内容まで検索できるようにしたいと考えました。
【石崎】
実際にどのようなデジタルアーカイブの取り組みをしてるのか、お伺いできますか。
【島袋様】
デジタルアーカイブ事業では様々な取り組みをしています。
写真、映像、3Dデータなどのメディア情報や、歴史資料、博物館資料、遺跡、文化財の情報なども含めた様々な資料について、インターネットを利用して閲覧できるようにしています。今後、豊見城市の情報を網羅的に集約・発信していきたいと考えています。
■とみぐすくデジタルアーカイブ
今回の事業と「AI-OCR」の活用について
【石崎】
デジタルアーカイブ事業の中でも、今回の事業ではどのようなことを対象としていますか。
【島袋様】
アナログ資料(紙)の画像データ化は進んでいるのですが、デジタルアーカイブ上で検索するためには、OCR技術が必要となり、今回の取り組みを進めることとなりました。
地域についての情報をすべて集約するデジタルアーカイブ事業として、より情報の質を豊かにするのが大量のテキスト、そのテキストをデジタルデータ化するOCRだと考えています。
【石崎】
膨大なテキスト情報から、検索などで情報を絞り込むためには、OCRが必要不可欠ということですね。
そういった当時の市民の暮らしなどの情報はどういった資料から得るのですか。
【島袋様】
例えば、広報誌があります。
公な業務や、イベント、賞を取った際などの記録が記載されています。また、
それをどの時期に、どの自治会で、誰が、どのように行ったかなどの情報も載っています。
また、地域の新聞社では出来事や事件、事故などを取りあげたりもしています。
そんな中でも、今回の取り組みでは、地域の団体の資料を優先してOCR処理することを検討しています。
そこには広報誌や新聞でも記載されていない、地域の集まりや、考え、行動の記録が残っているからです。
地域の団体資料には、自治会や、学校(PTA)などの資料が含まれており、その記録から当時の市民の行動を知ることができます。
インターネット上にはない資料であり、自治体が紙で保有している資料のみから当時を振り返ることができます。当時は何気ない発行物でしたが、今となっては貴重な歴史資料です。
しかし、そういった市民の資料には個人情報が含まれるものも多く、そこのフィルタリングをかけることもOCR事業の目的の一つです。
「FROG AI-OCR」に期待するところ
【石崎】
膨大な資料を収集できるからこそ、今の時代に当時の状況を振り返ることができるのですね。今回の取り組みの中で、特に弊社の技術に期待しているところはありますか。
【島袋様】
当館でもソフトウエアを利用しているなかで、新聞のような複雑なレイアウトに対応しているOCR技術は少なく、いろいろ調べていく中で貴社の話を耳にしました。
特に、手書きの申請書などに特化したOCRが多い中で、不定形フォーマットに対応していた点が大きいと考えています。
従来のOCRで処理をした後に、一部手作業で目視確認することも可能ですが、膨大な資料に対して人の手で作業することは現実的ではないと判断しました。
また、歴史資料には旧字旧仮名遣いも利用されており、それに対応しているOCRは珍しいと思いました。
今後の取り組みで実現したいこと
【島袋様】
今後は特に、教育と観光に力を入れていきたいと考えております。
その中でも小学校で行われる地域学習のために、子どもたちが学ぶための地域資料としても、ここから提供したいと考えております。
現在教育現場は、生徒一人に一台端末が配られ、インターネットをつなげばアクセスできる環境です。今後webを通じて地域資料をすぐに確認できるように整備していきたいと考えています。
まさに、GIGAスクールに向けた取り組みの一貫としても、進めて行ければと思います。
観光についても、歴史的資料目的で訪れる方はまだまだ少ないため、観光協会と連携して活用・発信を進めていきたいです。
最後に
【島袋様】
現代は、紙とデジタルでのハイブリットで保管や検索が可能ですが、以前はほとんど紙の記録で、利活用が困難でした。過去の膨大な歴史資料をこれからも保存しつつ、地域を知るために活用しやすい環境を整えて、先人の歩んだ多様な歴史を伝えていきたいです。そのためにAI-OCRという技術に大変期待と可能性を感じている所です。
【石崎】
貴重なお時間をいただきありがとうございました。
今回の様に、AI-OCRという最新の技術が過去の資料にも影響する可能性があることを実感しました。
弊社では、AI技術はもちろんですが、その前段にあたってお客様が対峙する課題の本質と、その解決に繋がるAIソリューションの設計部分にも特に強みを持っております。弊社ではAIを活用した研究を今後も支援させていただければと思います。
改めて、本日はありがとうございました。