お知らせ
[2024/02/27] 「入賞者レポートタブ」に各入賞者の解法を公開しました。[2023/10/13] 「データタブ」に「分析用のチュートリアル」を追加しました。
背景
山口県では、デジタル技術を活用して地域課題の解決や新たな価値の創造を図るため、DX推進官民連係フォーラム「デジテック for YAMAGUCHI※」を創設し、『共に考え、共に挑戦し、克服』を目標に、山口県が抱える課題に対して、シビックテック的活動からビジネス的活動まで幅広く取り組んでいます。 この取り組みの1つとして、AI人材育成プログラム「やまぐちAI Quest※※」を提供し、AI技術を活用した地域課題の解決や、新たな価値を創造できる人材育成に取り組んでいます。
この度、山口県内の高度なAI人材を発掘・育成するとともに、優秀な予測モデル獲得による地域課題の解決のため、古典籍資料のくずし字を変換するAIモデル作成を競う、AI開発コンペティション「ワールドAIコンペティションYAMAGUCHI」を開催します。
古典籍資料の解読は現存している資料の1%ほどに留まっていると言われており、地域には死蔵されている古典籍資料がたくさん残されているようです。本コンペティションにおける活動が、古典籍資料のデジタル化や翻刻のAIモデル作成を通して、古典籍資料の解読に関する知識継承や作業効率の向上を図るとともに、デジタル化の意義について考える機会の一つとなれば幸いです。例えば、AIを活用して、ひいおじいちゃんが昔書いた文章が読めるなど、リアルな体験を増やすきっかけづくりをすることで、そこから住んでいる地域や故郷の歴史を知り・考え、未来へと伝え、一人ひとりが思い描く未来を創造できる住みよい地域社会づくりの一翼となれればと考えています。このたび、この考え方にご賛同いただきました山口県立大学 国際文化学部 文化創造学科 准教授 菱岡 憲司 先生から資料および正解テキストデータが提供され、このAIコンペティションが実現しました。
『共に考え、共に挑戦し、克服しましょう!』皆様からの多数のご応募をお待ちしております。
※ DX推進官民連係フォーラム https://digitech-ymg.org/
(運営事務局:一般財団法人山口県デジタル技術振興財団)
課題
世の中に数冊しかない、貴重な手書きの『姨捨日記』(著者:小津久足)のデータを使用して、くずし字を現代の文字に翻刻するAIモデルを作成していただきます(下図はイメージ)。
データセット
画像 | アノテーション | |
---|---|---|
ファイルフォーマット | jpg | json |
内容 | くずし字で書かれたある1行の文が写った画像データ | くずし字のテキストデータや各文字の矩形情報などをまとめたデータ |
サンプルサイズ | 35567枚 | 35567件 |
備考 | 解像度は一定ではない | 文字数は一定ではない |
※詳細は、配布データのreadme等をご参照ください。なお、評価対象となる画像データは非公開となります。