

  1. エンターテイメント分野、教育、介護などでのクイズ活用を目指し、「文法等が正しく、嘘がなく、テーマに沿ったおもしろいクイズ」を自動生成する「早押しクイズ自動作問AI」の開発を競う。


  2. 「『文法等が正しく、嘘がなく、テーマに沿ったおもしろいクイズ』の生成、評価」のコンペ通して、自然言語処理や生成系AIの各種課題(生成系AIが間違った出力を行ういわゆる「Hallucination」など)の解決策を議論する。
  3. コンペティションを通じ、「クイズの面白さ」を評価するデータセットを構築していく。

※ 生成系AIを評価するコンペティションは他に例が少なく、また日本語データセットも揃っていない状況です。今回は「お試しの開催」という形でご理解いただきたいと思います。



【予選】 〜2023年11月30日


  • 予選においては、外部LLM(ChatGPT、BARD等)を使い利用料がかかった場合も、各種予算は自己負担となります。
  • 予選においては、無料GUI版ChatGPT等を用い要素技術をご検討いただく形だけでも構いません。その場合、フォーマットに従わなくともChatGPTなどに入力するプロンプト全体をお送りいただく形も可能とします(予算や技術の関係で外部LLMを使えない方向けの措置)。本戦では、直接インプットを読めるようにスクリプト化していただきたいと考えていますが、その方法等は要相談とします(スプリプト化する部分を実行委員会有志で協力するなど)。




  • 予選と同じ評価手法で、700点満点で得点をつけ、合計得点の上位3人が最終報告会における決勝戦に進出します。
  • 本戦及びその準備においては、外部商用LLMの利用券や利用料の提供を行うことを検討しています。ただし、予算充当のために何らかの研究報告が必要になる可能性があるため、利用券や利用料の供与を受けた取り組みは、入力に用いたプロンプトやアルゴリズムを公開Web等でご報告いただくことを義務とする場合があります。詳細は後日お知らせします。



  • 本戦上位3人は、クイズの発表順を上位から決めることができます。
  • 本戦において生成した20問のクイズから、徳久による手動審査の結果評価の高かった上位10問を抽出し、審査委員に出題します。(同点評価の場合、徳久による比較で評価が高い問題を抽出します)
  • ゲスト審査委員には、提示する基準のもと、3つのうちどの問題が「最もイベントが盛り上がる問題だったか」を選んでいただきます。一人が選ぶごとに、本戦の点数に30点を加算します。(最大90点加算)
  • 最終報告会において、上位3位に入った方は、アプローチ等の説明時間を設けます。発表に協力いただけるとありがたいです。また、4位以下でも、ご協力いただける方には発表をお願いしたいと考えております。



徳久 倫康 氏



鶴崎 修功 氏



仲野 隆也 氏



矢野 了平 氏

構成作家・クイズ作家。1977年埼玉県生まれ。高校・大学時代は『第4回高校生オープン』『パネルクイズアタック25』で優勝するなどクイズプレイヤーとしても活躍。その後構成作家となり、『水曜日のダウンタウン』『マツコ&有吉 かりそめ天国』『パンサー向井の#ふらっと』などのバラエティ番組を手掛ける一方、『くりぃむクイズミラクル9』『高校生クイズ』など多くのクイズ番組を手掛けた。『佐藤健&千鳥ノブよ!この謎を解いてみろ!』『今夜はナゾトレ』など謎解きブームの影の立役者でもある。



  • 人力による評価となります。評価基準は以下とし、生成結果を700点満点で評価します。(pdf)
  • 今回は実行委員会の徳久倫康が、参加団体名を隠した状態で、同じ基準で一人で採点を行います。(評価者を増やすのは、第2回以降で検討します。)


  • 各問題群について、700点満点で採点した結果です。(excel)


  • 提示されたインプットを直接読み取って、自動出力するツールを最終的に作成していただきます。
  • 「早押し解答部門」と異なり、サーバー等は各自の環境でご用意いただき、各環境で計算いただいた上で結果をご提出いただく予定です。(ただし、本戦以降は実行委員会でサーバーを用意する可能性もございます)
  • 「早押し解答部門」と異なり、クラウドサービスで展開される商用LLM(ChatGPT, BARD等)を使用しても構いません。ただし、広く公開されているものを使うものとし、かけてよいコストは月額料金で3000円程度(ChatGPTPlusまで)、1問あたりの生成は1円以内を目安としてください。(過度な投資競争を防ぐためです。)
  • もちろん、商用LLMを用いず、独自モデル構築する手法を取っても構いません。
  • 単一計算機で完結しないモデルを使った場合、提出時に何を使ったかを明示していただきます。


  • 利用可能なデータセット/テキスト/モデルは、一般公開されているもののみとします.一部のユーザーしか使えないデータなどを使ったシステムは評価対象外とします.有償公開のものも使用できますが、利用料等を踏まえ最終的に「月額コストは3000円程度まで、1問当たりの生成コストが1円以内」になるようなツールに限ることにします。
  • ただし,独自に作成したデータやモデルであっても,無償・有償を問わず、一般公開すれば利用可能となります.他の組織でも結果を再現できるか,というのが一つの目安となります.
  • ただし、著作権への留意をお読みください。

  • JAQKETの訓練データ・開発データ
  • 参加者が独自にダウンロードしたWikipediaのデータ(これをもとに生成したクイズを公開する場合、適切な表示を行うことが条件)

※ 本コンペ限定で教師データや元ネタとして入力としてよいテキストデータやクイズ問題の許可を得られましたら、こちらに追加いたします。ご協力いただける文章の著作者の方は、トップページの連絡先までご連絡ください。

No private sharing outside team ルール

  • チーム外の他の参加者と、本コンペのフォーラム以外のプライベートな場において、コードやデータなどを共有することや、戦略などについて具体的な議論を行うことを禁止します。 このルールは本戦の課題送付後や、最終報告会でのライブコンペにのみ適用されます。
  • チーム人数は最大で5人です(チーム作成方法はこちら)。



  • 一般ユーザーが使用できる公開LLM(商用含む)が出力する表現は、使用してよいルールとします。 LLMが出力する表現が、もととなった文章の著作権違反を起こしてないかについては議論が分かれているところです。今回は、公開LLMのデータはユーザーが制御できないものであり、研究目的に限った上で使用したツールを明示することで対応します。
  • Wikipediaで用いられている文章表現から直接クイズを作成した場合、そのクイズがWikipedia文章の二次著作物となる場合があるため、出力されたクイズ公開時はWikipediaの示す「クリエイティブ・コモンズ 表示-継承 3.0 非移植」に従い、適切な表示を行ってください。
  • Wikipedia以外の文章やデータを入力として利用する際は、このページで明確に許諾を得られたサイトを除き、一般的な著作権法に従った利用をお願いします。著作者の二次利用許諾を得られていない文章表現が、生成されたクイズ問題文に組み込まれないよう留意して下さい。
    • 著作物の定義「思想又は感情を創作的に表現したものであって、文芸、学術、美術又は音楽の範囲に属するものをいう。(著作権法第2条第1項第1号)」を踏まえ、事実に相当する単語を抜き出し、自然言語処理等で適切に接続詞等によりつなぐことは問題ない可能性が高いですが、「思想又は感情を創作的に表現した」文章そのものをクイズに組み込むことは著作権法上の引用の要件を満たさない限り難しいと解釈できます。また、著作物をクイズ文章の生成に直接使わず「ファクトチェックに使う」用途だけであれば、著作物の利用にあたらないと解釈できます。
  • 皆様に作成いただいたコードやモデルは、作成した皆様が権利を有します。非公開・公開等は自由ですが、今後の技術の発展のため、緩めのライセンスでGit-Hubなどを通じた公開をしていただけるとありがたいです。

実行委員会の森岡が作成した、OpenAI APIを用いたベースラインモデルです。 MITライセンスで公開されているため、これをベースに開発を行っても構いません。

Disclosure policy

As a general rule, in accordance with Article 4, Paragraph 1 of the terms of participation, diclosing any contents such as insights and deliverables transmitted through the information or data provided by our company in relation to this competition is not permitted, however, only after the completion of this competition and for non-commercial purposes, it will be possible to disclose the contents within the score of the table below
Model *1
Analysis results *2
Public : Posting to social media sites, blogs and source repositories, and citing to papers
Restricted : Using in a limited range from research, education to seminars, where many unspecified people cannot access
*1 Execution unit source code and learned models
*2 The insights obtained using the information and data provided, or the solutions including scripts and processed data such as summary statistics


October 6, 2023