Q. データ定義書で定義されていない値がいくつか入っていたり、住居表示にも一部抜けがあるようです。
A. 今回、できるだけ生の状態に近い形でデータを提供しており、データ入力時の不備がある場合もそのまま残しています。お手数ですが、必要に応じて、名寄せや補完等のデータクレンジング処理を行ってください。また、データを加工した場合は、元データに対して何をどう変更したかを、ソースコードの前処理部分に記録するようお願いいたします。なお、データクレンジング処理を行う場合も、配布するデータ内の情報のみを利用してください。
Q. 号棟データで、土地面積 (tc_mseki) より建物面積 (tt_mseki)の方が大きいケースがありますが、なぜですか?
A.建物面積は、延べ床面積が記載されています。このため、例えば、2階建てなら1階(50㎡)+2階(40㎡)の合計面積(90㎡が記載)が記載されるため、土地面積より大きくなることがあります。なお、扱っている家は全て戸建て(マンションなどではない)となります。
Q. タイトルには「土地の販売価格の推定」とありますが、号棟の区画に建物が建っている場合は、土地の価格に加えて建物の価格も含まれますか?
A.建物がある場合、予測対象は、土地・建物を合わせた販売価格、となります。誤解を与える表記となっており申し訳ございません。
Q. 現場データで、引渡の状態(hw_status)が"更地"となっているにも関わらず、建物が建っている号棟があるようですが。
A.本項目は、飯田産業様が外部から更地の状況で購入したということを表しております。このため、その後に建物が建つことがあります。
Q. 現場データの「販売種別(建売)」「販売種別(土地売り)」のフラグの数と、対応するpj_noの号棟データの建物有りの号棟と建物が無い号棟の数が合わないケースがあるようです。
A.販売種別は計画値が記入されており、稀に実際の結果とマッチしないケースがあります。
Q. 住居表示以外の項目、例えば駅名から緯度経度を取得し、モデルの学習に利用できますか?
A.住居表示以外の項目から取得した緯度経度の利用は禁止とします。
Q. 特徴量生成に一般常識は利用できますか?
A.配布するデータ内の名義尺度を一般常識に基づき別の名義尺度に再割当てするような、一般的な特徴量生成手法は利用可能です。判断に迷う場合はお問い合わせください。