まず、このデータを分析しやすいように、各チームのデータを順位順に並べて、クロス集計表を作ります(右図)。それを基にデータの関係について調べていきます。
まず、勝利に繋がる指標として着目すべきはゴール数でしょう。ゴール数に関係があるプレイはなにか、「相関係数」を使って調べると、どうやらシュート数とパス数に正の相関があると言えそうです。確かにシュートの機会が増えれば、ゴールも多くなり、勝利に大きな影響を与えそうです。しかし、シュート数とゴール数の散布図を作ると、1位のサンフレッチェ広島と2位の横浜F・マリノスはゴール数もシュート数も中程度といった結果となりました。ここで新たな疑問が生まれます。「シュート数とゴール数が中程度のチームがなぜ優勝できたのか」という点です。
敬愛大学の副専攻「AI・データサイエンス」では、毎年、隣接する敬愛学園高校へデータサイエンスの出張講義を行っています。今年度も講師は教育学部の 大塚 慎太郎 准教授(数学教育)が務めました。好評だった昨年度の出張授業を受け、今年は講義時間を1時間に拡大。高校生にもできるデータサイエンスの実践として、データを使った探究学習の進め方について講義しました。
大塚准教授は高校生がデータサイエンスにチャレンジした事例として、第4回スポーツデータ解析コンペティション中等教育部門での香川県立観音寺第一高校の生徒の研究を紹介しました。生徒たちがテーマに選んだのは「サッカーJリーグで勝つためのプレイ」についてです。検証にはJ1リーグ全チームの試合のシュート数、パス、ゴール数、勝ち点など、あらゆるデータが必要です。集めるのが大変そう?いえ、これらのデータはインターネット上に公開されており、誰でも入手し分析できるのです。
高校の探究学習でデータサイエンスをとり入れてみよう!
アシストパスの距離に着目!
ゴール数に正の相関があったもう一つの指標、パス数に着目してみましょう。サンフレッチェ広島にはパスに独自の戦術があるのではないかと考えた観音寺第一高校の生徒たちはアシストパスに限定して、そのパスによるシュートの成否とそのときのパスの長さを比較しました。ゴール成功時・失敗時のアシストパスの長さを箱ひげ図で表し、優勝したサンフレッチェ広島とその他のチームを比較しました。すると、サンフレッチェ広島のゴールに繋がったアシストパスの長さの四分位範囲が9~33mのパスであったのに対し、他チームは8~21mと、サンフレッチェ広島はロングパスからのゴールが多い傾向にあることがわかりました。特に、サンフレッチェ広島は30m以上のパスによるゴール成功率は30.8%にのぼり、ロングパスが大きな武器になっていることが分かりました。サンフレッチェ広島はカウンターサッカーが得意なチームです。つまり、カウンター時にロングパスで一気にゴールを奪う戦術がサンフレッチェ広島の強さに繋がっていることがデータから明らかになったのです。
このように高校生でも公開データを利用して、自ら設定した探究課題をデータから答えを導くことがきます。敬愛大学の副専攻「AI・データサイエンス」では、世の中の問題を発見し、データを収集・分析し、新たな知見を得る力を養います。データから新しい発見やアイディアを見つけることはとても楽しい体験ですし、データサイエンスはこれからの社会で必須となるスキルです。いっしょに敬愛大学でAI・データサイエンスを学びましょう。