9割の学校が「信頼性は高い」と評価

戸田市教育委員会は、教師の「経験・勘・気合い」に頼ってきた従来の教育を、データを根拠とした実践に変えていこうと、2022年度より独自に教育データベースの構築と利活用に取り組んでいる。

その主な目的は、子どもたち1人ひとりに応じたプッシュ型の支援だ。とくに力を入れているのは、現場で喫緊の課題となっている不登校児童生徒の支援。子どもたちのSOSを早期発見して支援につなげられないかと、2022年度はデジタル庁の「こどもに関する各種データの連携による支援実証事業」として、教育政策室が保有しているデータのほか、福祉部局から連携した乳幼児健診結果や保育・幼稚園の在園状況なども含めてさまざまな教育データの連携や分析を進めてきた。

2023年度は、この教育総合データベースを活用し、こども家庭庁「こどもデータ連携実証事業」として、内田洋行とAI開発企業のPKSHAグループと共に「不登校予測モデル」の構築に取り組んだ。

開発に携わった同市教育委員会事務局教育政策室主幹の秋葉健太氏は、「2022年度における500ほどのデータ項目を収集し、AIの機械学習を用いて不登校予測モデルをつくりました」と説明する。例えば、長期欠席調査、埼玉県学力・学習状況調査、学校生活に係るアンケートなどの各種調査結果、出欠・遅刻・早退の状況や保健室利用状況、教育相談の利用の有無、いじめ等に関する記録などのデータを用いたという。

具体的には、2023年12月からダッシュボードを市内の18の公立校(小学校12校、中学校6校、計約1万2000人の児童生徒を対象)に連携し、現場でのデータ活用を推進した。

ダッシュボードは、3種類ある。出欠や保健室利用状況といった記録系情報のほか、テスト結果やアンケート回答などのデータが蓄積された「児童(生徒)ダッシュボード」、学級や学年、学校の単位で分析したデータが確認できる「学校×市平均ダッシュボード」、そして、不登校リスクスコアが示される「不登校リスク判定ダッシュボード」だ。

アンケート「授業がわかる調査(小学校)」のデータ画面。レーダーチャートやハイライトでわかりやすく結果を可視化し、気になる子どもを抽出しやすくしている
学力調査の分析画面。個人データだけでなく、学級、学年、学校という集団単位のデータ分析も確認できる

「不登校リスクスコア」は、最もリスクが高いスコア80以上を赤色で示し、ピンク、オレンジ、黄色と数値が高い順に表示。アクセスできるのは、校長と教頭に限定している。

「不登校リスクスコア」の画面。スコアごとに色分けして表示

「小学校ではスコア53以上、中学校ではスコア65以上の高リスク層に対して、ダッシュボードの各種情報も参考にしながら支援の検討をしてもらうよう各学校にお願いしましたが、高リスクとして示される児童生徒はすでに見守り対象になっている場合が多いとのことでした。不登校リスクスコアの信頼性は高いと回答した学校も9割程度に達しており、高い精度でリスクのある子どもたちを発見できるモデルがつくれたのではないかと思います」(秋葉氏)

リスク予測により、状況が悪化する前に組織で対応できる

教育総合データベースを整備していくうえで、1人1台端末から取得した心身の状態のデータやアンケートで得た回答などさまざまな個人情報を扱っているが、子どもや保護者からはどのように同意を得たのだろうか。

「基本的には、各種調査などで子どもからデータを取得する際や、ダッシュボード連携に当たっての保護者宛ての通知において、教育総合データベース利活用の目的を明示するなど丁寧な説明に努めています。もし個人情報削除の希望があれば、データを除外できるようにしていますが、そうした方はごくわずかでした」

また、出欠情報や保健室の利用状況などのデータは校務支援システムから、福祉部局のデータは市役所内のネットワークを通じて取得しているという。「国の実証事業ガイドラインも踏まえ、個人情報保護法(法第69条第2項第2号又は第3号)に基づく目的外利用や外部提供の手続きを経たうえで、必要なデータを取得しました」と秋葉氏は説明する。

実際、現場ではどのような成果が生まれているのか。秋葉氏は、まず不登校リスクに対して組織で対応できる体制が整えられた点を挙げる。

「これまでは、気になる児童生徒の状況が悪化してから管理職に報告するというケースがありました。しかし、今は担任だけでなく管理職も同時にデータで状況を確認できるため、リスクの高い児童生徒がいた場合に学校として迅速に対応できます。とくに小学校の先生は忙しいので、管理職側から声をかけることで、状況が悪化する前にアプローチできるようになったという声をいただいています」

目下の課題は「タイムリーなデータ連携」

一方で、課題もある。市内に限定した取り組みのため、不登校予測の精度を上げていくにはサンプル数が少ないという。また、タイムリーなデータ連携もできていない。

「小学校と中学校でそれぞれモデルをつくりましたが、いずれも毎年4月~10月末時点で取得可能なデータを基に、11月以降の不登校リスクを予測するものになっています。現状、データ更新は手動で作業負荷も大きく、『昨日までの出欠情報』などタイムリーなデータを反映したモデルにはなっていません。本市では、子どもたちの支援策を検討するケース会議が小学校で月1回、中学校で週1回行われていますが、現場からも『せめてその頻度に合わせてデータ更新をしてもらえると、支援策を検討しやすい』という意見が多く寄せられており、データ連携の自動化は今後の課題です」(秋葉氏)

また、予測モデルの精度を高めていくためには、日々の出欠状況のような、更新頻度の高いデータを多く集めていく必要もあるという。同市では2022年度末から、小学校の校内サポートルーム「ぱれっとルーム」のモデル校に指定された3校において、「シャボテン(心の天気)」というアプリを使い、児童に1人1台端末から心や体の調子を4段階で毎日入力してもらっている。このほか、中学校1校でも、「きもちメーター」という健康観察アプリを活用している。

「心身の調子が悪くなるときが支援のタイミングだと言われていますので、このような毎日の心身に関するデータ収集を拡大して精度を高めていくことは重要になります。また現場から、『リスク判定の根拠がわかりにくい』といったご指摘もあり、例えば『欠席が何日続いたら危険』といったようなシンプルなロジックによるアラートも必要かもしれません。実証事業は、今年3月までで終了しましたが、引き続き市の事業として取り組み、精度を上げたいと考えています」(秋葉氏)

ハードルが高い「いじめや貧困・虐待のSOS検知」

今後は不登校だけではなく、いじめなどのSOS検知にも取り組む方針だが、現時点ではまだ本格的に着手するには至ってない。

「いじめ予測についてはデータのサンプル数も少なく、不登校予測よりもハードルが高く慎重な対応が必要になります。貧困や虐待のSOS検知も同様ですが、そもそもいじめられた子や貧困家庭の子のデータを教師データとしてよいのかというと、難しいと感じています。児童生徒のテキストデータなどから異常を検知するなど別の方法もあり、まだまだ検討が必要な段階にあります」(秋葉氏)

今回の実証事業では、ダッシュボードは「バラバラだったデータをワンストップで確認できるのはありがたい」といった声が多く寄せられた。学力やアンケートの結果も経年比較でき、小中連携の観点からも状況を把握しやすいということで、現場からの評価が高かったという。「実際にデータを活用いただくことで、学校現場のデータリテラシーが向上し、データ取得の重要性も実感いただけたと感じています」と、秋葉氏は話す。

今後の教育総合データの利活用はどう進んでいくのか。教育政策室長の片境俊貴氏は、次のように説明する。

「トライアンドエラーを繰り返しながら、挑戦しつつ改善していく形でやってきましたが、その目的はデータベースを使うことではなく、子どもたちの支援を手厚くすることにあります。また、学校現場が使えるものにしていくことも大切です。当面の目標としては、やはりデータの自動連携などタイムリーにデータを更新できる体制を整えていきたい。SOSの早期把握ができるよう、AIなどの最新技術も活用しながらさらに精度を高めていきたいと考えています」

(文:國貞文隆、写真:埼玉県戸田市教育委員会提供)