Google 一般公開データに日本国内の新型コロナ COVID-19 感染予測が加わりました。

 

予測期間も米国内で提供されていた14日間から28日間に拡大されています。

 

COVID-19 感染予測 (日本版) の公開について

 

上記のダッシュボードでは、28日間の新規感染予測の合計と平均値のみ掲載されていますが、日毎の感染予測推移は載っていなかったので Google BigQuery で感染予測データを取得して、Google データポータルでグラフ化してみました。

※Google BigQuery から取得しなくても、日本国内感染予測データはCSVファイルでも公開されています。

 

予測はAIにより感染症情報・過去の陽性者数などの統計値のデータでトレーニングしたモデルを使用しているとのことです。

モデルの詳細は記事の最後をご覧ください。

 

 

以下、データの取得とグラフ化について手順を追って説明した後、東京、神奈川、北海道、大阪についての感染予測レポートを載せます。

※手順を飛ばして、レポートへジャンプ

 

 

1. Google BigQuery からのデータ取得

 

Google BigQuery (COVID-19 Public Forecasts) にログインします。

日本の28日間県別感染予測の一般公開データのリポジトリは、下記になります。

bigquery-public-data:covid19_public_forecasts.japan_prefecture_28d

又は、

bigquery-public-data.covid19_public_forecasts_asia_ne1.japan_prefecture_28d

 

 

②上記のクエリを編集してデータ取得のSQL文を入力します。

※下記部分は横スクロールをかけている(SHIFT+マウスホイールスクロール可能)のでPCブラウザモードでご覧ください。

SELECT prefecture_code, prefecture_name, prefecture_name_kanji, forecast_date, prediction_date, new_confirmed, new_confirmed_ground_truth, cumulative_confirmed, new_confirmed_7day_rolling, new_deaths, new_deaths_ground_truth
FROM `bigquery-public-data.covid19_public_forecasts_asia_ne1.japan_prefecture_28d`
WHERE prediction_date >= "2020-11-21" AND prediction_date <= "2020-12-18"
ORDER BY
  prefecture_code ASC -- DESC
LIMIT 2000

 

③実行ボタンを押すと下部に結果が表示されます。

 

 

④上記「結果の保存」ボタンを押してクエリ結果をCSVで保存します。

※直接BigQueryからデータポータルに渡す方法もあるのですが、今回は一度CSVファイルに保存します。

 

2. Google データポータルを使用したデータのグラフ表示

 

データポータルを開きます。

 

 

②「データソース」タブを選択し、左上の「+作成」→「データソース」を選択します。

 

 

③「ファイルのアップロード」ボタンを押します。

 

 

④BigQueryで保存したCSVファイルをドラッグしてアップロードします。

 

 

⑤右上の「接続」ボタンを押します。

 

 

⑥データが読み込まれスキーマが表示されます。

ここで、「new_confirmed(新規感染者数)」の型が"テキスト"になっているので、"数値"に変更します。

 

⑦右上の「レポート作成」ボタンを押して、レポート(表、グラフ)を作成します。

 

 

⑧左の表は「ピボットテーブル」、右のグラフは「折れ線グラフ」を選択し、東京(TOKYO)と神奈川(KANAGAWA)でフィルタリングして編集してみました。

 

 

⑨出来上がった表やグラフのレポートは、右ボタンでPDFで保存できます。今回は、Web上で共有してみます。

 

⑩右上の「共有」ボタンを押します。

 

 

⑪「アクセスを管理する」タブを選択し、アクセス権を設定します。

 

⑫URLが表示されますのでコピーします。

 

⑬下記がコピーしたレポートの共有URLです。

 

 

同様に東京、神奈川、北海道、大阪についてもグラフを作成してみました。

 

 

感染者予測データの取得とグラフ化についての手順は以上です。

 

[レポートについての考察]:

2つのレポートの内、後者11/26時点の12/21までの予測では、東京と大阪は新規感染者の増加傾向が続きますが、北海道と神奈川は微増傾向で、グループ間で大分差が出てくるようになっています。

 

また、いずれも12/19で飽和しているように見えます。

 

GOTOキャンペーンの一時停止で減少傾向に転じればよいのですが。

 

[参照資料URL]:

※目的・予測モデルの概要: COVID-19 感染予測 (日本版):ユーザーガイド

※予測モデル、モデルの開発に使用された方法論に関するホワイトペーパー: Interpretable Sequence Learning for COVID-19 Forecasting