FPN (2/4) 実施例の説明

はぐれ弁理士 PA Tora-O です。前回(第1回)では、FPNの概要について説明しました。改めて復習されたい方は、こちらのリンクから確認をお願いします。今回(第2回)は、FPNの実施例について説明します。

ネットワーク構造

まず、FPN(Feature Pyramid Networks)のネットワーク構造は、次に示す図1の通りです。

【図1】FPNのネットワーク構造

出展:Feature Pyramid Networks for Object Detection

FPNは、次の4つの技術的特徴、[1]Bottom-up pathway、[2]Top-down pathway、[3]Lateral connections、[4]Feature pyramid、を有するネットワークです。ざっくり言えば、[1]は畳み込みニューラルネットワーク(CNN)、[2]は逆畳み込みニューラルネットワーク(DNN)、[3]はスキップ接続(skip-connection)、[4]多重解像度の特徴マップ(Multi-resolution feature maps)、にそれぞれ相当します。

ここで、ラテラル接続(≒スキップ接続)とは、入力画像の符号化&復号化を行う際に、マップサイズが等しい上流側と下流側の特徴マップを合成する仕組みを意味します。

従来技術との対比

続いて、FPNと従来技術との対比を行います。ここで、従来技術として、(1)U-Net、(2)SSDを挙げておきます(図2)。ここで、U-Netは、画素レベルでの領域分割を行うセグメンテーションモデルの一種です。また、SSDは、One-Stage Detector に分類される物体検出モデルの一種です。

【図2】先行技術の概略図

出展:U-Net: Convolutional Networks for Biomedical Image Segmentation
出展:SSD: Single Shot MultiBox Detector

そこで、FPN、U-Net、SSDの各モデルについて、上記した4つの構成の有無を一覧できるように図3の表にまとめました。構成ありには「〇」を、構成なしには「×」をそれぞれ付けています。

【図3】構成の対比表

図3の対比表(つまり、クレームチャート)から理解されるように、FPNは、U-NetとSSDを組み合わせた技術であって特許性(進歩性)がないようにも思われます。

 

以上、今回(第2回)は、FPNの実施例について説明しました。次回(第3回)は、FPNの特許性について少し突っ込んで考察します。

↓ブログランキングに参加しています。よろしければ1クリックお願いします。

にほんブログ村 士業ブログ 弁理士へ
にほんブログ村

にほんブログ村 IT技術ブログ IT技術メモへ
にほんブログ村