➤概要
・10年前、研究者たちはコンピューターで犬と猫を見分けるのはほとんど無理だと考えていた。
→現在では画像にラベルを付けて分類させることで、99%以上の精度で実現可能
・Redmon氏はDarknetという画像分類プログラムを立ち上げた一人
Darknet: C言語で書かれた深層学習フレームワークの一種、You Only Look Once (YOLO)という技術を活用した物体検出に優れている。
Darknetを用いれば、従来の「犬か猫の違いだけでなく、犬種まで識別できる」技術に加えて、画像の中でどんなことが起きているかを把握することができる。
→各々の物体を箱で囲って、それらがなにかを識別する(物体の位置や大きさを含む)
・ローンチから数年で1画像あたりの処理速度を20秒→20ミリ秒(1000倍)に高速化することに成功した
どのようにしたのか?
従来のモデル:画像を数々の領域に分割したのちに、分類プログラムで篩をかけて高いスコアが出たところに物体が検出されたとみなす。この方法は一つの画像に対して何千回もニューラルネットで評価をする必要があった。
Darknetの場合:代わりに境界上の箱や、分類の正確さの確率を一気にまとめて生成する。画像は一度しか見ない(YOLO)
・Darknetは汎用物体検出システムで、あらゆる分野に利用可能(自動運転や医学的、ロボット工学的な類)
ナイロビ国立公園では、動物の個体調査
→Darknetは無料のオープンソースで誰でも使える
Redmon氏はこのオープンソースを利用して、世界中の人々がどのようなものを生み出してくれるか楽しみ
➤感想
最近、Pythonによる画像認識処理についての講習を受けてきたばかりなので、自分の中でホットなトピックであった。このYOLOという物体検出システムは、自分が学んできたニューラルネットの構造や深層学習の基礎をまさに応用したもので、前回学んだことは本当にこの分野の入り口でしかないと再認識させられた。この公演は1年も前のものなので、その間にもフレームワークは更に改良を加えたことだろう。Darknetに関しては、無料で誰でもインストール可能なためこのページを参考にしながらお試しで触ってみようと思う。