software development, test automation, mathematics, artificial intelligence, blockchain, SES, mobile, web, development,

agNedia's official somniloquy

agNedia Blog!

Artificial Intelligence

ARやら、Deep Learningやら・・・。画像認識だけなら・・・

投稿日:

画像認識技術について、ちょろちょろと書いてみたい

AR

Augmented Realityの略。弊社でも4件ほど実装実績があります。
簡単に言うとパターンマッチングです。数学で言うと最小化・最大化・最適化問題の応用。
従来、平面(2D)で行われていた画像認識を三次元(3D)にしたものです。
回路(ロジック)が3Dグラフィックライブラリ(OpenGLなど)を使ったもので、比較元のパターンが多ければより多くの物を認識します。
学習はしませんが、バーコード認識、QRコード認識、文章読み取りなど比較的容易に実現できます。
元パターンの長さがわかっているので、測量や距離計測など応用もできます。

Deep Learning

深層学習による画像認識です。
原理的には視覚パーセプトロンの拡張と思われます。簡単に言うとパターンマッチです。
数学で言うと、学習ロジック+最小化・最大化・最適化問題の応用。
回路(ロジック)がニューラルネットワークの最後に分類する回路(最適化)が入ります。
マイクロ的認識(昔のニューラルネットワーク)+マクロ的認識(深層の部分)の組み合わせにより認識精度を上げています。

ARと3つの大きな違いがあります。
ARと違うのは、完全な三次元(3D)に対応している点。学習により、見えていない被写体の特徴も覚え、パターンマッチングする。これにより動作(例えば、回転物)に対してもパターンマッチが可能。ARは見えている部分しかパターンマッチしない点が1番目の違い。
二番目の違いは、学習する点。
三番目の違いは、他の要因も画像と合わせてパターンマッチングする事が可能。他の要因とは、温度、湿度、音、匂い、加速感、圧力、方位、座標、重力など、さらに音のスペクトラム、赤外線画像、超音波による距離計測も考えられる。

それと、画像認識、深層学習では消費電力は低くはなりません。必ず、電力を大量に消費します。理由は、大脳が大量の血液・酸素・糖分を必要とするからです。

PS: 動植物の学習の教師パターンは、DNAなのかもしれない。

画像認識だけなら

深層学習の応用としてFPGAで画像認識するには、画素数が少なく、応用範囲がかなり限られる。
視覚パーセプトロンのしくみは比較的簡単なので、FPGAを使う必要はないはず。王道的画像認識LSIで十分。例えば、Movidius MA2450、NVIDIA® Jetson™ TX2。認識画素数4メガとか可能。
弊社でも、Movidius MA2450を使ったGoogle Vision AIYを評価してみましたが、そこそこの画像認識しました。しかも、オープンプラットフォームで開発者が容易に参画できるので、低開発コストで優れたソフトウェアが世界中で開発されます。










-Artificial Intelligence
-, , ,

Copyright© agNedia Blog! , 2018 All Rights Reserved Powered by STINGER.