マシンビジョンの進化
Jon Gabay(マウザー・エレクトロニクスへの寄稿)
最初の気象衛星が登場して以来、「ビジョン(視覚)」を授かった機械は、マシンビジョンアプリケーションの進化の土台を築いてきました。当初、こうしたアプリケーションでは、重要な情報の分析と抽出は人間の介入に大きく依存していましたが、絶え間ない進歩により、最新の画像処理技術は人間の能力を凌駕し、人間が認識できないようなものも発見できるようになりました。画像データのデジタル化はこうした能力の実現に大きな役割を果たしています。このデジタル化されたシステムに人工知能(AI)が統合されたことで、機械はいっそう高度なツールに生まれ変わり、新たな可能性が広がりました。この革命の幕開けに、ますます多くのデバイスがビジョンを中核機能に組み込んでいます。
デジタル暗室の登場
デジタル画像はニュースサービスとテレビ放送によって加速的に普及しました。1957年、ラッセル・キルシュが世界初のデジタル画像を作成し、画像処理の歴史は転換点を迎えました。1970年代後半には、報道局が初期のマイクロプロセッサを活用したソフトウェアベースによるアプローチを始め、最初のデジタル暗室が誕生し、大きな飛躍を遂げました。1987年、Macintoshの初期のプログラム「Digital Darkroom」がリリースされ、画像を編集・処理できる初めての一般向けツールとして歴史に名を刻みました。その後、高解像度スキャナが登場し、画像のデジタル化が一般ユーザーにも利用できるようになりました。デジタル化画像では、トリミング、コントラストと明るさの調整、サイズ変更から、エッジ畳み込みのような基本的な機能拡張まで、様々な処理が可能です。技術の進歩と共にこれらの機能は進化と拡張を遂げましたが、それによってより優れたハードウェアと高度なソフトウェアソリューションが求められています。
社会に浸透するマシンビジョン
画像センサとマシンビジョンは、今や私たちの生活になくてはならないものとなりました。スマートフォンやタブレット、ノートパソコンといった個人用デバイスから、工場や自動車、高速道路などの産業用画像システムまで、画像センサとマシンビジョンはありとあらゆる場所に存在します。こうしたシステムのコストパフォーマンスは年々劇的に向上しており、デジタルカメラは家庭から公共建物まで、セキュリティを提供するあらゆる場所で普及しています。イメージセンシング技術の進歩で、画像処理・通信機能を内蔵した広範なモジュラー式カメラにアクセスできるようになり、技術者の負担は大幅に軽減されました。
マシンビジョンは社会に大きな利益をもたらしています。工場ではマシンビジョンが製品検査、ロボットマニピュレータの制御、欠陥検出、安全確保に使用されています。例えば、回路基板上の数千個のハンダ接合を人間が検査すると数分かかりますが、最新の高フレームレートのオートフォーカスカメラなら数秒で完了します(図1)。
図1: 部品をハンダ付けしていない/ハンダ付け済みのプリント基板の検査で、人間よりも遥かに速く正確に製造上の欠陥を検出する。(画像提供:xiaoliangge/stock.adobe.com)
また、バックアップビュー、存在検知、衝突回避を提供する車両カメラやイメージセンサにもマシンビジョンが使われています。医療分野では、高解像度イメージセンサが骨折の診断から組織サンプルの細胞の特定まで、あらゆることに使用されています。こうした分野ではマシンビジョンとAIが経験豊富な医師より優れた成果を上げており、これまで知られていなかった新しい指標を発見することもよくあります。都市部では、街頭カメラや建物のカメラでリアルタイムの顔認識を行い、警備やターゲット広告に活用しています。法執行機関や軍もドローンやミサイル、飛行機、衛星にマシンビジョン技術を採用しています。
マシンビジョンの最新機能
解像度とフレームレートは飛躍的に向上していますが、マシンビジョンの最も顕著な進歩は、マシンが3次元で認識できるようにする立体視です。この進歩は産業・製造分野に重大な意味をもたらし、物体の迅速な識別と分類、欠陥検出の強化を促進します。
3D視覚は製造工程と自動運転車の運行に革命を起こしました。優れたプロセッサと深いメモリープールを組み合わせれば、3Dマシンビジョンシステムは迅速に物体を識別し、動きを追跡し、速度と方向を認識して、その後の位置を予測することができます。
進化する次世代マシンビジョンシステムの設計課題
カメラの機能が向上するにつれ、より高速で高度な電子部品が求められています。例えば、従来の256×256ピクセルのグレースケールカメラが1枚の画像を取得するには65,536バイトが必要です。眼のフリッカー値を超えるには1秒あたり30フレームが必要で、1秒間の動画には1,966,080バイトが必要になります。一方、最高級の高解像度・高速フレームレートのカメラは、1080×800ピクセル、24ビットの解像度で1秒あたり4,000フレーム(4,000fps)を処理できます。これは画像1枚あたり2,592,000バイトに相当し、1秒間の動画では10,368,000,000バイトという驚異的な数字になります。
このようなメモリ要求を満たすために、対応するハードウェアの処理・通信速度も急上昇しています。そのため、両方のクロックエッジを使用して、読み取りごとに書き込みを行う、超高速メモリ(一般にDDR4)の大規模なプールの必要性も高まっています。幸い、マルチコアプロセッサと専用のFPGAハードウェアを使用すれば、データストリームをパイプライン処理し、ビットプレーン分解のような基本的な画像拡張をリアルタイムで実行できます。ビットプレーン分解では、モノクローム画像で最重要ビットだけを検査してエッジを検出することができます。
マシンビジョンの最大の進歩は、おそらくAIプロセッサとニューラルネットワークを搭載した画像処理ユニット(GPU)でしょう。GPUは内部並列処理技術と専用の画像処理ハードウェアを使って、設計技術者の作業を大幅に簡素化しました。また、機械学習は大規模なデータセットと相性が良いため、これらの機能はGPUとAIとの組み合わせにより、次のレベルに引き上げられるでしょう。
最新の機械駆動型アプリケーションを設計するエンジニアは、ポイント・ツー・ポイントで画像データを十分に伝送できる高速通信システムも考慮しなければなりません。例えば、最近の自動車は、100Mbpsのイーサネットネットワークを使用して、中速度で中解像度の画像をディスプレイや自動車のスーパーコンピュータに転送しています。さらに、こうしたコンピュータは、事故再現や犯罪捜査のために継続的にデータを記録するイベントデータレコーダ(いわゆるブラックボックスレコーダ)用に、大容量の不揮発性フラッシュストレージを必要とします。
最近のマシンビジョンには、しばしば暗視機能も求められます。例えば、自動車アプリケーションの場合、暗視機能を備えた前方監視カメラがあれば、ドライバーが気づく前に潜在的な危険を警告できます。
モジュールでより簡単に
AIビジョン設計は長い学習時間を必要とし、優れたアイデアの市場投入を遅らせる可能性があります。幸い、Advantech ICAM-520産業用AIカメラ(図2)のようなモジュールは、この学習時間を短縮してくれます。産業グレードの1.6MP SonyイメージセンサをベースにしたICAM-520は、プログラム可能な可変焦点レンズシステムと複数のArm®プロセッサを搭載し、クラウド・ツー・エッジのビジョンAIアプリケーションに対応します。
図2:Advantech ICAM-520産業用AIカメラ(画像提供:マウザー・エレクトロニクス)
ICAM-520は、NVIDIA® Jetson Xavier™ NXシステム・オン・モジュール(SoM)と64ビットCamel Armv8.2 CPUを搭載しています。70mm×40mmのJetson Xavier NXは、世界最小のスーパーコンピュータとして知られ、自律型マシン設計のために特別に設計されたフル機能のマルチモーダルAIエンジンです。機械学習機能はICAM-520に直接組み込まれ、V4L2およびRTSPインターフェイス対応のクラウドサービスへの統合用に、HTML5ウェブベースユーティリティを搭載しています。
60FPS ICAM-520には高速データ転送用のUSB Type-Cポートと10/100/1000オートネゴシエーション・イーサネットポートがそれぞれ1つあります。また統合HDMI 2.0ポートで、ローカルモニタやディスプレイに簡単に直接接続できます。さらにRS-485ポートをペリフェラルの制御、コマンド、ステータスに利用できるほか、統合デジタルI/Oでユーザーインターフェイスのカスタマイズも可能です。
このモジュールには、8GBレベル2および4MBレベル3の内部キャッシュメモリと、16GBのeMMCストレージが内蔵されています。
まとめ
マシンビジョンの概念は、シンプルなカメラやディスプレイから飛躍的に進化しました。現在のマシンビジョンは固有の要件に合った多様な機能を備える、包括的な画像処理システムです。高性能処理とメモリは先進的アプリケーションに不可欠な構成要素です。
幸い、すべてのマシンビジョン設計が過度に複雑なわけではありません。画像モジュールや処理エンジンの助けを借りて、マシンビジョンはより多くの設計者が利用できる技術となっています。先進的な高速メモリ技術は、取得データの処理、保存、伝送という課題に追いついてきています。
バスの拡張、データストリームのパイプライン処理、並列処理といった設計手法とAIは、エンジニアに貴重な支援を提供しています。AIを組み込んだカメラモジュールを使用すれば、ビデオソースを気にせず、アプリケーションに集中することができます。Advantech ICAM-520のような高品質のモジュール式カメラアセンブリは、カスタム設計のタスクを軽減し、先進機能を搭載した製品の迅速な市場投入を迅速化します。