何時もの話っ！ | ROBOT翔・公開技術情報

9軸IMUセンサ ICM-20948をロボットに組み込もう

はじめに
環境
DMP3の出力確認
最後に
商品化モジュール
- 詳細情報
- 取扱店舗
参考文献
関連記事

はじめに

TDK Invensense製9軸IMUのICM-20948は、MPU-9250の後継機種で、MPU-9250のVDDは2.4V～3.6V、VDDIOは1.71V～VDDに対して、ICM-20948のVDDは1.71V～3.6V、VDDIOは1.71V～1.95Vに低めに設定して、省電力となった。また、デジタルモーションプロセッサDMP(ICM-20948内蔵FPGA)によるデータフュージョン(FPGAによるFusion)の特長が継承して、さらにRAM容量が拡張して、6軸フュージョンのみならず9軸フュージョンまで増強して、較正機能もあると、以下参考文献を読むと詳細まで分かる。

環境

・Ubuntu 18.04
・ROS Melodic
・MCU: Cortex M0+
・IMU: ICM-20948

DMP3の出力確認

以下のように、出力レート50Hz、加速度Ax Ay Az、角速度Gx Gy Gz、磁場Mx My Mz、4元数Qw Qx Qy Qzの順に出力させる。

4時間+にわたる連続動作して出力を確かめる。確認環境は完全に静止な状態でもないので、ドリフトは納得いく範囲内にとどまっている。rvizで確かめてもドリフトが肉眼では見えないほど。ドリフトにおいては、MPU-9250から大いに改善されたと見られる。

出力確認動画は以下イメージをクリックすると、youtubeへジャンプする。

最後に

MPUシリーズと比べて、ユーザの事前校正いらず、長時間(実験は4時間程度まで）においても、ドリフトとくにヨウ角（Yaw、方向角）のドリフトは目立たないほどになった。また、1.71Vの低電圧でも動作可能なのでスマートデバイスや、ロボットの長時間電池駆動が可能になる。なお、出力レートはMax 225Hzと確認できた。ICM-20948 DMP3(IMU内蔵FPGA)から出力した、Accel/Gyro/Mag計9軸データ出力にFusion Quaternionの4元数データがそのまま利用可能で、遅延もソフト・カルマンフィルタなどより少なく他機種IMUより優れる（低遅延、6軸／9軸フュージョンデータ出力レート225Hz）ため、ロボットの精度向上に利用可能。1.8V VDDIO対応、DMP3の出力に手間かかった末、地磁気センサ出力は75Hzまでと少し残念だが、総じて優秀としか思わないICM-20948をロボット装置に組み込もうと決めた。

商品化モジュール

ICM-20948とCoretex M0+を組み込んだ回路を設計して、ROSに対応したロボット専用センサモジュールとして商品化して、2021年1月～、リリースと予定している。この商品は皆さんの学術研究にお役に立てるようと願う。主な仕様は以下のとおり。
・構成　CortexM0+ & TDK Invensense ICM-20948(9軸)実装
・接続　USB Type-Cコネクタ実装
・出力　6軸／9軸融合4元数はFPGA on chipから低遅延で出力、別途ソフトでフュージョン必要なし、出力レート225Hz、同時に加速度(アクセル)3軸データ225Hz、角速度(ジャイロ)3軸データ225Hz、地磁気(コンパス)3軸データ75Hzまで出力可能
・ROSパッケージ、Githubへ公開、ROS Kinetic以降対応、ROS TopicへSubscribeすることでデータが受け取り可能
・rviz実演、実演ビデオあり

【2021年3月いま現在】1回目制作分（評価版）、大学など研究機関へ無料配布中（アンケート調査あり）、WEBでの募集を含めて順次終了。

【2021年4～5月予定】2回目制作分（商用版）、販売の予定。

詳細情報

9軸IMUセンサ 6軸／9軸フュージョン低遅延 USB出力補正済み ROS対応

取扱店舗

9軸IMUセンサ 6軸／9軸フュージョン低遅延 USB出力 ROS対応 | ROBOT翔

参考文献

Migrating from MPU-9250 to ICM-20948-InvenSense

9軸IMUセンサ MPU-9250をロボットに組み込もう
 6軸IMUセンサ MPU-6050をロボットに組み込もう

ロボット・ドローン部品お探しなら

はじめに

9軸IMUのMPU-9250はTDK InvenSense社製I2Cインターフェースの3軸ジャイロセンサ+3軸加速度センサ+3軸コンパスセンサIC、内蔵DMP(Digital Motion Processor)機能を使うことで、補正済みデータとしての4元数Quaternionまたはオイラー角、ロールRoll・ピッチPitch・ヨウYaw角の出力が選べる。また、MPUシリーズはすでに新規設計非推奨になっているため、後継機種はICMシリーズで、MPU-9250の後継機種はICM-20948となって、MPU-9250に比べて、事前校正不要で、ドリフトの低減、省電力などにおいてパフォーマンスが改善された。本文は、6軸MPU-6050に続いて、9軸MPU-9250 DMPから4元数Quaternionを読み込んで可視化するまでの手順を以下のとおりに示して、ROSドライバをGithubへ公開する。安価のため、MPU-9250サンプルの入手ルートはAliexpressにした。

mpu6050-mpu9250 — mpu6050(6軸)-mpu9250(9軸)

※I2Cインターフェースは、vcc、gnd、scl、sdaの4pinインターフェース

環境

・ubuntu 18.04 Tinker board(or Raspiberry Pi, PC)
・ROS melodic
・DFRobot Romeo mini v1.1(or arduino uno互換)
・MPU-9250/6500

準備①

・ros-melodic-rosserial-arduino、ros-melodic-rosserial、rviz_imu_pluginを入れる

$sudo apt-get update
$sudo apt-get install ros-melodic-rosserial-arduino
$sudo apt-get install ros-melodic-rosserial
$cd ~catkin_ws/src/
$git clone -b melodic https://github.com/ccny-ros-pkg/imu_tools
$cd ..
$catkin_make_isolated

・mpu9250_imu_rosを入れる

$cd ~/catkin_ws/src/
$git clone https://github.com/soarbear/mpu9250_imu_ros.git
$cd ~/catkin_ws/
$catkin_make_isolated

準備②

・firmware/MPU9250_DMP/MPU9250_DMP.inoをArduino IDEでArduinoに書き込む。

imu/dataの可視化

・実に使われるポートtty????を確認する。
・rvizが自動起動して、画面にあるセンサの動きを観察する。

$sudo ls -l /dev/ttyACM*
$sudo chmod 777 /dev/ttyACM0
$roslaunch mpu9250_imu_driver mpu9250_imu.launch

・以下スクリーンショットをクリックすると、youtubeへ遷移する。

センサ融合について

MPU-9250内蔵DMPおよび、センサ融合またはデータ同化Fusionに定番アルゴリズムであるKalman Filterの他、Complementary Filter、Madgwick Filterがある。振動やシステム誤差によって測定値に大きな影響あり、フィルタリングが必須とは言える。

ソースコード

mpu9250_imu_rosソースコード(Github)

後継機種

ICM-20948はMPU-9250の後継機種、その製品化情報は 9軸IMU/AHRS 6軸&9軸回転ベクトル&3軸オイラー角 MAX1000Hz同時出力 ROS/ROS2対応 USB接続、9軸IMU 6軸／9軸フュージョン ICM-20948 Cortex-M0+内蔵 ROS対応

参考文献

1-Jeff Rowberg氏: I2C driver
2-ROS Repository: ROS imu_tools

9軸IMU/AHRS 6軸&9軸回転ベクトル&3軸オイラー角 MAX1000Hz同時出力 ROS/ROS2対応 USB接続
 9軸IMUセンサ 6軸／9軸フュージョン低遅延 USB出力補正済み ROS対応
 9軸IMU ICM-20948をロボットに組み込もう
 6軸IMU MPU-6050をロボットに組み込もう

ロボット・ドローン部品お探しなら

カルマンフィルタの導出

はじめに

wiki: 「カルマンフィルタ$(Kalman Filter, KF$と略す$)$ は、誤差のある観測値を用いて、ある動的システムの状態を推定あるいは制御するための、無限インパルス応答フィルタの一種である」。観測値に観測雑音、状態予測値にシステム雑音があって場合により時間とともに誤差がドンドン蓄積してそのまま使えないので、観測と予測のガウス性を利用した線形センサデータフュージョンがカルマンフィルタの原点である。

キーワード

状態空間モデル、線形システム、ガウス分布、最小二乗法、最小解析誤差(共分散行列)、予測値、観測値、推定値、カルマンゲイン、線形化、拡張カルマンフィルタ

状態空間モデル

時系列解析の中で、予測値と観測値の間何らかの因果関係を見つけて、何らかの方法でそれらのデータを絡んでモデル化して状態を推定していく。ここで汎用的な状態方程式、観測方程式は以下の式にする。
$$\begin{eqnarray*}&& x_t = F_{t-1}(x_{t-1} ) + q_{t-1} \space \space * \\&& y_t = H_t(x_t) + r_t\end{eqnarray*} $$
ただし、システム雑音、観測雑音$(q_t, r_t)$は期待値が$0$、分散が$(Q_t, R_t)$の独立正規分布（ガウス分布）にする。
$$\begin{eqnarray*}&& p(q_t) ～ N(0,Qt)\\&& p(r_t) ～ N(0,Rt)\\&& E[q_t r_t]=0 \end{eqnarray*}$$

基本原理

カルマンフィルタの原理は以下のイメージに示すように、最小解析誤差推定（最小二乗）から予測値、観測値をそれぞれの割合$I-K_t H_t , K_t$で線形合成した値を状態推定値にする。

式の導出

ベイズ定理やガウス分布からいくつかの導出方法はあるが、本記事は最もシンプルな最小二乗法を用いて、カルマンフィルタの黄金$5$式を誘導してみよう。

線形システム

$F(⋅)、H(⋅)$とも線形関数の場合、以下線形カルマンフィルタの誘導となる。例えば$ F(x)=Ax+B$、$A、B$とも実数行列、$x$は変数行列とする。

まずは、予測値(数学期待)を求めるのは出発点なので、すべては以下の式(再掲)から始まる。
$$ x_t = F_{t-1}(x_{t-1} ) + q_{t-1} \space \space * $$
推定値$\hat{x}_t$は、重み$K_t$の調整で予測値$x_t$と観測値$y_t$の間にあろうとして、以下線形表現とされる。
$$ \hat{x}_t = x_t + K_t(y_t-H_t x_t) \\
{\small = F_{t-1}(x_{t-1}^{true}+p_{t-1}) + q_{t-1}+ K_t\{(H_t x_t^{true}+r_t) }\\
{\small – H_t(F_{t-1}(x_t^{true}+p_{t-1})+q_{t-1})\} }\\
{\scriptsize = x_t^{true}+F_{t-1}p_{t-1}+q_{t-1}+K_t(r_t-H_t F_{t-1}p_{t-1}-H_t q_{t-1}) }$$
この重み$K_t$は、またカルマン係数、カルマンゲインと呼ばれる。

解析誤差(共分散行列)は以下の式より求める。
$$ P_t = E[(\hat{x}_t-x_t^{true})^2] \space \space \\
{\scriptsize = E[(F_{t-1}p_{t-1} + q_{t-1} + K_tr_t-K_t H_t F_{t-1}p_{t-1}-K_t H_t q_{t-1})^2] }\\
{\scriptsize = F_{t-1}P_{t-1}F_{t-1}^T-2F_{t-1}P_t F_{t-1}^TH_t^T K_t^T+Q_{t-1}-2Q_{t-1}H_t^T K_t^T }\\
{\scriptsize + K_t R_t K_t^T+K_t H_t F_{t-1}P_{t-1}F_{t-1}^TH_t^T K_t^T+K_t H_t Q_{t-1}H_t^T K_t^T \space \space \star } $$

ここから二乗の最小化より解析誤差(共分散$P_t$)を最小値に至る$K_t$を求める。
$$ \frac {\partial P_t } {\partial K_t } = 0 \\
{\small \frac {\partial P_t } {\partial K_t } = -2F_{t-1} P_{t-1} F_{t-1}^T H_t^T -2Q_{t-1}H_t^T +} \\
{\scriptsize 2K_t R_t + 2K_t H_t F_{t-1} P_{t-1} F_{t-1}^T H_t^T +2K_tH_tQ_{t-1}H_t^T = 0 \space \space \star \star } $$
上式の最初の二項目までを等式の右に移して、残りの項らから$K_t$を抽出しておくと、下式のように$K_t$は求められる。
$${\small K_t = (F_{t-1}P_{t-1}F_{t-1}^T + Q_{t-1}) H_t^T \{R_t + }\\
{\small H_t(F_{t-1}P_{t-1}F_{t-1}^T+Q_{t-1})H_t^T\}^{-1}} $$

これで、状態予測時、式$\star$及び式$\star\star$から得られる${\small P_t = F_{t-1}P_{t-1}F_{t-1}^T + Q_{t-1} \space ** }$を上式に代入して、$ K_t$は以下のように簡略化される。
$$ K_t = P_t H_t^T (R_t + H_t P_t H_t^T)^{-1} \space \space ** \space * $$
これから観測値を入れて、$K_t$ を使って予測値を更新する(推定値を求める)。
$$ \hat{x} = x_t + K_t(y_t – H_t x_t) \space \space **** $$
推定値を求めたら、続いて$P_t$を更新する。前述の$\star$式の展開項らに類似して、最後の式は誘導される。
$$ \hat{P}_t = (I – K_t H_t)P_t \space \space **** \space * $$
$\hat{P}_t$は、$P_t$より$K_t H_t P_t$だけ$0$に近づいて、つまり$x_t$より$\hat{x}_t$は知られかねる「真値」に接近になって、$K_t$の効果が現れることに違いない。$\hat{P}_t$は$(t+1)$時刻の$P_t$として利用される。また、式$* \space ～ \space **** \space *$はカルマン黄金$5$式とされる。

非線形システム

前述線形カルマンフィルタの$F(⋅),H(⋅)$は非線形関数になった場合、$f(⋅),h(⋅)$と記す。ティラー展開の最初の$2$項のみを使って、如何なる非線形関数とも線形化されるが、$3$項目以降は切り捨てられるので誤差を招くことにもなる。例えば、$f(x)=Ax^2+B$、$A,B$とも実数行列、$x$は変数行列として、ティラー展開の最初の$2$項のみを使って、即ち$ f(a)+\frac {\partial {f(x)}} {\partial {x}}|_{x=a}(x-a) $ のように$f(x)$を、$Aa^2+B+2Aa(x-a)$に線形化される。状態予測の際、線形カルマンフィルタの$F$を$f$、観測値の取り入れる際、線形カルマンフィルタの$H$を$h$に、共分散行列の計算の際、$F,H$を$ \frac {\partial {f(x)}} {\partial {x}}|_{x=x_{t-1}}, \frac {\partial {h(x)}} {\partial {x}}|_{x=x_t}$に置き換えて済む。

これまでカルマンフィルタの誘導で、逐次状態値推定の手順を以下のとおり整理しておく。

逐次状態推定の手順

時系列の状態推定に応用して、以下状態予測$Predict$→測定更新 $Measurement \space Update$→状態更新$Correct, Update$→時間更新$Time \space Update$→次の状態予測$Predict$→$…$の繰り返すことによって、時系列とともに状態の数学期待と最小解析誤差(共分散)を求める手順となる。

Step0=パラメータ初期化（t=0）

状態推定（数学期待）、解析誤差共分散の初期化
$$\begin{eqnarray*}&& \hat{x}_0 = E[x_0]\\&& \hat{P_0} = E[(x_0-\hat{x}_0)(x_0-\hat{x}_0)^T]\end{eqnarray*}$$

Step1=状態値、共分散行列予測（t>0）

$$\begin{eqnarray*}&& x_t = F_{t-1}(\hat{x}_{t-1})\\&& P_t = F_{t-1}\hat{P}_{t-1}F_{t-1}^T + Q_{t-1}\end{eqnarray*}$$
ただし、$x_t$は予測値、$P_t$は事前共分散行列、$Q_{t-1}=E[q_{t-1}q^T_{t-1}]$

Step2=カルマンゲイン、状態値、共分散行列更新

$$\begin{eqnarray*}&& K_t = P_t H_t^T (H_t P_t H_t^T + R_t)^{-1}\\
&& \hat{x_t} = x_t + K_t(y_t – H_t x_t)\\&&\hat{P}_t = (I-K_t H_t) P_t \end {eqnarray*}$$
ただし、$K_t$はカルマンゲイン、$\hat{x}_t$は状態推定値、$\hat{P}_t$は事後共分散行列、$R_{t}=E[r_{t}r^T_{t}]$

KFフローチャート

拡張カルマンフィルタ

拡張カルマンフィルタ$(Extended Kalman Filter, EKF$と略す$)$は、非線形フィルタリングである。前述した状態方程式、観測方程式より、以下の状態空間モデルの$f(⋅)$または$h(⋅)$が非線形関数であり、拡張カルマンフィルタが適用される。テイラー展開より、2次微分以降の項目を省略して、非線形である$f(⋅), h(⋅)$の1次微分を線形化とし、前述したカルマンフィルタのアルゴリズムが適用可能となる。しかし、$f(⋅), h(⋅)$の微分では$f(⋅), h(⋅)$の一部しか表現できず、この線形化処理（1次微分）が誤差を招くことになる。
$$\begin{eqnarray*}&& F_{t-1} =\frac{\partial f_{t-1}(x)}{\partial x}|_{x=\hat{x}_{t-1}}\\&& H_{t} =\frac{\partial h_{t}(x)}{\partial x}|_{x=\hat{x}_{t}}\end{eqnarray*}$$

状態空間モデル

$$\begin{eqnarray*}&& x_t = f_{t-1}(x_{t-1}) + q_{t-1}\\&& y_t = h_t(x_t) + r_t\end{eqnarray*}$$

Step0=パラメータ初期化（t=0）

$$\begin{eqnarray*}&& \hat{x}_0 = E[x_0]\\&& \hat{P}_0 = E[(x_0-\hat{x_0})(x_0-\hat{x_0})^T]\end{eqnarray*}$$

Step1=状態値、共分散行列予測（t>0）

$$\begin{eqnarray*} && x_t = f_{t-1}(\hat{x}_{t-1})\\&& P_t = F_{t-1}\hat{P}_{t-1}F_{t-1}^T + Q_{t-1}\end{eqnarray*}$$
ただし、$x_t$は予測値、$P_t$は事前共分散行列、$Q_{t-1}=E[q_{t-1}q^T_{t-1}]$

Step2=カルマンゲイン、状態値、共分散行列更新

$$\begin{eqnarray*}&& K_t = P_t H_t^T(H_t P_t H_t^T + R_t)^{-1}\\
&& \hat{x_t} = x_t + K_t(y_t – h_t x_t)\\&&\hat{P_t} = (I-K_tH_t) P_t \end{eqnarray*}$$
ただし、$K_t$はカルマンゲイン、$\hat{x_t}$は状態推定値、$\hat{P_t}$は事後共分散行列、$R_t=E[r_t r^T_t]$

EKFフローチャート

拡張カルマンフィルタを6軸IMUへの適用

6軸IMUへの適用例として、本サイトの記事　6軸IMU～拡張カルマンフィルタ　に載ってある。

カルマンフィルタの再考

カルマンフィルタでは、状態推定値を予測結果$x_t$（実装例ではジャイロセンサーデータ）と観測データ$y_t$（実装例では加速度センサデータ）の線形結合でデータ同化とし，その解析誤差(共分散)を最小にする推定法だと分かる。これは、状態方程式、観測方程式とも線形関数(非線形関数の場合、線形化する)、システム誤差、観測誤差の数学期待が$0$の正規分布との前提条件から由来した推定法である。しかし、カルマンフィルタをかけることで、状態推定値は予測結果と観測データの間にあるのは、真値からかなり乖離してしまう場合にあるのか。これはシステム誤差と観測誤差が無相関かつ直交という前提から、勿論推定値が真値と観測値の間にある、実環境の真値は分からないので推定値は真値と見なす結論に至る考えである。パーフォーマンスの検証は、比較的精確な実験環境（比較用の高精度ジャイロセンサ、加速度センサ、エンコーダ、モータ）がないと、実は容易ではない。というよりも、シミュレーションをかけてカルマンフィルタのアルゴリズムを検証するのが、確実に可能である。

参考文献

1-wikipedia: カルマンフィルタ、オイラー角
2-Greg Welch氏、Gary Bishop氏: An Introduction to the Kalman Filter
3-田島洋氏: マルチボディダイナミクスの基礎―3次元運動方程式の立て方

オイラー角～ジンバルロック～クォータニオン
 SLAM～拡張カルマンフィルタ
 SLAM～Unscentedカルマンフィルタ
 9軸IMUセンサ 6軸／9軸フュージョン低遅延 USB出力補正済み ROS対応
 9軸IMU ICM-20948をロボットに組み込もう
 YDLIDAR G4=16m 薄型 ROS対応SLAM LIDAR
研究開発用台車型ロボットキット

ロボット・ドローン部品お探しなら

6軸IMUセンサ MPU-6050をロボットに組み込もう

はじめに
環境
準備①
準備②
imu/dataの可視化
センサ融合について
校正
感想
ソースコード
参考文献
関連記事

はじめに

6軸IMUのMPU-6050はTDK InvenSense社製I2Cインターフェースの3軸ジャイロセンサ+3軸加速度センサIC、amazonで格安販売されている。内蔵DMP(Digital Motion Processor)機能を使うことで、補正済みデータとしての4元数Quaternionまたはオイラー角、ロールRoll・ピッチPitch・ヨウYaw角の出力が選べる。本文は6軸MPU-6050 DMPから、4元数Quaternionを読み込んで可視化するまでの手順を以下のとおり示して、ROSドライバをGithubへ公開する。また、MPU-6050を本文のArduinoに接続ではなくMain BoardのI2Cポートへ繋ぐなどの方法がある。また、MPUシリーズはすでに新規設計非推奨になっているため、ICMシリーズは後継機種となっている。安価のため、MPU-6050サンプルの入手ルートはAliexpressにした。

※I2Cインターフェースは、vcc、gnd、scl、sdaの4pinインターフェース

環境

・ubuntu 16.04 Tinker board(or Raspiberry Pi, PC)
・ROS kinetic
・DFRobot Romeo mini v1.1(or arduino uno互換)
・MPU-6050 GY-521

準備①

・ros-kinetic-rosserial-arduino、ros-kinetic-rosserial、rviz_imu_pluginを入れる

$sudo apt-get update
$sudo apt-get install ros-kinetic-rosserial-arduino
$sudo apt-get install ros-kinetic-serial
$cd ~catkin_ws/src/
$git clone -b kinetic https://github.com/ccny-ros-pkg/imu_tools
$cd ..
$catkin_make --pkg imu_tools

・mpu6050_imu_rosを入れる

$cd ~/catkin_ws/src/
$git clone https://github.com/soarbear/mpu6050_imu_ros.git
$cd ~/catkin_ws/
$catkin_make

準備②

・mpu6050_imu_driver/firmware/MPU6050_DMP6/MPU6050_DMP6.inoをArduino IDEでArduinoに書き込む。

imu/dataの可視化

・実に使われるポートtty????を確認する。
・rvizが自動起動して、画面にあるセンサの動きを観察する。

$sudo ls -l /dev/ttyACM*
$sudo chmod 777 /dev/ttyACM0
$roslaunch mpu6050_imu_driver mpu6050_imu.launch

・以下スクリーンショットをクリックすると、youtubeへ遷移する。

センサ融合について

MPU-6050内蔵DMPおよび、センサ融合またはデータ同化Fusionに定番アルゴリズムであるKalman Filterの他、Complementary Filter、Madgwick Filterがある。振動やシステム誤差によって測定値に大きな影響あり、フィルタリングが必須とは言える。

校正

ジャイロのドリフト、加速度センサのバイアスの校正が必要、i2cdevlibのArduino/MPU6050/examples/IMU_Zeroをarduinoに入れてオフセットを読み取り、MPU6050_DMP6.inoに盛り込む。またドリフトに対して、時間平均などキャンセリング手法の取り組みも必要だろう。

感想

「ないよりマシ」の観点から、マイナスにならないが、精度があまり追求しないロボットなどに使用可能と考えられる。ジャイロセンサの温度特性あり、またドリフトは時間とともに蓄積するので、一方加速度センサのバイアスが測定毎にあり、ただし蓄積しないので、最初から校正Calibrationの方法を講じることを考えれば、DMP機能まで用意されて可用性がある。Yaw方位角がジャイロから積分計算して合成していないので要注意で、他のセンサ例えばコンパスまたSlam Lidarなどとの組み合わせが可能である。

ソースコード

mpu6050_imu_rosソースコード(Github)

参考文献

Jeff Rowberg氏：I2C driver
ROS Repository：ROS imu_tools

9軸IMU/AHRS 6軸&9軸回転ベクトル&3軸オイラー角 MAX1000Hz同時出力 ROS/ROS2対応 USB接続
 9軸IMUセンサ 6軸／9軸フュージョン低遅延 USB出力補正済み ROS対応
 9軸IMU ICM-20948をロボットに組み込もう
 9軸IMU MPU-9250をロボットに組み込もう

ロボット・ドローン部品お探しなら

Mask R-CNNを試す

はじめに
デモを動かそう
デモの画像を入れ替えてみよう
感想
参考文献

はじめに

Mask R-CNNとはICCV 2017 Best Paper に選出された手法で、物体検出Object Dectectionやセマンティック・セグメンテーションSemantic Segmentationを実現するための手法である。COCOデータセットにより学習した、Matterport Mask_RCNNモデルを利用して、デモ画像より物体検出、セグメンテーションデモをGoogle colabで動かしてみよう。

デモを動かそう

Matterport Mask_RCNN、COCO API・Datasetのインストール、デフォルトのデモを動かす手順の以下の通り。

・Mask_RCNNのインストール、セットアップ

%cd /content/drive/My Drive
!git clone https://github.com/matterport/Mask_RCNN.git
%cd ./Mask_RCNN
!pip install -r requirements.txt
%run -i setup.py install

・COCO APIのインストール、セットアップ

%cd ..
!git clone https://github.com/waleedka/coco.git
%cd ./coco/PythonAPI
%run -i setup.py build_ext --inplace

・COCO Datasetで学習したMask_RCNNモデルのインストール

import os
import sys
import random
import math
import numpy as np
import skimage.io
import matplotlib
import matplotlib.pyplot as plt

# Root directory of the project
ROOT_DIR = os.path.abspath("/content/drive/My Drive/Mask_RCNN")

<pre class="brush: actionscript3; gutter: false">
# Import Mask RCNN
sys.path.append(ROOT_DIR)  # To find local version of the library
from mrcnn import utils
import mrcnn.model as modellib
from mrcnn import visualize
# Import COCO config
sys.path.append(os.path.join(ROOT_DIR, "samples/coco/"))  # To find local version
import coco

%matplotlib inline 

# Directory to save logs and trained model
MODEL_DIR = os.path.join(ROOT_DIR, "logs")

# Local path to trained weights file
COCO_MODEL_PATH = os.path.join(ROOT_DIR, "mask_rcnn_coco.h5")
# Download COCO trained weights from Releases if needed
if not os.path.exists(COCO_MODEL_PATH):
    utils.download_trained_weights(COCO_MODEL_PATH)

# Directory of images to run detection on
IMAGE_DIR = os.path.join(ROOT_DIR, "images")

class InferenceConfig(coco.CocoConfig):
    # Set batch size to 1 since we'll be running inference on
    # one image at a time. Batch size = GPU_COUNT * IMAGES_PER_GPU
    GPU_COUNT = 1
    IMAGES_PER_GPU = 1

config = InferenceConfig()
# config.display()

いよいよ認識しようと、以下のpythonコードを実行する。

# Create model object in inference mode.
model = modellib.MaskRCNN(mode="inference", model_dir=MODEL_DIR, config=config)

# Load weights trained on MS-COCO
model.load_weights(COCO_MODEL_PATH, by_name=True)

# COCO Class names
# Index of the class in the list is its ID. For example, to get ID of
# the teddy bear class, use: class_names.index('teddy bear')
class_names = ['BG', 'person', 'bicycle', 'car', 'motorcycle', 'airplane',
               'bus', 'train', 'truck', 'boat', 'traffic light',
               'fire hydrant', 'stop sign', 'parking meter', 'bench', 'bird',
               'cat', 'dog', 'horse', 'sheep', 'cow', 'elephant', 'bear',
               'zebra', 'giraffe', 'backpack', 'umbrella', 'handbag', 'tie',
               'suitcase', 'frisbee', 'skis', 'snowboard', 'sports ball',
               'kite', 'baseball bat', 'baseball glove', 'skateboard',
               'surfboard', 'tennis racket', 'bottle', 'wine glass', 'cup',
               'fork', 'knife', 'spoon', 'bowl', 'banana', 'apple',
               'sandwich', 'orange', 'broccoli', 'carrot', 'hot dog', 'pizza',
               'donut', 'cake', 'chair', 'couch', 'potted plant', 'bed',
               'dining table', 'toilet', 'tv', 'laptop', 'mouse', 'remote',
               'keyboard', 'cell phone', 'microwave', 'oven', 'toaster',
               'sink', 'refrigerator', 'book', 'clock', 'vase', 'scissors',
               'teddy bear', 'hair drier', 'toothbrush']
# Load a random image from the images folder
file_names = next(os.walk(IMAGE_DIR))[2]
for file_name in file_names:
  image = skimage.io.imread(os.path.join(IMAGE_DIR, file_name))

  # Run detection
  results = model.detect([image], verbose=1)

  # Visualize results
  r = results[0]
  visualize.display_instances(image, r['rois'], r['masks'], r['class_ids'], 
                              class_names, r['scores'])

うまくいけばSemantic Segmentationでマスクしたデモ画像が表示される。

※ Mask_RCNNの利用は、以下のとおりtensorflowバージョンを1.xに、

%tensorflow_version 1.x
import tensorflow
print(tensorflow.__version__)

ランタイムのタイプをGPUに設定して再起動して、またもう１回tensorflowバージョンを1.xにして確認する。

%tensorflow_version 1.x
import tensorflow
print(tensorflow.__version__)

デモの画像を入れ替えてみよう

images直下のデモ画像を入れ替えて上記pythonコードを実行してたら、以下画像のようにDining tableの一部が未検出であった。

Notebook ipynbファイルがGithubへ公開済み。

感想

デモ画像がよさそうに検出できたように見えますが、入れ替えたらそうでもない結果となった。やはり検出の正確性が学習モデルに大いに相関することで、専用学習データで学習モデルを作成しないと納得いく結果が得られず。画像データアノテーションImage Data Annotation業務が請負可能な業者さんがドンドン増えているらしい。

参考文献

Matterport Mask_RCNN on Github.

以上

ロボット・ドローン部品お探しなら

はじめに

環境

DMP3の出力確認

最後に

商品化モジュール

詳細情報

取扱店舗

参考文献

関連記事

はじめに

環境

準備①

準備②

imu/dataの可視化

センサ融合について

ソースコード

後継機種

参考文献

関連記事

はじめに

キーワード

状態空間モデル

基本原理

式の導出

線形システム

非線形システム

逐次状態推定の手順

Step0=パラメータ初期化（t=0）

Step1=状態値、共分散行列予測（t>0）

Step2=カルマンゲイン、状態値、共分散行列更新

KFフローチャート

拡張カルマンフィルタ

状態空間モデル

Step0=パラメータ初期化（t=0）

Step1=状態値、共分散行列予測（t>0）

Step2=カルマンゲイン、状態値、共分散行列更新

EKFフローチャート

拡張カルマンフィルタを6軸IMUへの適用

カルマンフィルタの再考

参考文献

関連記事

はじめに

環境

準備①

準備②

imu/dataの可視化

センサ融合について

校正

感想

ソースコード

参考文献

関連記事

はじめに

デモを動かそう

デモの画像を入れ替えてみよう

感想

参考文献