Dear Great Hackers

  1. イベント

『画像認識技術』がテーマ GeekOutナイト が開催されました

5月30日にパソナキャリアが運営するIT・WEBエンジニア向け転職サイト「GeekOut」主催の「GeekOutナイト」という『画像認識技術』をテーマにしたトークイベントが開催されました。Qiita Zine 編集部では当イベントの様子をお伝えします。

イベント内容は、きゅうり農家の小池氏のディープラーニングを用いたきゅうりの選果機について、オムロンの仁科氏の産業ロボットと自動運転における画像認識技術について、クックパッドの菊田氏の「料理きろく」における料理/非料理判別モデルについて、それぞれ登壇者によるプレゼンが行われました。

イベント後半には、登壇者3名の座談会が行われました。

左から菊田氏、仁科氏、小池氏

画像認識は専門家でなくても使える、非専門家こそ活用すべき技術

最初の登壇者はきゅうり農家の小池誠氏です。
同氏はきゅうり農家を営む傍ら、趣味のものづくりの延長としてきゅうりの選果機を制作しています。
また、コンピュータ専門誌Interfaceで「IT農家のディープラーニング奮闘記」を連載するなどものづくりと機械学習を合わせた分野で活躍されています。

※選果機…野菜や果物を重量などによって選別する機械

きゅうりの画像処理

今日、農業の自動化が進んでいると言われていますが、まだ機械化が難しい部分が多く存在している」と小池氏は語ります。

きゅうり栽培では出荷時の選別作業が、作業時間の中では収穫に次いで多くの割合を占めています。きゅうりを等級に仕分ける作業は定量化された明確な基準がないため、人間の慣れが必要な作業となっていることに注目しました。小池氏はこの選別作業を効率化できないかと考えたそうです。

同氏は、人間とほぼ同等になってきたといわれている画像認識の技術に注目しました。

まずは手書きの数字のデータセットであるMNISTを試してみたところ割とよい精度がでたため、手書きの数字でいけるならきゅうりもいけるのではないかと判断して、始めたとのことです。

試作1号機は、Webカメラやオープンソースのソフトウェアを使用して1週間ほどできゅうり選別を作成しました。

※MNIST…手書きの数字「0~9」に正解ラベルが与えられているデータセット。機械学習の分野でトレーニングやテストに広く使用されている。

深層学習を使った画像認識には大量の良質なデータが必要です。しかし、初めからたくさんデータを貯めることは難しいため、2,500枚ぐらいの画像から始めたと小池氏は語りました。
画像数は少なかったもののわりと精度が良く、8割ぐらいの正答率になったそうです。

その後、小池氏は人の作業に近づけるべく多方面にカメラを設置した2号機、2号機での課題を解決した3号機を作成していきます。
きゅうりの選果機はまだまだ改造中で、課題に取り組んでいるとのことです。

画像認識は専門家でなくても使える、非専門家こそ活用すべき技術であると述べました。

最後に小池氏は次のように締めくくりました。

「農業の高齢化が進んでいるので、テクノロジーを利用して野菜の品質をアップしたり、
収量を増やしたり、栽培のノウハウをいかに残していくのかという課題に取り組みたいと思っています。」

ディープラーニングを使えない画像認識もある

次に登壇したのはオムロンの仁科有貴氏。
同氏はオムロンの画像センシング研究室に所属しています。

画像認識はエッジ型

オムロンというと、体温計などのヘルスケア商品を思い浮かべる方が多いかもしれません。しかし、主力はBtoB事業となっており、画像認識技術を使用したR&Dではディープラーニングをつかったテーマが6-7割となっており、欠かせないコア技術の1つとなっているそうです。

仁科氏はBtoB事業の中で、ロボットと自動運転で使われている画像認識技術について紹介しました。

オムロンを含むBtoB企業で多く採用されているエッジ型の画像認識では、ハードウエアの制約により常にディープラーニングを使えるわけではないと仁科氏は語りました。

リソースが限られる中でリアルタイム性を求められるなど、八方塞がりに見える中でパフォーマンスをだすために日々頭を悩ませながら取り組んでいます。

処理が重くなり、ハードウエアリソースや処理時間の要求を実現することが難しく、説明性が十分ではないためにディープラーニングを導入することが難しい、といったケースもよくあるそうです。

現状、人にしかできない製造工程の組み立てや検査を、産業用ロボットと画像認識を組み合わせて自動化することで、労働人口が足りないという社会課題をオムロンは解決しようとしていますが、この産業ロボットにはエッジ型の画像認識技術が使用されています。

これらを実現するべく、現状人にしかできない製造工程で使用される「ロボットが物をつかむ技術」に注力しています。

3次元情報を用いたテンプレートマッチングを基本に様々なテクニックを駆使することによってトップレベルの認識制度、最高速度とリアルタイム性を実現していると紹介しました。

また、自動運転について、自動運転レベル2、3における手動運転時のドライバーの状態を理解する試みを行っているとのことです。

「ドライバーが運転に集中しなくてもよくなると、寝たりスマホをいじったり…様々な状態をとることが考えられます。ドライバーの状態を理解することは、交通事故を防ぐために重要な技術になると考えています」と仁科氏は語りました。

車に搭載できるハードウエアでリアルタイム性を追求するために、高速な顔認識技術と体の動きの情報を別々に取り出して、統合して情報を補完しているそうです。

さらに、ドライバーの状態の理解だけでなく、眼球運動など生体現象を計測することで予兆センシングにも取り組んでいます。例えば、眠気を推定することで、危険な状態を早期に検知し、早期に安全な対応をとることが可能となります。

我々は、今後も眠気予兆検知の実用化を目指して研究開発を進めたいと考えています。東京にも新しく開発拠点ができたので、興味のある方は是非お声掛けいただければと思います」と仁科氏は述べました。

我々の知識をモデルに与えないといけない

最後に登壇したのはクックパッドの菊田遥平氏。同氏はクックパッドの研究開発部に所属しています。

機械学習について語る菊田氏

クックパッドでは様々なサービスで画像認識技術を使用していますが、今回は「料理きろく」という機能における画像認識技術について紹介しました。

※料理きろく…ユーザーの端末中の画像から料理だけを判別して表示する機能。

機械学習を使って最初に解こうとしている問題は、実は機械学習を使って解くべき問題とはかなり乖離しているという場合が多く、進めていくうちに乖離に気づくと菊田氏は語ります。

開発は意思決定をすばやく行い、試行錯誤をしながら進めていったとのことです。

結論から言えば、早い段階でリリースまで持っていけたことで、どういった問題が苦手で、それをどのように解決すべきか様々な工夫をするというトライアンドエラーができたことが、チーム全体として大きな経験値となりました。

最初は料理か非料理かのみを判別させようとしたところ、いくつかの特定パターンで判定を間違える問題に多く遭遇したそうです。

それらを解決するために、例えば植物や人間の赤ちゃんを料理と判別してしまうという問題ならば、料理/非料理以外に植物や人間というセグメントを追加するといった対応を行ったそうです。

人間が100%の正答を達成できないのと同じように、モデルも改善を繰り返しても100%正解するということはありません。

そもそも画像が与えられたときに、その画像を料理と判定すべきか、非料理と判定すべきかという問題が生じます。その際には”我々が提供するサービスにおいて何を料理と定義するか”というサービス設計が重要となり、我々の知識をちゃんとモデルに与えなければなりません」とも菊田氏は語りました。

最後に「機械学習の研究もサービス適用もすごく進んでいますが、個人的にはまだまだ乖離があると思います。乖離はあるが、断絶ではないというのが、面白いところだと思っていて、新しい研究をうまく実サービスに適用できる形で移植できればすごく有用になり得るし、逆も然りだと思っています。

お互いの領域を行き来して、それらを融合できるような人間や環境はすごく価値が高いなと感じています。

ぜひ、いろんな人がいろんな挑戦をして、その内容を今日のこの話みたいに、みんなに共有することで機械学習の実応用がもっと推進されればといいかなと思っています。」と締めくくりました。

結びに

座談会はとても盛況でした

セッションの後、 事前に募っていた質問と会場からの質問に3名が回答する形式で座談会が開かれ、大変盛況な会となりました。

Qiita ZineではこれからもIT 系・技術系のイベントの取材に伺いたいと思います。
IT 系・技術系のイベントがありましたら、ぜひお声掛けください!

最後に、取材をさせていただきましたパソナキャリア様、ありがとうございました。また取材などをさせていただく機会がありましたらよろしくお願いいたします。
GeekOutナイトのページはこちら


Incrementsでは、一緒にQiitaとQiita Teamを改善したいエンジニアを募集しています!
まずは気軽に、一緒にランチを食べませんか。
興味のある方は こちら 💁

Increments
Incrementsは、「エンジニアを最高に幸せにする」をミッションにしているスタートアップです。エンジニアの方々が幸せに開発できるために、エンジニアの方々が嬉しいと思ってくれるために、私たちはソフトウェアの開発に取り組んでいきます。

Qiita
Qiitaは、知見を共有しスキルを高めることができる、プログラミングに特化したオープンな情報共有コミュニティです。

Qiita Team
Qiita Teamは、チームの生産性を高めるために開発された社内向け情報共有ツールです。チームメンバーが簡単、気軽に情報を書き込んで、それが適切なメンバーと共有され、共有された内容について活発にコミュニケーションを取ることができるサービスです。

Qiita Jobs
Qiita Jobsは、エンジニアに特化した転職支援サービスです。会社ではなくチームを探す。採用担当ではなくチームメンバーと話す。人事ではなく自分が配属チームを決める。Qiita Jobsはあなたに最適なチームで最高の仕事をするきっかけを提供します。

関連記事