
コンピュータビジョン+深層学習
犬と猫を見分けるAIは、
どこまで進化するのか?
コンピュータビジョン機械学習人工知能
コンピュータビジョンとは
犬は犬。猫は猫。人間は特別な訓練をすることなく目に入ってきた情報を瞬時に判断しそれが何者(何事)であるかを理解します。
それと同レベルの視覚機能をコンピュータに持たせようというのがコンピュータビジョン。多くの画像・映像をコンピュータに見せ、深層学習※1(ディープラーニング)させることで、カメラを通して「見た」ものを正しく認識させる研究です。
例えば、工場でベルトコンベアを流れる製品から欠陥品を探す、駅のホームで様々な動きをする人の中から危険な行動を察知・通報する、内視鏡で正常細胞とがん細胞を見分けるなど、様々な場面で利用されています。その応用範囲は今後も大きく広がっていくと考えられています。

Tips
深層学習
人間の神経細胞の仕組み(ニューラルネットワーク)を利用して、コンピュータが自分自身で学習を進めて(機械学習)、人間と同じような分析力、思考力、判断力を持たせる仕組み。ChatGPTにも使われている。
ディープラーニングで画像を解析する
コンピュータビジョンの基幹技術である「深層学習(ディープラーニング)」は、与えられたデータを多層的(ディープ)に学習することで、その背景にある法則を正確に認識させるための手法です。
リンゴを例にするなら、言葉で定義するのではなく、様々なリンゴの画像をコンピュータに与え、コンピュータ自身に学習させる技術です。犬と猫の画像は、AIが、オリジナル画像のどの部分を見て、犬や猫を見分けているかを可視化したものです。画面全体のわずか数パーセント、十数パーセントの画像領域から、正確に識別していることがわかります。
このような、コンピュータビジョンの進歩は、AIの活用レベルを飛躍的に高めます。例えば、今、私たちが利用しているChatGPTも深層学習を利用したAIツールですが、これは、「言葉」で私たちを助けてくれるものですが、コンピュータビジョンが進化した次のステップでは、「体を思ったAI」が登場するようになるでしょう。自動配送をするドローン、自動運転する車、家事や介護などの分野で活躍するヒューマノイドロボットなど、Society 5.0で描かれている未来はすぐそこまで来ています。

エンジニアリングの視点で社会課題を考える
データサイエンスは、人間の生活を快適にして幸福度を最大化するための学問ですが、それを可能にするには、技術の進歩が欠かせません。コンピュータビジョンの技術はもとより、情報通信技術、コンピュータ技術など、社会の課題を解決するためのデータサイエンスを、技術面で支えているのが「情報工学」です。
千葉大学の情報・データサイエンス学部の強みは、エンジニアリング側の視点に立ってデータサイエンスを見ることができるという点にあると思います。私たちの研究領域の魅力は、成果が目に見える形で瞬時に実感できるところ。AIの普及に代表されるような社会の変革期において、新しい技術による新しい社会を実現できる学問・研究領域だと思います。
ぜひ挑戦してください。
Profile

川本一彦 教授
千葉大学大学院情報学研究院 情報・データサイエンス学部教授。1997年、千葉大学工学部情報工学科卒業。2002年、同大学院自然科学研究科博士後期課程修了。東京工業大学大学院助手、九州工業大学大学院、千葉大学統合情報センター、同大学院工学研究院ならびに大学院融合科学研究科を経て、2024年より現職。博士(工学)。