Dear Great Hackers

  1. インタビュー
  1. タイアップ

Udemyで400コース学んだ黒澤さんがおススメするデータサイエンスコース10選+α

人工知能のビジネス活用が急速に進む昨今、機械学習エンジニアやデータサイエンティストと呼ばれる新しい職種が注目されています。経済産業省が2016年に発表した資料(※)によると、2020年にはAI、IoT、ビッグデータなどに携わる先端IT人材は約4.8万人不足するといわれており、データサイエンスに関する知識・技能を有する人材の価値は今後益々高まっていくと考えられます。そのような背景からエンジニアを含む多くの方のキャリアアップにもデータサイエンスを学ぶということは重要なテーマとなっていくことでしょう。

そこで、今回は、前回8月にQiitaZineで公開した記事でも多くの方から反響があったUdemyのヘビーユーザーで、自身もデータサイエンスを活用しながらエンジニアとして働く黒澤さんにデータサイエンスに関するおススメの学び方やUdemyコースを教えてもらいました。
※「 IT人材の需給に関する推計結果の概要」(経済産業省 2016年6月10日発表)

Udemyとは

Udemyで講座を探す>>

Udemy(ユーデミー)は、米国法人Udemy, Inc.によって運営される世界で2,400万人が利用するオンライン動画学習プラットフォームです。

人気講座には「みんなのAI講座 ゼロからPythonで学ぶ人工知能と機械学習」「Web開発入門完全攻略コース – プログラミングをはじめて学び創れる人へ!未経験から現場で使える開発スキルを習得!」などがあり、ITを中心に最新の技術を学べる講座が幅広くラインナップされています。

ユーザープロフィール

黒澤俊文 Toshifumi Kurosawa
都内ベンチャー企業・エンジニア
北海道の帯広出身で、30代後半。
大学時代にプログラミングでつまずいたため、20代はプログラマーの仕事を避けていたが、30代になってiOSに興味を持ちプログラマーになろうと決意する。
Udemyと出会って猛勉強してスキルアップを実現して上京し、JapanTaxiにジョインして理想的なキャリアアップがスタートする。
本格的にiOS・Railsのプログラマ活動すると同時に、人工知能・ブロックチェーン等の最新技術学習も開始。
2018年夏にJapanTaxiを退職後、都内のベンチャー中のベンチャー企業にジョインし、ブロックチェーンと人工知能の研究開発を始める。
Udemyを技術習得の核して、積極的に仕事で使っていくUdemy駆動開発(UDD)を提案し推進中。

過去の関連記事はこちら
【保存版】Udemy 350コース突破記念 講師に全力 リスペクト企画 オススメ コース紹介【海外コース版】
【保存版】Udemy 350コース突破記念 講師に全力 リスペクト企画 オススメ コース紹介【入門者向け】
 
 
──本日は、今ホットな領域でもあるデータサイエンスをテーマにおススメの学習法や具体的なコースについてコメントをいただきたいと思います。

黒澤:よろしくお願いします。

──黒澤さんはこれまで400以上のコースをUdemyで学んだと伺ったのですが、そのうちデータサイエンスに関するコースは、およそどのくらい学ばれたのですか?

黒澤:だいたい100コース弱です。日本に限らず、海外の様々な切り口のコースを受講してきました。

──そんなに学習をされてきたのですね・・・そもそも黒澤さんが、データサイエンスを学び始めたきっかけは何だったのでしょうか︖

黒澤:10年以上前にですがテキストの感情解析結果の精度を確認するアルバイトをしていた事からデータ分析・予測に興味を持っていました。

iOSエンジニアとして上京する直前に⼈⼯知能の画像認識精度が⼈間を超えた事に衝撃を受け東京で最新技術を学ぶ際にブロックチェーンと⼈⼯知能どちらを勉強するかを迷っていましたが参考書やUdemyのコースが増えだした⼈⼯知能・機械学習を選択しました。

人工知能・機械学習はここ数年で急成⻑を果たし毎⽇ニュースで盛り上がっていますが、まだまだ技術者が少なく参⼊のチャンスだと思います。

──そのようなきっかけだったのですね。データサイエンスを学んだ結果、業務で具体的に役立った経験はありますか?

黒澤:実際に役立った事例としては例えば、前職で携わっていた配車アプリのUX(ユーザー体験)改善のためのプロジェクトで統計の知識が役に⽴ったことがあります。その際は、UXを向上させ、「キャンセル数を軽減させること」がプロジェクトの目的でした。

打ち手として、アプリでの注文取得後、会社側での作業の進捗を細目にユーザーにお知らせすることで、「ちゃんと手配が進んでいるのか?」という不安感をぬぐうことで解決しようとしました。

そこで、注文~配車可能な車の発見までのステータスがどれくらいの時間間隔で進行するのか調査をすることになり、僕の予想では、1分未満だと考えていたのですが、約⼀週間での平均を取ってみたところ、予想に反して5分以上という結果が出ました。

ここで確率・統計のことを思い出しました。単純に平均を算出するのではなく、エクセルでデータをグラフにして可視化してみました。そこでタイムアウトやエラーで10分以上掛かってる注文が数件ある事が判明しました。所謂「外れ値」というものですね。これを偏差値に差し替えた上で再度平均を計算すると当初の予想通り⼀分程度になりました。統計の知識を使い、分析と外れ値の検出、修正精度向上と学んだ事を実務に活かすことができた瞬間でした。

データサイエンスといえば今は⼈⼯知能など⾼度な事が主に話題になりますが、ベースとなる基礎的な統計を学ぶだけでも十分実務で活用することができると感じています。

──具体的な事例ですごくイメージが沸きました。次に伺いたいのですが、黒澤さん自身、これまで学ばれてきて、データサイエンスにはそもそもどんな知識・スキルが必要だと考えていますか︖また、あわせてそのスキル習得に効果的だったUdemyコースも教えてください。

黒澤:データサイエンスに必要なスキルは大きく3つと考えています。

1)数学(微分、線形代数、統計など)
2)プログラミング(Python、R)
3)問題解決力(価値創造する力、論理的思考力など)

まず数学についてですが、僕の経験上からもこれがデータサイエンスの学習においては最も重要だと考えています。

というのも、自分自身、Udemyでデータサイエンスを学び始めたころ、数学を学ばなかったことで失敗しているからです。

──そうだったのですね。それはどんな失敗だったのですか?

黒澤:正直いうと、もともとプログラミングスキルには自信があったので、PythonやRもすぐに使いこなせて、データサイエンスもできるとおごりがありました。
しかし、実際は、Pythonが使えたとしても数学の理解がないとただチュートリアルを動かすだけしかできません。

僕は、データサイエンスを活用した課題解決において重要な「数値予測」か、「カテゴリー予測」かの判断が数学(統計)の知識がなくてできなかったんです。

例えば、手書き文字の画像認識をしたい場合は「カテゴリー予測」を使う。商品の売上シミュレーションをしたい場合は、「数値予測」を使うなど課題に応じて判断しなくてはいけないのですが、それができなかったんです。

数学を学ばずに、機械学習ライブラリを使った⾼度な分析を実⾏しても理解が浅く、チュートリアル以上の事をしようとすると途端に難しくなってしまいました。

──エンジニアリング力の素地がある方だからこそ陥ってしまう落とし穴なのかもしれませんね。ただ、「微分・線形代数」については、具体的になぜ必要なのかまだわからないのですが、補足いただけますか?

黒澤:微分や線形代数は、機械学習など関数を使った予測モデルの作成に必要になります。機械学習とは、プログラム(機械)にデータを学習させて、予測させることです。予測するためには、実測値と予測値の誤差を最⼩限にさせていくことが必要で、これを「最適化」と言い、微分を使います。

この「最適化」の計算・演算をするためには、画像やExcelで作られた表データなど、すべてのデータを行列の形で数値化する必要があります。この行列を計算するための手段として線形代数が必要になります。さらに、学習させたモデルの精度を確認するために統計が必要になるんです。

──なるほど、よく理解できました。では、黒澤さんも特に重要だという数学を学ぶのにおすすめのUdemyコースはありますか?

黒澤:「【キカガク流】人工知能・機械学習 脱ブラックボックス講座 – 初級編 -」「【ゼロからおさらい】統計学の基礎」がおススメです。

「【キカガク流】人工知能・機械学習 脱ブラックボックス講座 – 初級編 -」は、板書のように手書きで順を追って説明してくれ、わかりやすく人工知能の仕組みと機械学習の実装に必要な数学(微分と線形代数)を学ぶことができます。さらに得た知識をもとにPythonを使って簡単な機械学習の実装までを4.5時間で経験できるので入門者にはおススメです。

「【ゼロからおさらい】統計学の基礎」は、統計の基礎が学べ、統計基礎の鬼門といえる「仮説検証」を中心に理解することができます。また、「アプリの同時起動数」をテーマに統計を使い、「どれだけのユーザーが同時にアプリを起動してもサーバーが落ちずに耐えられるか?」を予測する演習をエクセルを使って行います。

──両コースとも短時間で基礎が習得できるので入門者には良さそうですね。ありがとうございます。それでは、次にプログラミングはなぜ必要なのでしょうか?

黒澤:正直言うと、PythonやRができなくても、Excelを使って簡易な分析や可視化はできてしまいます、ですが、Excelでは収まらない膨大なデータや複雑な条件分岐の処理、可視化にあたってもプログラミングができると業務のスピードが早くなり、幅も広がります。また、機械学習エンジニアなどの職種においては、Pythonなどのプログラミングスキルは必須です。

──なるほど。ちなみにPythonとRが代表的な言語としてよく耳にするのですが、これらの言語はどう使い分けていますか?

黒澤:個人的な見解ですが、Rで解析をして、Pythonでアプリケーション化させるという流れが理想だと考えています。時代のトレンド的には、Pythonが注目され、実際使えると収入アップにもつながりやすい言語ではありますが、Rには、元から統計値を出力する機能が備わっているので解析に向いています。なので、データサイエンスの学習者が統計を使って分析や解析をするにあたりRは良い言語だと思っています。

一方、ディープラーニングなど最先端技術に関してはPythonの方がライブラリの対応が早くRよりも参考書やチュートリアルが充実しているいうメリットはあると思いますし、Pythonはscript言語のため比較的未経験者でも学びやすい言語というメリットもあります。

──なるほど。学びやすい言語なのであれば、プログラミング未経験者の場合は、まずPythonから始めてみるのもいいかもしれませんね。では、プログラミング(Python、R)を学ぶのにおススメのUdemyコースを教えてください。

黒澤:Pythonについては、「【ゼロから始めるデータ分析】 ビジネスケースで学ぶPythonデータサイエンス入門」がおススメです。

このコースはPythonプログラミングを学べるだけではなく、必要なスキルである「数学」、「プログラミング」「問題解決」のすべての要素を広く浅く体験できるというのが魅力となっています。つまり、データサイエンティストの業務を一巡して体験できるということです。

ビジネスケースで実務的なテーマをもとに演習を行い、例えば、気温の変化によるお弁当の売り上げを機械学習の定番ライブラリを使ってモデルを作り予測します。

文法の解説だけをするプログラミングコースも少なくないのですが、このコースは、目的、課題をベースにして、その解決に必要な手法を学ぶ構成になっているのでおススメです。

さらに、Pythonデータサイエンスについてより深く学んでできることを増やしたいという場合は、「【世界で5万人が受講】実践 Python データサイエンス」がおススメです。

17.5時間で長時間のコースですが、高度な分析まで学べ、また辞書的に復習として使うこともできます。

次にR言語の場合は「【R言語をゼロから理解していく】データサイエンスの実践例から学ぶデータ分析入門」がおススメです。

R言語と親和性が高い統計を軸として、予測(線形回帰、ロジスティック回帰)、分析(クラスタリング、主成分分析)、仮説検証などの重要なテーマに焦点を置いてプログラミングを学ぶことができます。

あと、これは余談ですが、よくプログラミング学習では、お手本のコードを真似して記述していくことを「写経」と例えることがありますが、さらにコードだけではなく、コードの意味もあわせて「写経」することでより理解が深まるのでおススメめです。あとで「これなんのためにやったんだっけ」と振り返りやすくもなります。

この記事に具体的なコメント⽂の書き⽅についても触れているので興味があれな読んでみてください。
「Udemyで学べる機械学習を全部見てみたんで、お勧め報告」

──効果的な学習法についても教えていただきありがとうございました。では「問題解決力」が必要な理由について教えてください。

黒澤:データサイエンティストへの転職を考え転職活動をしていた時、企業から求められる⼈材像として知識や技術だけではなく、「企業にとっての価値を創造できる人材か」が重要視されているということに気づきました。

技術が先⾏して話題になりがちですが、ビジネスにおいては「どういうデータをどう分析して誰をどう喜ばせるか」を考えることが重要です。それにより、この課題は、そもそも機械学習でモデルを作らなきゃ解決できないのかという判断も早い段階でできるようになると思います。

また、問題解決力といったときに、コミュニケーションスキルやプレゼンスキルなどチームで働いたり、他部署を巻き込むうえで必要になるスキルも必要だと考えています。プレゼンスキルは、思考の整理にもつながるのでおススメです。

──問題解決力をつけるのにおすすめのUdemyコースはありますか?

黒澤:正直、この力は実務の中で養われる面が大きいと感じています。何かで学んで一朝一夕で着く能力ではないということを前提に個人的におススメするコースを紹介します。

このコースは、元ソフトバンクの社員の方が講師で、あの孫正義社長からも認められたというプレゼンのノウハウを学ぶことができます。

忙しくて時間のない上司からの決裁を一発で取得するために、徹底的に情報を絞り込みプレゼンする技術を学びます。

プレゼン術を通して行う情報整理のプロセスが、思考整理の訓練にもつながりおススメです。僕自身も、考案したサービスの発表や採択する技術の比較検討など社内でプレゼンする機会が多くありましたが学んだことが生きたと感じています。

──データサイエンティストを目指す人に限らず、社会人であれば学んでみたいコースですね。

黒澤:あと、これまでの3つのスキルとは少し違う観点にはなりますが、SQLのコースもおススメします。
「はじめてのSQL・データ分析入門 – データベースのデータをビジネスパーソンが現場で活用するためのSQL初心者向コース」

このコースではSQLとデータベースの基礎を学びます。これができないと分析したいデータを正しく貯めて、抽出することができないのでデータサイエンスにおいては必須のスキルだと思います。

せっかくいい料理の腕がある(データ分析のスキルがある)のに、冷蔵庫(データベース)の中の食材(データ)のしまい方がひどくて探し出せない。見つけたと思ったら状態が悪くて使えない・・・みたいな状況になるイメージです(笑)

──なるほど、わかりやすい。

黒澤:あとUdemyには中上級者向けですが、他にも海外も含め様々な切り口や目的別のデータサイエンスコースがあるのでいくつか紹介します。これまでに紹介したコースを学習したらぜひ受講してみてください。

「【画像判定AI自作にチャレンジ!】TensorFlow・Keras・Python・Flaskで作る機械学習アプリ開発入門」
解析して終わりではなくFlaskを使ってウェブアプリ化する手法が身に付きます。

「実践データサイエンス&機械学習with Python -統計学の基礎からビッグデータまで」
海外の有名なIT企業AmazonやIMDbでデータサイエンティストとして活躍した方の翻訳版コースです。レコメンドシステムやApache Sparkによるビッグデータの機械学習が面白いです。

「The Complete Self-Driving Car Course – Applied Deep Learning」
自動運転の基礎となる道路交通標識や車線での画像認識を学べます。

「Tableau 10 A-Z: Hands-On Tableau Training For Data Science!」
UdemyにおいてのData Scienceトップセールを誇るKirill Eremenkoによるコースです。 この上にさらに応用編コースもあります。機械学習ライブラリ同様にTableauを使いこなせる人は まだ限らているので今が習得のチャンスです。

──海外も含めると本当に様々な観点のデータサイエンスコースがあるのですね。たくさんのおススメコースを教えていただきありがとうございました。よろしければ、黒澤さんのエンジニアとして今後の目標を教えてください。

黒澤:データサイエンティストに拘らず、今までの⾃分の経歴や技術を活かせる⼈材になりたいです。活かしたいのは⾃分の強みである幅広い技術による技術融合・結合( iPhone、Andorid + Railsサーバー、フロントReact +Scalaサーバー、DevOps + Jenkins + Kubernetesなど)特にやりたいのがブロックチェーン + データサイエンスです。

例えば、データサイエンティストと⿊澤が⼿を組みウェブアプリケーション、データビジュアライゼーションそしてブロックチェーンなどは⿊澤が担当するという協⼒体制で仕事をしてみたいですね。

──最後に、Qiitaの読者に向けてメッセージをお願いします。

黒澤:いきなりデータサイエンティストを目指すのではなく、データビジュアライゼーションエンジニアを目指すのも個人的に良いと考えています。なぜなら今すでにエンジニアが持っているプログラミングスキルをベースにして、データサイエンスに関わる仕事を通して知識、スキルの習得を段階的に広げていけるからです。

また、データビジュアライゼーションエンジニアが増えると、社内の人材でTableauのような便利なBIツールの開発ができるようになるため、より多くの人がデータに携われるようになります。それにより、日本のビジネスにおけるデータ活用が発展し、新しい価値創造につながると思うんです。なので、ぜひそういった形で活躍するエンジニアが増えることを期待しています。

ちなみにおススメのデータビジュアライゼーションコースはこれです。
「Mastering data visualization in D3.js」
チャートやグラフを描写できるD3.jsを駆使してデータビジュアライゼーションします。 比較的習得が容易なJava Scriptがベースになっていますので英語コースですがぜひ挑戦してみてください。

──本当にたくさん紹介いただきありがとうございます(笑)本日は貴重なお話ありがとうございました!

黒澤:ありがとうございました!

【Udemy秋の大セール(Black Friday & Cyber Monday Sale)実施中】

Udemyで講座を探す>>

2018年11月28日 17時まで最大95%OFFでコースを受講できるチャンスです。ぜひこれを機会に皆さんも新しいスキルアップに挑戦してみてください。

その他 QiitaZine読者向けおすすめコース

【iOS12対応】未経験者が有名アプリ開発者になるiOS 12の全て 20個以上アプリをつくりプロになる| Udemy

【iOS12対応】未経験者が有名アプリ開発者になるiOS 12の全て 20個以上アプリをつくりプロになる | Udemy

最新のXcode10で最新のiOS12によって、基礎的で簡単なアプリから実際の有名アプリ、チャットアプリ、Instagram、SNS、Wunderlist、ARKit、AI、アプリ内広告などを一緒に学びます。

もう怖くないGit!チーム開発で必要なGitを完全マスター| Udemy

もう怖くないGit!チーム開発で必要なGitを完全マスター | Udemy

Gitの基本コマンド、ブランチやマージ、コンフリクトの解消方法、リベース、GitHubを利用した開発フローなど、チーム開発に必要なGitの全てが含まれています。仕組みを図解で理解した上でハンズオンで実践するので、もうGitは怖くありません。

【世界で2万人が受講】JavaScriptエンジニアのためのES6完全ガイド| Udemy

【世界で2万人が受講】JavaScriptエンジニアのためのES6完全ガイド | Udemy

述べ24万人の受講生を抱えるStephen Grider氏による大人気コースの完全日本語版。JSのメソッドのforEach、map、reduce、ES6で新しく登場した関数のデフォルト値やクラス、改善されたオブジェクトリテラルについて学ぶ。

フロントエンドエンジニアのためのReact・Reduxアプリケーション開発入門| Udemy

フロントエンドエンジニアのためのReact・Reduxアプリケーション開発入門 | Udemy

RESTful APIサーバと連携する実践的なCRUDアプリケーション開発手法を学び、今後のフロントエンドWeb開発の標準になり得るReact・Reduxアプリケーション開発をマスターしよう!GitHubでソースコードも公開中!

【キカガク流】現場で使えるChainerによるディープラーニング入門| Udemy

【キカガク流】現場で使えるChainerによるディープラーニング入門| Udemy

受講生6000人突破!”あの”キカガクからディープラーニング(深層学習)を数学から実装まで体系的に学べるコースが登場。「キカガクの知識は現場で使える!」と自然に口に出せるようなコースを目指しました。

フルスタックエンジニアが教える 即戦力Railsエンジニア養成講座| Udemy

フルスタックエンジニアが教える 即戦力Railsエンジニア養成講座| Udemy

Ruby言語の基礎から始め、Ruby on Rails5を使用したWebアプリケーションの開発方法について学びます。Railsの動作環境をDockerで構築する方法についても学びます。

【サイバーセキュリティ ハンズオン】ハッキング技術入門(不正侵入編)| Udemy

【サイバーセキュリティ ハンズオン】ハッキング技術入門(不正侵入編)| Udemy

サイバー犯罪対策において、攻撃者の手法を理解し実践することは最も重要です。本コースでは「Kali Linux」を用いたハンズオン形式で、パソコンやネットワークに対する攻撃手法とその対策を学習します。

Udemyで講座を探す>>

関連記事