こんにちは、ノムオです。
今回は機械学習初学者向けに「機械学習の勉強方法」について解説していきます。
私が機械学習の独学を始めた当初(約5年前)も、下記のような悩みを持っていました。
・「何から始めたらいいのか」わからない
・「どうやって勉強したらいいのか」わからない
・「どこまで勉強すれば仕事で活用できるのか」わからない
私の場合は見えない道を1人で突き進み、現在は仕事で活用できるまでに至りましたが、
一方で、多くの時間・労力を使いました。
今回は多くの人が抱えるこのような悩みを解消するため、「機械学習の勉強方法」について解説したいと思います。
機械学習の勉強方法
勉強方法を紹介する前に、まず勉強すべきことを整理してみます。
・プログラミング(python)
・数理モデルの理解(一先ず5個理解すべき)
・機械学習の活用の流れ
・統計学(マストではないが、理解してるのがベター)
なんというか、一言で言うと、勉強すべき項目が多い。。
なので、挫折する人が圧倒的に多い印象です。
挫折する人が大半なので、先ずは機械学習を勉強する上での心構えからお話しします。
機械学習を勉強する上での心構え
機械学習を勉強する上での心構えは、
「今理解できなくていい」
これです。
1個分からないところがあって詰まって進まなくなって、勉強をやめてしまう人が多い。
初めて勉強する内容なんで一発で理解できないのは当たり前です。
今理解する必要はないんです。
1週間後に理解してもいいんです。それくらいの心の余裕を持つことが大切。
データサイエンスを4年独学で勉強して、独学で1番大事だと感じたこと
「今理解できなくてもいい」
新しいこと、自分が経験したことのないことに取り組むと、最初は理解できないことが多いと思う。
pythonもそう。プログラミングをやったことない人なら、最初はわからないことだらけだと思う。…
— ノムオ (@nomu_chem) November 15, 2023
それに本当に大事なことなら、何回もその問題に出会います。その時に解決できればいいんです。
独学には何より心の余裕が大切だと思っています。
さて、次は、機械学習を完全独学したノムオがお勧めする勉強方法を紹介します。
この記事を読んでいる皆さんは、忙しくされている方も多いと思うので、特にタイパがいい方法を紹介します。
タイパに優れた勉強方法
まず、機械学習を独学する上で絶対勉強すべき下記3つに絞って解説します。
下記のような感じですかね。
・プログラミング(python)
→生成AIの活用
・数理モデルの理解
→私のブログでも解説しているモデル5選を理解して活用できる状態に持っていく
・機械学習の活用の流れ
→私執筆の有料note
プログラミング(python)の勉強方法
結論、生成AIを活用して勉強すべき。
✅生成AIはもはやプログラミング講師
何を質問しても教えてくれるので、生成AIは最早プログラミング講師。
エラーコードもコピペして貼り付ければ、原因と解決策(コード)を提案してくれる。
生成AIの使い方も覚えるし、一石二鳥だ。
早速問題演習(titanic予測問題と住宅価格予測問題)に取り組み、わからないところは生成AIに質問していくのが最短だと思う。
データサイエンスの独学(特にpython)で生成AIの活用を今お勧めする理由
・回答が早くなり、正直ググるより早い
・生成されるコードが昔よりわかりやすくなった
・一つ一つのコードを詳細に解説してくれる…— ノムオ (@nomu_chem) May 30, 2024
次は数理モデルの理解。
数理モデルの理解
数理モデルは数が多いので、一先ず下記5個の数理モデルを使いこなせる状態に持っていく。
・重回帰分析
・ロジスティック回帰
・決定木
・ランダムフォレスト
・LightGBM
ここでも生成AIを活用してもいい。
また私のブログでも解説記事を書いているので、ご活用していただければと思います。
最後に機械学習の活用の流れ。
機械学習の活用の流れ
ここはお勧めできるものがなかったので、最近、私が半年以上かけて書ききりました。
仕事で4年・1人で機械学習を活用して理解した「機械学習の全体像」を全部書きました。
3万字まで文字を削って、一冊に纏め切りました。
専門書を買う前に、これを読んで機械学習の「全体像」を理解してほしいです!
✅ 仕事で機械学習を活用したい・し始めた人は下記記事もお勧め
私が機械学習を独学して、いざ仕事で機械学習を活用し始めた際に失敗したこと、失敗から学んだことを書いています。
機械学習を勉強すればするほど、「やってしまいがち!」だと思っています。
現に私は失敗しました。。
私の失敗から学んでいただいて、仕事でも良いスタートダッシュを切れることを願っています。
特に、日々忙しくされている皆さんに是非ご活用いただければと思っています。
今回の記事はここまでです。
最先端の技術(生成AI)と仕事で機械学習を活用した人間の経験(私執筆のnoteやブログ)を活用するのが、最もコスパ・タイパが良いと思うので是非、ご活用いただければと思います。
皆さんのデータサイエンス(機械学習)に関する知見がさらに深まることを願っています。