機械学習が簡単に行えるライブラリのscikit-learnを使用して、機械学習について学ぼうとしている人向けの記事です。
https://scikit-learn.org/stable/ [scikit-learn]

Anaconda(アナコンダ)のインストール
Anaconda を用いることでPythonの開発環境を簡単に使用することができます。
Anacondaは以下のリンクへ入り、「Anaconda Installers」から自身のOSに応じたインストーラをダウンロードしてください。
https://www.anaconda.com/products/individual
ダウンロードしたら、ファイルを実行し表示された内容に従い、Anacondaをインストールしてください。※基本的には、デフォルト値でインストールで問題ありません。
仮想環境の作成
pythonでは開発や研究をする際、用途ごとに実行環境を分けることが一般的です。この分けた実行環境のことを仮想環境と言います。仮想環境を作成し、その仮想環境に学習に使用するライブラリをインストールする方法を紹介します。
まずは、Anaconda promptを起動します。

Anaconda Promptが起動したら、仮想環境を作成します。仮想環境は以下のコマンドで作成可能です。
conda create -n 作成したい仮想環境名 [python==pythonのバージョン] ※[ ]は任意
今回は、「py38」という名前の仮想環境をPythonのバージョン3.8で作成します。そのため、以下のコマンドを実行してください。
conda create -n py38 python==3.8

「y」を入力してエンターを押下し、仮想環境の作成を開始してください。

仮想環境が構築されたら、仮想環境を有効化します。仮想環境の有効化は以下のコマンドで実行できます。
conda activate 仮想環境名 ※[ ]は任意
今回は、「py38」を有効化するため、以下のコマンドを実行してください。
conda activate py38
コマンドを実行すると、現在の仮想環境名が「base」から「py38」に変わります。

ライブラリのインストール
仮想環境に必要なライブラリをインストールします。以下のコマンドでライブラリのインストール可能です。
conda install ライブラリ名[==ライブラリのバージョン] ※[ ]は任意
今回インストールするライブラリは以下の7つです。(実際にはこれ以外も同時にインストールされます。Anacondaはライブラリ同士の依存関係を考慮し、必要なライブラリをインストールしてくれます。)
ライブラリ名 | 概要 |
numpy | NumPyは科学計算を行うことのできるライブラリです。 Pythonで機械学習のプログラミングを行う際は非常によく用いられます。 |
scipy | ScipyはNumpyより高度な科学計算を行うことができるライブラリです。 Numpyと互換性があるため非常に使いやすいライブラリです。 |
scikit-learn | scikit-learnは機械学習を簡単に行うことができるライブラリです。 様々な機械学習のアルゴリズムを容易に使用することができます。 |
pandas | pandasはデータ解析を支援する機能を持ったライブラリです。 データフレームと呼ばれる表形式でデータを扱うことができるため、RDBMSのような処理を行うこともできます。 |
matplotlib | matplotlibは、データを可視化するためのライブラリです。 折れ線グラフ、ヒストグラム、箱ひげ図、画像など様々なものを描画できます。 |
seaborn | seabornは、matplotlibを拡張し、きれいに描画するためのライブラリです。 |
jupyter | jupyterはjuputer notebookと呼ばれるwebベースのGUIでソースコードを実行でき、実行結果がすぐ確認できるためデータ解析の時に便利です。 |
以下のコマンドを上から一行ずつコピーしてライブラリのインストールを行ってください。
conda install numpy==1.19.2 conda install scipy==1.5.2 conda install scikit-learn==0.23.2 conda install pandas==1.1.5 conda install matplotlib==3.3.2 conda install seaborn==0.11.1 conda install jupyter
以上でインストールが完了です。