機械学習が簡単に行えるライブラリのscikit-learnを使用して、機械学習について学ぼうとしている人向けの記事です。

https://scikit-learn.org/stable/ [scikit-learn]

記事概要

Anaconda(アナコンダ)のインストール

Anaconda を用いることでPythonの開発環境を簡単に使用することができます。

Anacondaは以下のリンクへ入り、「Anaconda Installers」から自身のOSに応じたインストーラをダウンロードしてください。

https://www.anaconda.com/products/individual

ダウンロードしたら、ファイルを実行し表示された内容に従い、Anacondaをインストールしてください。※基本的には、デフォルト値でインストールで問題ありません。

仮想環境の作成

pythonでは開発や研究をする際、用途ごとに実行環境を分けることが一般的です。この分けた実行環境のことを仮想環境と言います。仮想環境を作成し、その仮想環境に学習に使用するライブラリをインストールする方法を紹介します。

まずは、Anaconda promptを起動します。

Anaconda Promptが起動したら、仮想環境を作成します。仮想環境は以下のコマンドで作成可能です。

conda create -n 作成したい仮想環境名 [python==pythonのバージョン]
※[ ]は任意

今回は、「py38」という名前の仮想環境をPythonのバージョン3.8で作成します。そのため、以下のコマンドを実行してください。

 conda create -n py38 python==3.8

「y」を入力してエンターを押下し、仮想環境の作成を開始してください。

仮想環境が構築されたら、仮想環境を有効化します。仮想環境の有効化は以下のコマンドで実行できます。

conda activate 仮想環境名
※[ ]は任意

今回は、「py38」を有効化するため、以下のコマンドを実行してください。

conda activate py38

コマンドを実行すると、現在の仮想環境名が「base」から「py38」に変わります。

ライブラリのインストール

仮想環境に必要なライブラリをインストールします。以下のコマンドでライブラリのインストール可能です。

conda install ライブラリ名[==ライブラリのバージョン]
※[ ]は任意

今回インストールするライブラリは以下の7つです。(実際にはこれ以外も同時にインストールされます。Anacondaはライブラリ同士の依存関係を考慮し、必要なライブラリをインストールしてくれます。)

ライブラリ名概要
numpyNumPyは科学計算を行うことのできるライブラリです。
Pythonで機械学習のプログラミングを行う際は非常によく用いられます。
scipyScipyはNumpyより高度な科学計算を行うことができるライブラリです。
Numpyと互換性があるため非常に使いやすいライブラリです。
scikit-learnscikit-learnは機械学習を簡単に行うことができるライブラリです。
様々な機械学習のアルゴリズムを容易に使用することができます。
pandaspandasはデータ解析を支援する機能を持ったライブラリです。
データフレームと呼ばれる表形式でデータを扱うことができるため、RDBMSのような処理を行うこともできます。
matplotlibmatplotlibは、データを可視化するためのライブラリです。
折れ線グラフ、ヒストグラム、箱ひげ図、画像など様々なものを描画できます。
seabornseabornは、matplotlibを拡張し、きれいに描画するためのライブラリです。
jupyterjupyterはjuputer notebookと呼ばれるwebベースのGUIでソースコードを実行でき、実行結果がすぐ確認できるためデータ解析の時に便利です。

以下のコマンドを上から一行ずつコピーしてライブラリのインストールを行ってください。

conda install numpy==1.19.2
conda install scipy==1.5.2
conda install scikit-learn==0.23.2
conda install pandas==1.1.5
conda install matplotlib==3.3.2
conda install seaborn==0.11.1
conda install jupyter

以上でインストールが完了です。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です