今回の記事では、私がpython初学者だった時に感じた悩みを解決する記事を書いています。
「Pandasのメソッドの解説記事は多いが、全体像がわからない、、」
「Pandasのメソッドは非常に多く調べるのが大変なので、情報を集約して欲しい、、」
このような悩みを解決するために、Pandasのメソッド解説記事を下記の分類でまとめてみました。
・データの削除
・データの欠損値の処理
・データの重複の確認・削除
このページをブックマークすれば、調べる手間を減らすことができると思いますので、是非ブックマークして活用してください。
早速解説します。
まずは「データの抽出」です。
データの抽出
行名・列名を基にデータを抽出する場合はloc、行番号・列番号を基にデータを抽出する場合はilocを使用します。詳細は下記記事参照。
条件を基にデータを抽出する際は、isin( )メソッドを使用します。例えば「性別」のカラムに’男性’と’女性’という情報が入ってる場合、性別が’男性’のデータのみを抽出できます。
詳細は下記記事参照。
データ型を基に列を抽出する際は、select_dtypes( )メソッドを使用します。データ型(object型やint型、float型)を指定してデータを抽出できます。
詳細は下記記事参照。
特定の条件でデータをソートする際は、sort_values( )メソッドを使用します。
詳細は下記記事参照。
データの削除
特定の行や列を削除する際は、drop( )メソッドを使用します。詳細は下記記事参照。
欠損値の処理
欠損値を確認する際は、isnull()メソッドを使用します。詳細は下記記事参照。
欠損値がある行・列を削除する際は、dropna()メソッドを使用します。詳細は下記記事参照。
欠損値を補填する際は、fillna( )メソッドを使用します。詳細は下記記事参照。
データの重複の確認・削除
データの重複を確認する際はduplicated( )メソッドを使用し、重複している行を削除する際はdrop_duplicates( )メソッドを使用します。詳細は下記記事参照。
今回の記事はここまでです。
最後まで読んでいただきありがとうございます。
ブックマークしてわからない時に使っていただければ幸いです。
皆さんのpythonの勉強が進むことを心より願っています❗️