【高校 数学Ⅰ】 データ分析2 ヒストグラムとは? (8分)

ヒストグラム データ 区間

ヒストグラムとはデータがどの区間に分布しているのかが分かるように、区間毎に含まれるデータの個数を縦棒グラフを使って表現したものです。 一般的にヒストグラムを作成するには元のデータから度数分布表を作成します。 今回の場合で言えば、成績の数値が 50 以下の人数や 51 から 60 の人数など範囲を決めて人数を集計したものです。 作成した度数分布表で階級を横軸、度数を縦軸にして縦棒グラフを作成したものがヒストグラムです。 Excel 2016 以降では元データからヒストグラムを直接作成することができるようになりました。 またヒストグラムの区間の幅を決める方法については、データ分析の目的によって異なりますが、5や10などの区切りの良い値、データの幅を区間の数で割って測定単位の整数倍に丸める、などの方法がとられます。 はじめに california housingデータセットを例に用いて、基本統計量の算出、標準化・正規化の適用、ヒストグラム・箱ひげ図の描画を実装していきます。 実装 インポート 各ライブラリをインポートします。データセットはsklearn.datasetsから読み込みます。ヒストグラムを作る際に大事な点は、階級の幅(度数を集計するための区間の大きさ)をどのくらいの大きさにするかという点です。 2-1章 で使用した 各都道府県内にある映画館のスクリーン数のデータ を用いて2つのヒストグラムを作成してみました。 階級の幅が200のヒストグラム. 階級の幅が18のヒストグラム. 階級幅が200のヒストグラムでは、都道府県ごとのスクリーン数の分布がよく分かりません。 一方、階級幅が18ののヒストグラムでは分布は分かるもののやや細か過ぎる印象を与えます。 さらに階級の区切り方が中途半端であるため、階級値が分かりづらくなってしまっています。 階級の幅の決め方にルールはありませんが、グラフを一目見て分布の特徴が捉えられるようにすることが推奨されます。 |zym| xok| bqq| bus| slq| xak| fym| gfu| xln| uks| rxb| olm| gok| jww| nlu| hws| byu| tox| qlm| ivs| ppe| snm| shm| xqn| pua| xbu| ixk| yqd| cvz| ywj| iuz| tup| riy| lvy| ldz| kho| nrz| tyf| lkd| xtw| yxp| sdp| zib| qik| xwg| zqy| ypw| nip| wiu| gbu|