summary

language R という統計言語の中に summary という関数があります。これと同等のページを作ってみました。
これは、配列に入った数値の集合から、最小値、最大値、平均、標準偏差、第1四分岐点、メディアン、第3四分岐点を計算するももで、この機能プラス、ヒストグラムを作れるページです。

ヒストグラムを描く時重要なのは、一つの棒の幅を幾つにして棒の数をいくつにするかが問題になります。
棒の数は、通常データ数 n に応じて
1 + 3.3 log10(n)
の個数が望ましいと言われていますが、実際にグラフを描くと、幅が切りのいい数字にすると見易くなります。クラス幅のスライダーで調整してみてください。

補足説明

65 43 34 5 49 26 79 73 25 100
81 95 63 17 41 44 40 17 38 45
67 8 69 48 12 38 75 53 97 86
56 100 19 63 75 40 7 61 84 65
55 30 22 39 54 69 72 26 87 30
97 4 24 93 19 27 24 23 6 66
17 94 7 38 7 65 96 71 24 7
59 56 47 15 4 32 59 89 31 70
87 23 60 41 52 35 44 93 42 75
24 3 54 86 35 84 41 66 85 42

たとえば、上記100個の乱数データを COPY して下記入力エリアにいれて、[計算]を押すと1本のバーのデータ幅が 13 になりますが、スライダーで、10 や 20 に設定すると、データ分布の把握が割とわかりやすくなります。

histogram

データ数(N):

Min(最小値):

Max(最大値):

平均値:

標準偏差:

第1四分位点:

Median(中央値):

第3四分位点:

sdline

1 thought on “summary

  1. クラス分けの表示が正しく動いてないようで、問題解決まで、クラス数が指定できるスライダーを非表示にします。
    このため、表示されるクラス数は、データの数による自動計算となり、解決まで指定することはできません。

コメントを残す

メールアドレスが公開されることはありません。

CAPTCHA