統計 、データの収集、分析、提示、および解釈の科学。国勢調査データおよびさまざまな経済活動に関する情報に対する政府のニーズは、初期の多くを提供しました 推進力 統計の分野のために。現在、多くの応用分野で利用可能な大量のデータを有用な情報に変える必要性が、統計の理論的および実際的な発展の両方を刺激しています。
データは、提示と解釈のために収集、分析、要約された事実と数字です。データは、定量的または定性的に分類できます。定量的データは、何かの量または数を測定し、定性的データは、同様のアイテムのカテゴリのラベルまたは名前を提供します。たとえば、特定の研究が、100人のサンプルの年齢、性別、結婚歴、年収などの特性に関心があるとします。これらの特性は、 研究の変数 、および各変数のデータ値は、各個人に関連付けられます。したがって、28歳の男性、独身、および30,000ドルのデータ値は、年収が30,000ドルの28歳の独身男性について記録されます。 100個の個人と4つの変数がある場合、データセットには100×4 = 400個のアイテムが含まれます。この例では、年齢と年収は量的変数です。対応するデータ値は、各個人の年数と金額を示します。性別と結婚状況は質的変数です。男性と女性のラベルは性別の定性的データを提供し、独身、既婚、離婚、未亡人のラベルは結婚状況を示します。
サンプル調査法は、観察研究からデータを収集するために使用され、実験計画法は、実験研究からデータを収集するために使用されます。記述統計の領域は、主に、グラフ、表、および数値の要約を使用してデータを提示および解釈する方法に関係しています。統計学者がサンプル(つまり、母集団のサブセット)からのデータを使用して母集団についてステートメントを作成するときは常に、統計的推論を実行しています。見積もりと 仮説検定 統計を作成するために使用される手順です 推論 。ヘルスケアなどの分野、 生物学 、 化学 、 物理 、教育、工学、ビジネス、および経済学は統計を広範に利用します 推論 。
確率の方法は、最初に開発されました 分析 ギャンブルゲームの。確率は統計的推論において重要な役割を果たします。これは、推論の品質と精度の尺度を提供するために使用されます。この記事では、統計的推論の方法の多くについて説明します。これらの方法のいくつかは、主に単一変数の研究に使用されますが、回帰分析や相関分析などの他の方法は、2つ以上の変数間の関係について推測するために使用されます。
イースターの目的は何ですか
記述統計は、データの表形式、グラフ形式、および数値による要約です。記述統計の目的は 促進する データの提示と解釈。新聞や雑誌に掲載されている統計的表現のほとんどは、本質的に記述的です。記述統計の単変量法は、データを使用して 強化する 単一の変数の理解;多変量メソッドは、統計を使用して2つ以上の変数間の関係を理解することに重点を置いています。記述統計の方法を説明するために、100人の年齢、性別、結婚状況、および年収に関するデータが収集された前の例を調べます。
単一変数のデータの最も一般的に使用される表形式の要約は、度数分布です。度数分布は、重複しないいくつかのクラスのそれぞれのデータ値の数を示します。相対度数分布と呼ばれる別の表形式の要約は、各クラスのデータ値の割合またはパーセンテージを示します。 2つの変数のデータの最も一般的な表形式の要約は、2変数のクロス集計です。 アナログ 度数分布の。
定性変数の場合、度数分布は各定性カテゴリのデータ値の数を示します。たとえば、可変性別には、男性と女性の2つのカテゴリがあります。したがって、性別の度数分布には、男性と女性の数を示す2つの重複しないクラスがあります。この変数の相対度数分布は、男性である個人の割合と女性である個人の割合を示します。
量的変数の度数分布を作成するには、クラスとその間の分割点を定義する際にさらに注意が必要です。 隣接 クラス。たとえば、上記の例の年齢データが22〜78歳の場合、次の6つの重複しないクラスを使用できます:20〜29、30〜39、40〜49、50〜59、60〜69、および70〜 79。度数分布は、これらの各クラスのデータ値の数を示し、相対度数分布は、それぞれのデータ値の割合を示します。
クロス集計は、テーブルの行が1つの変数のクラスを表し、テーブルの列が別の変数のクラスを表す双方向テーブルです。変数genderとageを使用してクロス集計を作成するには、性別を男性と女性の2行で表示し、年齢を20〜29、30〜39、40〜49、50の年齢クラスに対応する6つの列で表示できます。 –59、60–69、および70–79。表の各セルのエントリは、行見出しで指定された性別と列見出しで指定された年齢でデータ値の数を指定します。このようなクロス集計は、性別と年齢の関係を理解するのに役立つ可能性があります。
データを記述するために、いくつかのグラフィカルな方法を利用できます。 A 棒グラフ 度数分布に要約された定性的データを表すためのグラフィカルデバイスです。グラフの横軸には、定性変数のカテゴリのラベルが表示されます。各ラベルの上のバーは、各バーの高さがカテゴリ内のデータ値の数に比例するように作成されます。上記の例の100人の結婚状況の棒グラフを以下に示します。図1。グラフには、クラスごとに1つずつ、合計4つのバーがあります。円グラフは、定性的なデータを要約するためのもう1つのグラフィカルデバイスです。円グラフの各スライスのサイズは、対応するクラスのデータ値の数に比例します。 100人の結婚状況の円グラフを以下に示します。図2。
棒グラフ図1:100人の結婚状況を示す棒グラフ。ブリタニカ百科事典
円グラフ図2:100人の結婚状況の円グラフ。ブリタニカ百科事典
ヒストグラムは、度数分布に要約されている定量的データの最も一般的なグラフ表示です。横軸は量的変数の値を示しています。長方形の底辺がクラス間隔の幅に等しく、その高さがクラス内のデータ値の数に比例するように、各クラスの上に長方形が描画されます。
Copyright © 全著作権所有 | asayamind.com