コンテンツにスキップ

「標本調査」の版間の差分

出典: フリー百科事典『ウィキペディア(Wikipedia)』
削除された内容 追加された内容
TaBOT-zerem (会話 | 投稿記録)
m ロボットによる 追加: no:Prøvetaking
編集の要約なし
 
(33人の利用者による、間の39版が非表示)
1行目: 1行目:

{{参照方法|date=2019年3月}}


'''調'''[[]][[調]]'''調'''[[ ()|]]調[[]][[|]]

{{Expand English|Sampling (statistics)|date=2024年5月}}


'''調'''[[]][[調]]'''調''''''調'''[[ ()|]]調[[]][[|]]


例として、商品などの抜き取り調査、一般の[[社会調査]]や[[世論調査]]などがある。[[国勢調査]]は全数調査であり、[[選挙]]の[[投票]]も建前上は全数調査である。


調調[[調]][[調]][[調]]調[[]][[]]調調調 (motivational bias) {{sfn|||1967|loc=}}


全数調査は一般に以下のような理由によ不可能なことが多いため、標本調査が必要になる。

全数調査は一般に以下のような理由によって不可能なことが多いので、標本調査が必要になる。

*物品を対象とする場合、方法が[[非破壊検査|非破壊的検査]]に限られる。

*物品を対象とする場合、[[破壊検査]]では調査すること自体調査目的に合わない。全数検査は[[非破壊検査|非破壊的検査]]に限る。

*費用・手間・時間がかかる。

*例えば[[医学]]・[[心理学]]などの調査では、全人類(これから生まれる人も含む)が母集団になるから、全数調査は不可能。

*:例えば[[医学]]・[[心理学]]などの調査では、全人類(これから生まれる人も含む)が母集団になり、全数調査は費用・手間・時間が問題となるので調査は不可能。

*コスト・手間・時間がかかる。



== 手順 ==

標本調査は次のような段階を踏んで行われる。

標本調査は次のような段階を踏んで行われる。

#対象とする母集団の定義

#対象とする母集団の定義

18行目: 21行目:

方法としては単純[[無作為抽出]]を用いることが理想的だが、実際には容易でないので、枠と抽出法に関して他の方法が用いられることが多い。

方法としては単純[[無作為抽出]]を用いることが理想的だが、実際には容易でないので、枠と抽出法に関して他の方法が用いられることが多い。



==母集団の定義==

== 母集団の定義 ==


調[[]]

調[[]]


==抽出の枠==

== 標本抽出 ==

=== 抽出の枠 ===

次に、各要素を識別するための抽出枠(リスト)を設定する。

次に、各要素を識別するための抽出枠(リスト)を設定する。



抽出枠は母集団を代表するものでなければならないが、これには統計学だけでなく個別の分野での判断も重要である。

抽出枠は母集団を代表するものでなければならないが、これには統計学だけでなく個別の分野での判断も重要である。




[[1936]]Literary Digest200調[[|F.D.]]57%43%[[]]30調Literary Digest[[]]調

[[1936]][[1936|]]Literary Digest230調[[|F.D.]]57%43%調[[ ()|]]調Literary Digest調1,000調[https://books.google.co.jp/books?id=N5hO3FGsnXEC&pg=PA35&lpg=PA35&dq=The+Literary+Digest+Poll:+Making+of+a+Statistical+Myth&source=bl&ots=--TOuGNZEJ&sig=y28qdbdDZUNfGRcRqt2A1XCjEPQ&hl=en&ei=uerXTce5EZGgsQPf7P25Bw&sa=X&oi=book_result&ct=result&redir_esc=y#v=onepage&q=The%20Literary%20Digest%20Poll%3A%20Making%20of%20a%20Statistical%20Myth&f=false 230][[]]調


具体的には、まず全体を決め、次に以下のような枠組みを決定する。

具体的には、まず全体を決め、次に以下のような枠組みを決定する。



;単純抽出

=== 単純抽出 ===

[[File:Simple random sampling.PNG|100px|thumb|単純抽出]]

:これは全要素を平等に扱い、分割はしない方法である。

これは全要素を平等に扱い、分割はしない方法である。

;層化(層別)抽出([[層化抽出法]])


:[[]][[]][[]]

;クラスター抽出

:母集団の要素が[[データ・クラスタリング|クラスター]]を作っている場合、抽出にこれを利用してコストを省くことができる。例えば[[電話]]の通話を標本とする場合には、まず利用者を抽出し、その人の全ての通話(クラスターを作る)を調べるという方法がとれる。ただしクラスター内の各標本は無作為抽出した標本よりも互いに似た傾向があり、これを補うために標本サイズを大きくする必要がある。

;割当て抽出(クォータ・サンプリング)

:まず母集団を層別抽出と同じように別個の部分集団に分割し、次に各部分に対してそれぞれ決まった割合で対象を選抜する。例えば街頭で45歳から60歳までの女性200人と男性300人にインタビューする場合がこれにあたる。この方法は無作為でないことが一番の欠点である。



==抽出法==

=== 層化(層別)抽出([[層化抽出法]])===

[[File:Stratified sampling.PNG|100px|thumb|層化抽出]]


[[]][[ ()|]] (proportional allocation)  (optimum allocation) 

=== クラスター抽出 ===

[[File:Cluster sampling.PNG|100px|thumb|クラスター抽出]]

母集団の要素が[[データ・クラスタリング|クラスター]]を作っている場合、抽出にこれを利用してコストを省くことができる。例えば[[電話]]の通話を標本とする場合には、まず利用者を抽出し、その人の全ての通話(クラスターを作る)を調べるという方法がとれる。ただしクラスター内の各標本は無作為抽出した標本よりも互いに似た傾向があり、これを補うために標本サイズを大きくする必要がある。


=== 割当て抽出(クォータ・サンプリング) ===

まず母集団を層別抽出と同じように別個の部分集団に分割し、次に各部分に対してそれぞれ決まった割合で対象を選抜する。例えば街頭で45歳から60歳までの女性200人と男性300人にインタビューする場合がこれにあたる。この方法は無作為でないことが一番の欠点である。


== 抽出方法 ==

上記の各タイプの枠内で、次のような抽出法を、単独で、または組合せで使うことができる。

上記の各タイプの枠内で、次のような抽出法を、単独で、または組合せで使うことができる。


*無作為(ランダム)抽出:

=== 無作為(ランダム)抽出 ===

[[無作為抽出]]は確率的抽出の代表的なもので、全ての要素の組合せの起こる[[確率]]がわかっている(必ずしも同じとは限らない)場合である。標本が母集団を適切に代表しないリスクはあるが、統計学理論により抽出に伴う[[誤差]]からそのリスクを計算し、適切な(リスクが容認できる範囲で実用的な)標本サイズを選ぶことができる。無作為抽出のうちで最も基本的な単純無作為抽出では、各要素を同じ確率で選び出す。しかしこれは実用的でない場合も多いので、より実用的な確率的抽出として層化抽出(上述)や多段階抽出(無作為抽出を反復する)がよく用いられる。

[[無作為抽出]]は確率的抽出の代表的なものであり、全ての要素の組合せの起こる[[確率]]がわかっている(必ずしも同じとは限らない)場合である。標本が母集団を適切に代表しないリスクはあるが、統計学理論により抽出に伴う[[誤差]]からそのリスクを計算し、適切な(リスクが容認できる範囲で実用的な)標本サイズを選ぶことができる。無作為抽出のうちで最も基本的な単純無作為抽出では、各要素を同じ確率で選び出す。しかし、これは実用的でない場合も多い。より実用的な確率的抽出として層化抽出(上述)や多段階抽出(無作為抽出を反復する)をよく用いる。[[社会調査]]では、層化、段階の設定など作業者の既知の情報に基づいてしか行わないので、無作為であることはほぼ不可能である。第三者機関の調査でも、無作為であるかどうかよりも、公平であるかどうかを判断基準にすることがある。



無作為抽出が不可能な場合は、以下のような非確率的抽出が用いられる。

無作為抽出が不可能な場合は、以下のような非確率的抽出が用いられる。


*系統抽出:

=== 系統抽出 ===


10[[]]

10[[]]

*機械的抽出:



使

*便宜的抽出

=== 機械的抽出 ===


使

=== 便宜的抽出 ===


[[]]使

[[]]使


==抽出とデータ収集==

=== 復元抽出 ===


調調{{sfn|西|2013|loc=4.3 |p={{google books quote|id=AUY2AgAAQBAJ|page=49|49}}}}調調

データ収集には次のような注意が必要である:

*既定の抽出過程に従って行う

*データの時間順序を守る

*調査過程での注意点を記録する

*調査不能となった対象を記録する



=== 非復元抽出 ===

==データ解析==


調調{{sfn|西|2013|loc=4.3 |p={{google books quote|id=AUY2AgAAQBAJ|page=49|49}}}}調調調

== 抽出とデータ収集 ==

データ収集には次のような注意が必要である。

*既定の抽出過程に従って行う。

*データの時間順序を守る。

*調査過程での注意点を記録する。

*調査不能となった対象を記録する。


== データ解析 ==

伝統的な標本調査は、標本から[[中心極限定理]]と[[正規分布]]近似(場合によっては正規分布によらない[[ノンパラメトリック推定]]も利用できる)を利用して、母集団と[[母数]]を推定することで行う。これは計画に基づく抽出といわれる。

伝統的な標本調査は、標本から[[中心極限定理]]と[[正規分布]]近似(場合によっては正規分布によらない[[ノンパラメトリック推定]]も利用できる)を利用して、母集団と[[母数]]を推定することで行う。これは計画に基づく抽出といわれる。




[[]]

[[]]


===標本の加重===

=== 標本の加重 ===

層別抽出では、一般に標本として抽出される比率が層によって違うので、データには正しく母集団を代表するように加重をしなければならない。

層別抽出では、一般に標本として抽出される比率が層によって異なるので、データには正しく母集団を代表するように加重をしなければならない。



例えば社会調査で単純無作為抽出をするには、僻地の人も含めねばならないが、僻地の人にインタビューするにはコストがかかる。このコストを節約する方法として、都会と地方に層化する方法がある。地方の標本が小さくなっても、分析で重みをつけることによ補うことができる。

例えば社会調査で単純無作為抽出をするには、僻地の人も含めねばならないが、僻地の人にインタビューするにはコストがかかる。このコストを節約する方法として、都会と地方に層化する方法がある。地方の標本サイズが小さくなっても、分析で重みをつけることによって補うことができる。



==抽出過程の再調査==

== 抽出過程の再調査 ==

抽出後の分析での変動が起こす影響を検討するために、(最初に意図した方法ではなく)実際に行った抽出過程について再調査する必要がある。特に問題となるのは調査不能対象である。

抽出後の分析での変動が起こす影響を検討するために、(最初に意図した方法ではなく)実際に行った抽出過程について再調査する必要がある。特に問題となるのは調査不能対象である。



===調査不能者===

=== 調査不能者 ===


調調調調

調調調調


==関連項目==

== 出典 ==

{{reflist|2}}


== 参考文献 ==

* {{Cite book|和書 |author1=福武 直 |author2=松原 治郎 |year=1967 |title=社会調査法 |publisher=[[有斐閣]] |ref=harv}}

* {{Cite book|和書 |author=西岡 康夫 |year=2013 |title=数学チュートリアル やさしく語る 確率統計 |url={{google books|AUY2AgAAQBAJ|plainurl=yes}} |publisher=[[オーム社]] |isbn=978-4-274-21407-3 |ref=harv}}

* {{Cite book|和書 |author=伏見康治|authorlink=伏見康治 |year=1942 |title=確率論及統計論 |publisher=[[河出書房]] |isbn=978-4-87-472012-7 |url= http://ebsa.ism.ac.jp/ebooks/ebook/204 |ref={{sfnref|伏見}}}}

* {{citation|和書 |year=1999 | title=JIS Z 8101-1:1999 統計 − 用語と記号 − 第1部:確率及び一般統計用語 | publisher=[[日本規格協会]] | publisherlink=kikakurui.com | url=http://kikakurui.com/z8/Z8101-1-1999-01.html | ref={{sfnref|JIS Z 8101-1:1999}}}}

* {{Cite book|和書 |author=日本数学会|authorlink=日本数学会 |year=2007 |title=数学辞典 |publisher=[[岩波書店]] |isbn=978-4-00-080309-0}}


== 関連項目 ==

*[[統計]]

*[[統計]]

*[[統計学]]

*[[統計学]]

83行目: 113行目:

*[[母集団]]

*[[母集団]]

*[[無作為抽出]]

*[[無作為抽出]]

*[[世論調査]]


== 外部リンク ==

* {{Kotobank}}



{{統計学}}

[[Category:統計学|ひようほんちようさ]]

[[Category:調査|ひようほんちようさ]]

[[Category:標本|ひようほんちようさ]]

[[Category:社会科学|ひようほんちようさ]]

[[Category:数学に関する記事|ひようほんちようさ]]



{{Normdaten}}

[[da:Stikprøve]]

{{デフォルトソート:ひようほんちようさ}}

[[de:Auswahlverfahren]]

[[Category:統計学的方法]]

[[en:Sampling (statistics)]]

[[Category:標本]]

[[es:Muestreo en estadística]]

[[Category:社会科学]]

[[fi:Otanta]]

[[Category:数学に関する記事]]

[[fr:Échantillon (statistiques)]]

[[Category:評価方法]]

[[he:מדגם]]

[[hu:Mintavétel]]

[[id:Teknik sampling]]

[[it:Campionamento statistico]]

[[ko:표집]]

[[lt:Atranka]]

[[no:Prøvetaking]]

[[pl:Dobór próby]]

[[pt:Base de sondagem]]

[[ru:Семплирование (математическая статистика)]]

[[simple:Sampling (statistics)]]

[[su:Sampling (statistika)]]


2024年5月22日 (水) 12:27時点における最新版


調調調調調

調調調調調調調調調 (motivational bias) [1]

調調

調調


調調調

[]


調

(一)

(二)

(三)

(四)

(五)

(六)調


[]


調

[]

[]






1936Literary Digest230調F.D.57%43%調調Literary Digest調1,000調230調


[]



[]


 (proportional allocation)  (optimum allocation) 

[]


調

[]


4560200300

[]


使

[]


調調


[]


10

[]


使

便[]


使

[]


調調[2]調調

[]


調調[2]調調調

[]








調

調

[]


調


[]




調

調[]


調調

調[]


調調調調

出典[編集]

  1. ^ 福武 & 松原 1967, 動機.
  2. ^ a b 西岡 2013, p. 49, 4.3 乗法定理.

[]


  調1967 

西   2013ISBN 978-4-274-21407-3https://books.google.co.jp/books?id=AUY2AgAAQBAJ 

1942ISBN 978-4-87-472012-7http://ebsa.ism.ac.jp/ebooks/ebook/204 

JIS Z 8101-1:1999     11999http://kikakurui.com/z8/Z8101-1-1999-01.html 

2007ISBN 978-4-00-080309-0 

[]








調

 ()





調

[]


調 -