![]() |
![]() |
|
前々回・前回に引き続き、同じ例題を用いて解説を試みます。 「文系頭には難しい。」「ちっともコペルニクス的転換じゃない。」というご批判や、「こんなツマラナイ解説よりもバラ育種会社LEX+の買収その後の経過をアナウンスせよ。」というリクエストを頂戴していますが、これが統計的手法に関する連載3回の最終回です。 もう少しお付き合い下さい。 ただ、その一方で、「生データ取得が効率的になった。」「これまで、不要なデータを山のように取って、結局は解析できずにいたが、目から鱗が落ちた。」とのメッセージも頂戴しています。 そのような現場で役立つ「コペ転」のお手伝いができれば本望です。 例題)ポットカーネーションの新品種Aと既存品種B(対照)の主要な農業特性の違いにつき把握するために試験設計を組んで、その違いを明らかにしようとする。 STEP3:「代表値」を用いた解析(手続き)の実施 第3表 草丈「代表値」による統計的解析(手続き)
第4表 草丈「代表値」に関する分散分析表
第3表が今回の手続きの主題であり、全ては第4表の「分散分析表」を埋める数字を見出すためのものです。 スネデカー・コクランの大著「統計的方法」では、
そして、最後に、第4表の「分散分析表」(カッコイイ!!)において、「平均平方」というバラツキの指標となる数字を導き出して、これの割り算をします。 これこそが「F検定」という手順であり、品種間のバラツキが品種内のバラツキより大きいかどうか、という目安の値、「F値」を算出します。 ここで最後のハードルですが、この算出された「F値」がどの程度大きな値なのか?確認をするために、「F分布表(5%点および1%点)」というものを使います。 スネデカー・コクランでは、P515にその表が掲示されています。 これは、本当に頭の良い先人たちが綿密に計算していただいた結果の表ですが、私たちはその数字の出所については疑問を挟むことなく、結果としての数字だけ使わせていただきましょう。
f1(平均平方の大きい方)の自由度=1
f2(平均平方の小さい方)の自由度=2 ですから、その升目に記載されている数字は 5%=18.51 1%=98.49 です。
すまわち、これらの数字より大きなF値であれば、「有意」と言える訳ですから、今回の例:F値=29.1の結果から、 品種間には5%水準で有意な差がある と言えるのです。
大変ご苦労様でした。 得てして、「統計解析」という複雑そうな言葉に惑わされがちですが、心の持ち方として
次回は状況が許すようであれば、ご要望にお応えして、「LEX+買収後」と題してお送りする予定です。 2012年2月 代表取締役社長 清水 明 |
![]()
|
前回に引き続き、同じ例題を用いて解説を試みます。 例題)ポットカーネーションの新品種Aと既存品種B(対照)の主要な農業特性の違いにつき把握するために試験設計を組んで、その違いを明らかにしようとする。 STEP2:生データの取得と「代表値」を用いた解析の準備 第2表 統計的解析のための草丈「代表値」の整理
まずは、第2表を見てください。
これは俗に言うところの、「野帳(温室や圃場で生データ=1次データを取るノート)」と言っても良いかもしれません。 「代表値」という聞きなれない言葉が目に付くでしょう。 ここがポイントで、まさに「コペルニクス的転換」点です。 統計的方法を用いて、ある集団(品種あるいは処理区または反復ブロック)と別の集団(品種あるいは処理区または反復ブロック)を比較しようとする時に、解析に用いるデータは、(母)集団を代表するものでなければならない、という徹底した理解がまず必要です。 ここで陥りやすいのが、「農業形質はばらつくのが当然。だから、個体測定データをそのまま、たくさん、解析に使うのだ。」という考えです。 勿論、それが統計的解析の王道ですが、私は以下の理由でお薦めしません。
ですので、上記(1)(2)を避けるためにも、「現場的手法」として「代表値」を解析に用いることをお薦めします。 前置きが長くなりましたが、「代表値」と言っても、何のことはありません。 ただ、複数個(3個以上が望ましい)の生データ、すなわち、個体調査データの平均値なのです。 ここで、再び声を大にして申し上げますが、「この代表値がある集団(品種あるいは処理区または反復ブロック)を代表している」という認識が重要なのです。 ですから、複数個(3個以上が望ましい)の個体を集団から慎重に選ぶ必要があり、「プロとしてのサンプリング」技能が求められます。 これも非常に大事なポイントで、集団を代表するような個体を抽出する能力(眼力)こそが、プロフェッショナルな生産者の皆さんが知らず知らずのうちに会得されている「奥義」ではないか?と感じることもあるぐらいです。 この集団を代表するような個体の成育(例えば開花や分枝)や問題点(例えば病気発生)などに合致させる形で、管理(追肥や薬剤散布)の内容を決定していくプロセスこそが、「バラつきのある農業で成功する耕種概要」だと信じます。 最後に、蛇足ですが、「代表値」の概念を導入する事と同じくらいに重要な心構えは、「必ず、反復(ブロックの反復、個体の反復ではない。)を確保すること。」です。 ひとことで乱暴にまとめると、統計的処理方法の肝は 「集団間(処理区間、品種間)の差異が、集団内(処理区内、品種内)の差異より大きいかどうか?」を数学的計算式で確認する作業 なのです。 では、その数学的計算式?(というより、「数学的処理手続き」と考える方が心休まりますし、まさに「コペルニクス的転換」なのですが)はどのようなものなのか?については、次回ご説明します。 Do you enjoy? 2012年2月 代表取締役社長 清水 明 |
|
Dear customers; This time, I will try to explain the 2nd chapter of this theme, that is, “How to obtain the useful data in your experimental analysis”. I believe that introduction and understanding of the image of “Representative data” is quite effective in your business front oriented analytical activity. I will proceed to explain by using the same example as previous column. STEP 2 : Individual-raw data taking and preparation for statistical analysis using “representative data” Table 2. Preparation for statistical analysis : Plant Height
In the table 2 above, you can see un-familiar word “Representative” data. This wording is quite crucial, which is Copernicus like turning point, I believe. There must be basic and full understanding that if you want to use any data in order to distinguish one group/population and others, you have to carefully choose and use data which shall represent mother population as precise as possible. However, people tend to drop into the following thoughts, that is, “Since agriculture traits often show big deviation, thus, it might be wise to use many, many individual raw data which can be used for analysis directly.” Yes, I fully agree with this thoughts because it is the way of King, however, I do not recommends you as a person who needs statistical analysis knowledge at the agriculture business front with the following reasons.
In short, I strongly recommend you to use the representative data for calculation purpose instead of individual raw data in order to avoid inconvenience shown in 1 and 2 above. Maybe, I am rather exaggerating a little bit, but please do not be afraid of the image of representative data at all. What you have to do in order to obtain representative data is only just to make average of multiple (hopefully more than 3) individual raw data. With Best Regards, Akira Shimizu |
![]()






