หลังจากที่เรียนจบมานาน ก็อาจจะเกิดอาการลืมเลือนไปแล้วว่า ถ้าเกิดเราต้องการวิเคราะห์ข้อมูลที่เรามีอยู่ซักชุดนึงเนี่ย เราควรวิเคราะห์ด้วยวิธ...
หลังจากที่เรียนจบมานาน ก็อาจจะเกิดอาการลืมเลือนไปแล้วว่า ถ้าเกิดเราต้องการวิเคราะห์ข้อมูลที่เรามีอยู่ซักชุดนึงเนี่ย เราควรวิเคราะห์ด้วยวิธีไหนดี บทความนี้จะช่วยสรุปกรอบความคิดหลัก ๆ ไว้ให้เผื่ออ่านทบทวนครับ ก่อนอื่นเราต้องรู้จักประเภทของข้อมูลเสียก่อน เราสามารถแบ่งข้องมูลออกเป็น 4 ประเภท นั่นคือ
เอามาจาก http://www.graphpad.com/faq/viewfaq.cfm?faq=1089
หมายเหตุ บางทีเราก็จะจัดกลุ่ม Interval กับ Ratio ให้อยู่ด้วยกันแล้วเรียกรวมๆว่า Measurement ไม่ก็ Interval ก็มีครับ
พอเรารู้จักประเภทข้อมูลแล้ว เราก็มาดูเครื่องมือที่ให้เราเลือกใช้กันต่อไปครับ
(ตัวสีส้มคือสิ่งที่เรียนใน MBA ครับ)
ดัดแปลงมาจาก http://www.graphpad.com/www/Book/Choose.htm
นอกจากตารางนี้ ยังมีเว็บที่น่าสนใจอีกหลายอันที่บอกวิธีเลือกครับ เช่น
- Nominal (Categorical) เป็นข้อมูลที่มีลักษณะเป็น ประเภท ที่ไม่มีความหมายเรื่องของการเรียงลำดับหรือการคำนวณใด ๆ ทั้งสิ้น เช่น สี, ชื่อกลุ่ม, yes-no เป็นต้น
- Ordinal เป็นข้อมูลประเภทที่มีผลด้านการเรียงลำดับ แต่ไม่มีผลด้านการคำนวณ เช่น การจัดลำดับ หรือ การให้ Rating ความพึงพอใจ 1-5 ผลต่างระหว่าง Rating 5 กับ 3 และ 3 กับ 1 นั้นอาจจะไม่เท่ากันก็ได้ เราบอกได้แค่อะไรมากกว่าอะไรเท่านั้น
- Interval คือตัวแปรที่เกิดจากการวัดค่า เราเปรียบเทียบผลต่างของค่าได้ แต่เปรียบเทียบอัตราส่วนไม่ได้ เช่น ค่า pH 3 ไม่ได้มีกรดเป็น 2 เท่าของ pH6 และ ค่า 0 ของมันเป็นแค่จุดๆ หนึ่งใน Scale ซึ่ง 0 ไม่ได้แปลว่าไม่มีสิ่งนั้นอยู่ เช่น 0 องศา C ไม่ได้แปลว่าไม่มีอุณหภูมิ
- Ratio คือตัวแปรที่เกิดจากการวัดค่า โดยที่ผลต่างระหว่างค่า 2 อันมีค่าเท่ากัน และอัตราส่วนของมันยังมีความหมายด้วย และที่สำคัญคือ ค่า 0 ของมันมีความหมายแปลว่าไม่มีสิ่งนั้นอยู่ เช่น จำนวนคนในห้อง, น้ำหนัก และ องศา K ( 0 องศา K คือ absolute zero ไม่มีอุณหภูมิจริง ๆ ) และน้ำหนัก 8 กิโล หนักเป็น 2 เท่าของ 4 กิโลจริง ในทางกลับกัน
Nominal | Ordinal | Interval | Ratio | |
frequency distribution (การแจกแจงความถี่) | Yes | Yes | Yes | Yes |
median and percentiles | No | Yes | Yes | Yes |
add or subtract (บวก ลบ) | No | No | Yes | Yes |
mean, standard deviation, standard error of the mean (ค่าเฉลี่ย, เบี่ยงเบนมาตรฐาน) | No | No | Yes | Yes |
ratio, or coefficient of variation (การหาอัตราส่วน, สัมประสิทธิ์ความแปรปรวน) | No | No | No | Yes |
เอามาจาก http://www.graphpad.com/faq/viewfaq.cfm?faq=1089
หมายเหตุ บางทีเราก็จะจัดกลุ่ม Interval กับ Ratio ให้อยู่ด้วยกันแล้วเรียกรวมๆว่า Measurement ไม่ก็ Interval ก็มีครับ
พอเรารู้จักประเภทข้อมูลแล้ว เราก็มาดูเครื่องมือที่ให้เราเลือกใช้กันต่อไปครับ
(ตัวสีส้มคือสิ่งที่เรียนใน MBA ครับ)
Measurement (Interval/Ratio) จาก Normal Population)
|
Rank, Score, or Measurement
(จาก Non- Normal Population) |
Binomial
(ผลลัพท์เป็นไปได้ 2 อย่าง เช่น การวัด Proportion) | |
Describe one group
บรรยายข้อมูล 1 กลุ่ม |
Mean, SD
|
Median
Interquartile range (IQR)
|
Proportion
|
Compare one group to a hypothetical value
(Hypothesis testing)
เปรียบเทียบข้อมูล 1 กลุ่มกับค่าสมมติฐาน |
One-sample t test
|
Wilcoxon test
|
Chi-square
Binomial test **
|
Compare two unpaired groups
(Hypothesis testing) เปรียบเทียบข้อมูลจากกลุ่ม2กลุ่มที่ข้อมูลไม่มีการจับคู่กัน (Independent กัน) |
Unpaired t test (student's t-test)
|
Mann-Whitney test
|
Fisher's Exact test
Chi-square (for large samples)
|
Compare two paired groups
(Hypothesis testing)
เปรียบเทียบข้อมูลจากกลุ่ม2กลุ่มที่ข้อมูลมีการจับคู่กัน |
Paired t test
|
Wilcoxon test
|
McNemar's test
|
Compare three or more unmatched groups
(Hypothesis testing) เปรียบเทียบข้อมูลจากกลุ่มหลายกลุ่มที่ข้อมูลไม่มีการจับคู่กัน (Independent กัน) |
One-way ANOVA (F-test)
|
Kruskal-Wallis test
|
Chi-square test
|
Compare three or more matched groups
(Hypothesis testing) เปรียบเทียบข้อมูลจากกลุ่มหลายกลุ่มที่ข้อมูลมีการจับคู่กัน |
Repeated-measures ANOVA
|
Friedman test
|
Cochrane Q**
|
Quantify association between two variables
วัดระดับของความเกี่ยวข้องกันของตัวแปร 2 ตัว |
Pearson correlation
|
Spearman correlation
|
Contingency coefficients**
|
Predict value from another measured variable
คาดคะเนค่าหนึ่งจากอีกตัวแปรหนึ่ง |
Simple linear regression
or Nonlinear regression |
Nonparametric regression**
|
Simple logistic regression*
|
Predict value from several measured or binomial variables
คาดคะเนค่าหนึ่งจากตัวแปรหลายๆ ตัว |
Multiple linear regression*
or Multiple nonlinear regression** |
Multiple logistic regression*
|
ดัดแปลงมาจาก http://www.graphpad.com/www/Book/Choose.htm
นอกจากตารางนี้ ยังมีเว็บที่น่าสนใจอีกหลายอันที่บอกวิธีเลือกครับ เช่น
- http://bama.ua.edu/~jleeper/627/choosestat.html
- http://www.ats.ucla.edu/stat/mult_pkg/whatstat/default.htm
- http://www.microsiris.com/Statistical%20Decision%20Tree/
COMMENTS