書的暢銷==>原因有很多, 可能是書的內容, 出版者, 定價…
找出一個"描畫共通的構圖"
ex:書的銷售好像是由內容與定價來決定
y=f(x1,x2,x3,…), 其中x間要相互獨立
//多變量分析法是為了分析關於複雜奇怪的社會及人類現象的結構守法的集合。
一個問卷給不同人打分數, 從主要結果也可以大致上看出是否打出的分數有”相關性”
//相關 correlation
相關有正相關, 負相關, 沒有關係(以數值表示的話,接近於0)
整理數值, 將順序編號, 例如六個球隊的喜歡程度從1~6排序
==>將兩者完全一致的順序相乘在加總, 與兩者完全相反的順序相乘再加總, 則相關的程度一定在兩個數值之間, 但正相關與負相關的程度應該在一致, 所以要在取平均值==>然後在標準化。
讓完全一致(1),完全相反(-1)
另外一種狀況跟順序沒有關係的, 例如 面試成績與進公司後的表現的相關性, 就要用皮爾森係數來表示
!!!相關係數常犯的錯誤==>資料是否有不同質的問題, 例如全體年紀不一樣要檢測數學力, 或是整體看起來沒相關(但男女生分開看又都有相關), 或是刪除掉的資料群組是否資料也有一起刪掉(例如面試成績與在公司的實力, 忘了把不及格的資料刪除)
x與y相關係數高, 不能想成有因果關係, 須從另外的立場判斷。
沒有留言:
張貼留言