(multi)collinear/colinear的由來和拼寫

November 29, 2017

Multico ll inear 和 multico l inear 似乎都用於科學文獻中，儘管前者似乎更受歡迎，並且也是這裡的標籤名稱。我認為必須有一個更正確的 colinear/collinear 拼寫，但這也是雙向拼寫。

關於這個的兩個問題：

哪個更正確？額外的 L 是否暗示了一些不同的含義？

如果不是，為什麼更頻繁地使用 multico ll inear？

對我來說，雙 L 版本更受歡迎似乎並不直觀。我將其定義解釋為與結果“共享線性”，因此是“co-”前綴。創造這個詞的統計學家對此有什麼看法？

共線遵循協作、碰撞和 c. 的模型：拉丁語前綴com- （“together”）的**m被同化為拉丁語詞幹的首字母l（參見commiserate、modern、coæval、corrode）。它在第二個音節上重讀，因此是一個不確定的元音或至多是一個短的o。

colinear的一個藉口可能是您將linear視為本地詞，遵循 copilot 、 co-worker 等的模型*——在這種情況下，前綴被簡化為co-而與詞幹的首字母無關。†我想這樣寫它的人也會在第一個音節上至少用次重音來發音，& 用長o*。

Pace @Carl我不認為英國人普遍偏愛寫雙l與它有很大關係，儘管偏愛更傳統的單詞形式可能。Google Ngrams已發表作品中的出現次數表明，colinear及其衍生詞在美國的不受歡迎程度僅略低於英國英語（1999 - 2008 年的優勢比為 1.4）。
library(ngramr)
#define word list & corpora
words <- "collinear, colinear, collinearity, colinearity, multicollinear, multicolinear, multicollinearity, multicolinearity"
corpora <- c("eng_gb_2012", "eng_us_2012")
# fetch word counts
dd <- ngram(words, corpora, year_start = 1999, smoothing = 0,  count = T, tag = NULL, case_ins = TRUE)
# reduce derivatives
dd$stem <- factor(gsub("multi|ity", "", tolower(dd$Phrase)))
# tabulate
xtabs(Count~stem+Corpus, data=dd) -> tb
然而，很可能使情況變得混亂的是，這個詞的新詞與幾何詞“一起排成一條線”（根據我的字典在 1863 年首次使用）具有不同的含義。在這些中，我們自然會期待colinear的形式，因為人們不再編造拉丁詞。維基百科有一篇關於共線圖的文章，在線 Merriam-Webster 詞典給出了共線（但不是共線）的第二種含義，“具有以相同線性順序排列的相應部分”，發現它在遺傳學和分子生物學中的用途。

† 如果您真的想寫colinear並且有人因此而挑剔您，請詢問他們是否寫了complanar。

引用自：https://stats.stackexchange.com/questions/316213

comments powered by Disqus

(multi)collinear/colinear的由來和拼寫

相關問答

為什麼多重共線性與相關性不同？

多重共線性會增加每個協變量的 beta 方差還是僅增加那些共線的協變量？

多重共線性導致的模型不穩定性究竟是什麼？

彈性網為什麼叫彈性網？

變量和共線性的標準化

多重共線性和預測性能