Terminology

(multi)collinear/colinear的由來和拼寫

  • November 29, 2017

Multico ll inear 和 multico l inear 似乎都用於科學文獻中,儘管前者似乎更受歡迎,並且也是這裡的標籤名稱。我認為必須有一個更正確的 colinear/collinear 拼寫,但這也是雙向拼寫。

關於這個的兩個問題:

  1. 哪個更正確?額外的 L 是否暗示了一些不同的含義?
  2. 如果不是,為什麼更頻繁地使用 multico ll inear?

對我來說,雙 L 版本更受歡迎似乎並不直觀。我將其定義解釋為與結果“共享線性”,因此是“co-”前綴。創造這個詞的統計學家對此有什麼看法?

共線遵循協作碰撞和 c. 的模型:拉丁語前綴com- (“together”)的**m被同化為拉丁語詞幹的首字母l(參見commiseratemoderncoævalcorrode)。它在第二個音節上重讀,因此是一個不確定的元音或至多是一個短的o

colinear的一個藉口可能是您將linear視為本地詞,遵循 copilot 、 co-worker 等的模型*——這種情況下,前綴被簡化為co-而與詞幹的首字母無關。†我想這樣寫它的人也會在第一個音節上至少用次重音來發音,& 用長o*。

Pace @Carl我不認為英國人普遍偏愛寫雙l與它有很大關係,儘管偏愛更傳統的單詞形式可能。Google Ngrams已發表作品中的出現次數表明,colinear及其衍生詞在美國的不受歡迎程度僅略低於英國英語(1999 - 2008 年的優勢比為 1.4)。

library(ngramr)
#define word list & corpora
words <- "collinear, colinear, collinearity, colinearity, multicollinear, multicolinear, multicollinearity, multicolinearity"
corpora <- c("eng_gb_2012", "eng_us_2012")
# fetch word counts
dd <- ngram(words, corpora, year_start = 1999, smoothing = 0,  count = T, tag = NULL, case_ins = TRUE)
# reduce derivatives
dd$stem <- factor(gsub("multi|ity", "", tolower(dd$Phrase)))
# tabulate
xtabs(Count~stem+Corpus, data=dd) -> tb

然而,很可能使情況變得混亂的是,這個詞的新詞與幾何詞“一起排成一條線”(根據我的字典在 1863 年首次使用)具有不同的含義。在這些中,我們自然會期待colinear的形式,因為人們不再編造拉丁詞。維基百科有一篇關於共線圖的文章,在線 Merriam-Webster 詞典給出了共線(但不是共線)的第二種含義,“具有以相同線性順序排列的相應部分”,發現它在遺傳學和分子生物學中的用途。

† 如果您真的想寫colinear並且有人因此而挑剔您,請詢問他們是否寫了complanar

引用自:https://stats.stackexchange.com/questions/316213

comments powered by Disqus