如何在可視化中找到合適的顏色與數據值的關聯？

March 9, 2013

我正在開發一個軟件項目，該項目涉及為洪水模擬創建可視化工具。作為該項目的一部分，我創建了一個水梯度，顯示特定點的水深。為了設置什麼值代表什麼顏色，我遍歷數據並獲取出現的最小值和最大值，並根據該比例均勻分佈顏色。

然而，在這些模擬中，有時點處的水比模擬中的其他任何地方都要深得多。這會導致地圖上的大多數點具有非常相似的顏色，並且信息量不是很大，並且很難看到水較深的區域。

我的目標是為更頻繁出現的深度提供更大範圍的顏色。例如，如果深度從 0 到 12，但大多數深度在 1 和 2 之間，我希望在該範圍內發生比 11 和 12 或 4 和 5 之間更多的顏色變化。看來我需要使用標準偏差或一些涉及正態分佈的東西來做到這一點，但我對這些東西如何工作以及如何使用它們來實現我的目標有點模糊。

可以提供的任何幫助將不勝感激。謝謝你。

聽起來您可能希望將調色板中的每種顏色專用於大致相同數量的數據。

為了說明，這裡是一組的直方圖模擬深度讀數：

想像一下，這被平滑了。這樣做，直方圖可以被均勻地切成相等面積的垂直段，使用盡可能多的切片（我用為了保持面積相等，切片必須在直方圖較高的地方（即有大量數據的地方）很窄，而在直方圖較低的地方（即有是小數據。

輕鬆完成切片的一種方法是根據深度繪製數據總量（“累積比例”）。將垂直軸切成均勻的間隔，然後讀取切片穿過繪圖的深度：將其用作可視化深度的切點。

從數據中計算切點的算法應該是顯而易見的，並且幾乎可以用任何編程語言輕鬆編寫：對值進行排序，將列表分成大小大致相等的組，然後選擇切點以將每個組中的最大值與接替它的組中的最小值。