R

可視化連續比例

  • December 8, 2011

我正在嘗試可視化一些具有 4 個類別的消費者數據。用戶可以在不同的類別之間自由切換。我想可視化每個人的最後三個或四個開關。

因此,我們將從一個具有 4 個堆疊比例的列的圖開始。之後,我們將有 16 個,因為每個類別都分解為人們在前一次所做的事情,然後是 64 個,依此類推,直到垃圾箱變得太小而無法使用。

我正在考慮在 marimekko 圖表和堆疊條形圖或 dendro gram 之間的某個地方應該可以工作,但我什至不知道那會叫什麼!

如果有人可以對我應該使用的繪圖類型提供幫助,並且,如果你想變得更好,如何在 R 中實現它,那麼我將非常感激。

一個潛在的想法是使用桑基圖來記錄類別之間的選擇流程。描述我在說什麼的兩個例子是;


隨著您在評論中表達的一些擔憂的更新。在我看來,Parallel Sets 程序可以滿足您的要求。下面是程序的輸出,其中我創建了 4 個具有 4 個類別的隨機變量。無論您初始化到顯示頂部的哪個組,都將在後續類別中按順序劃分。創造你想要的分裂。

在此處輸入圖像描述

在這張圖片中也不明顯,該包具有一些交互式功能,可以更輕鬆地進行探索性數據分析,例如當您將鼠標懸停在其中一個類別上時,它的所有後代都會突出顯示。

我已將相同的數據集上傳到 Fineo,您可以在此處探索。除了最初的 4 個類別變量(命名dec1dec4)之外,我還包括了允許您檢查拆分類別的串聯類別。帶有後綴的變量的命名約定exp是它是dec通過連接先前選擇的類別而擴展的變量。所以dec3_exp12會被標記為121if dec1 = 1 and dec2 = 2 and dec3 = 1。您可以在 Fineo 中創建與 ParSets 中可用的相同的拆分類型結構,但它無法使用本例中的或更多節點。

在玩了 Fineo 之後,它是一個簡潔的應用程序,但它確實是有限的。Parallel Sets 有更多的功能,所以我建議你在 Fineo 應用程序之前檢查一下。


我認為 ParSets 程序比連續將類別分成子集進行檢查要好得多。例如,使用與上面相同的隨機數據,這裡是一個點圖,繪製了decision 2所選類別中的比例類別,條件是為 選擇的類別decision 1

在此處輸入圖像描述

您可以對從decision 2到的更改進行相同的細分decision 3,但為最初的情況製作一個小的多重圖表decision 1

在此處輸入圖像描述

您可以無限繼續此操作(見下文)。這可能很有啟發性,但我懷疑當你到達更多面板時它會相當令人生畏。下面是根據要求,可視化 4 個連續的類別選擇。

在此處輸入圖像描述

如前所述,當您將圖形分成這麼多類別時,數量很少是有問題的。解決這一問題的一種方法是將諸如尺寸之類的美學映射到比例所基於的基線。這會根據視圖中較小的數字縮小觀察結果。您也可以使用透明度(但我已經使點透明以區分此示例中的過度繪製點)。

在此處輸入圖像描述

我想有些人正在設想像節點結構而不是點圖的聖誕樹,但我不知道如何製作這樣的圖形。我懷疑它會懷疑同樣的壓倒性問題。這些小的倍數還不錯,但是 IMO 平行集更加直觀,我懷疑一些不明顯的模式在可視化中會更加明顯。也許比我更有想像力的人能想出一些比 4 個隨機類別更有趣的數據。

引用自:https://stats.stackexchange.com/questions/19538

comments powered by Disqus