大数据导论
上QQ阅读APP看书,第一时间看更新

1.5.3 数据解释

数据分析是大数据处理的核心,但是用户往往更关心结果的展示。如果分析的结果正确但是没有采用适当的解释方法,则所得到的结果很可能让用户难以理解,极端情况下甚至会误导用户。数据解释的方法很多,比较传统的就是以文本形式输出结果或者直接在计算机终端上显示结果。这种方法在面对小数据量时是一种很好的选择。但是大数据时代的数据分析结果往往也是海量的,同时结果之间的关联关系极其复杂,采用传统的解释方法基本不可行。可以考虑从下面两个方面提升数据解释能力:

(1)引入可视化技术。可视化作为解释大量数据最有效的手段之一率先被科学与工程计算领域采用。通过对分析结果的可视化用形象的方式向用户展示结果,而且图形化的方式比文字更易理解和接受。常见的可视化技术有标签云(Tag Cloud)、历史流(History Flow)、空间信息流(Spatial Information Flow)等。可以根据具体的应用需要选择合适的可视化技术。

(2)让用户能够在一定程度上了解和参与具体的分析过程。这个既可以采用人机交互技术,利用交互式的数据分析过程来引导用户逐步地进行分析,使得用户在得到结果的同时更好地理解分析结果的由来。也可以采用数据起源技术,通过该技术可以帮助追溯整个数据分析的过程,有助于用户理解结果。