数据分析及可视化(技术创新)
全文共5489字,预计学习时间11分钟。
可视化可以回答尚未被发现的问题。
哭泣的自行车
掌握数据可视化技术,将打开通往新世界的大门,带来更多机遇。设计良好的可视化可以帮助程序员找到原始数据集的核心。这就是成功的数据科学项目和普通数据科学项目的区别。
因此,本文旨在展示数据可视化的强大功能。本文总结了15种令人惊叹的可视化方法,涵盖了各种主题。它可以应用于您选择的任何工具,但本文将以Python、R、Tableau和D3.js为例。
1.用r可视化数据。
在选择数据可视化工具时,R语言是创建ggplot2库的最佳选择。
只需几行代码就能实现个性化可视化,获得实时反馈,揭示数据模式。难怪偏爱Python的程序员也会在Jupyter笔记本中安装ggplot2(是的,这个功能目前已经实现了)。
如果您正在使用R语言,但尚未安装ggplot2,请立即开始:
R语言对数据可视化的全方位指导
门户网站:https://www . analyticsvidhya.com/blog/2015/07/guide-data-visualization-r/?UTM _ source=blogutm _ medium=11-数据-可视化-python-r-tableau-d3js
R语言用户使用ggplot2时的10个常见问题
门户网站:https://www . analyticsvidhya.com/blog/2016/03/questions-gg plot 2-package-r/?UTM _ source=blogutm _ medium=11-数据-可视化-python-r-tableau-d3js
2.用R语言创建BBC风格的可视化
严格来说,这不是可视化,但基本上是一样的。上图为BBC数据团队发布的视觉融合。
事实上,英国广播公司数据团队已经开发并发布了一个R语言包和指令,以生成类似于上面的视觉效果。R语言包的名称是bbplot,它包含创建和导出可视化的功能。它可以在ggplot中使用,使BBC数据团队风格可视化。
以下是一些重要的资源:
Bbplot包
门户:https://github.com/bbc/bbplot
英国广播公司数据团队r语言指导手册
门户:https://bbc.github.io/rcookbook/
3.用R语言构建交互式图形
谁不喜欢交互式图表?它们是演示文稿中最有吸引力的方面之一(如果使用得当)。这种可视化显示了不同大陆人口预期寿命和人均国内生产总值之间不断变化的关系。
这么多的信息可以装进这么小的空间。有没有一个包可以可视化上面的图片?当然是ganimate!毫无疑问,ggplot强大的功能可以扩展到另一种奇妙的可视化类型。
读者可以根据本指南用R语言创建交互式图表:
如何在R中创建动画来分析健康数据
门户:https://www . analyticsvidhya.com/blog/2019/04/how-build-personalized-interactive-fitness-tracker-dashboard-r/?UTM _ source=blogutm _ medium=11-数据-可视化-python-r-tableau-d3js
4.用R语言构建桑基图
这是一个典型的三七图的例子,其中箭头的宽度与流量成正比,表示信息流。上图显示了脸书定制广告列表的相关性。
这个可视化是由R的g冲积包创建的,它的tidyverse函数考虑了原始的
alluvial 包的风格和灵活性。完整代码:https://stackoverflow.com/questions/50395027/beautifying-sankey-alluvial-visualization-using-r
5. 用Tableau进行数据可视化
好的信息可视化没有规则,没有指南,没有模板,没有标准技术,没有样本。但你必须做好应该做的。
整齐的豌豆(Edward Tufte)
整齐的豌豆是数据可视化领域的先驱。这句话适用于在Tableau语言生成可视化。其强大全面的功能和自由发挥的空间是无与伦比的。
如果你对Tableau感兴趣,下列文章可以帮助你从新手到专家:
• 新手Tableau指南–简单生成数据可视化
传送门:https://www.analyticsvidhya.com/blog/2017/07/data-visualisation-made-easy/?utm_source=blog&utm_medium=11-data-visualizations-python-r-tableau-d3js
• 数据科学以及商业智能人士的Tableau指南
传送门:https://www.analyticsvidhya.com/blog/2018/01/tableau-for-intermediate-data-science/?utm_source=blog&utm_medium=11-data-visualizations-python-r-tableau-d3js
• Tableau的进阶指南
传送门:https://www.analyticsvidhya.com/blog/2018/03/tableau-for-advanced-users-easy-expertise-in-data-visualisation/?utm_source=blog&utm_medium=11-data-visualizations-python-r-tableau-d3js
6. 世界上最大的选举–印度大选的可视化处理
这个图像相当惊人,这里只选取了一部分。这个可视化覆盖的范围和数据量是惊人的,对这类数据分析感兴趣的人来说非常有用。
图中每个数据点代表每个席位的详细信息,包括获胜者的姓名、州、政党和选区。这个可视化成功处理了庞大的信息,最终呈现了一个非常好的效果。
此处为完整的Tableau面板,可自行下载:https://public.tableau.com/en-us/gallery/worlds-largest-vote?tab=featured&type=featured
7. 用Tableau监控销售业绩
本文使用的是真实的商业案例。如果读者还不知道怎么在现实中的应用可视化(发挥你的想象力!),那么你会觉得这个工具非常实用。
这是一份对销售数据的分析,与原有的额度进行对比。第一个水平选项卡非常棒,它清晰地总结了客户或其他利益相关者需知的关键数据。
完整的Tableau工作簿(https://www.tableau.com/solutions/workbook/track-sales-interactive-dashboard?__src=liftigniter&__widget=learn-recs-li&li_source=LI&li_medium=learn-recs-li)包含五个全面的面板,从不同的角度展示了销售数据。强烈建议从事销售或市场工作的人士进行参考。
8. 1910-2018年间电影题材的流行程度
如果你是一个超级电影迷,这个图像应该会让你印象深刻——Tableau中public gallery。记住,这是电影题材的流行程度随时间变化的趋势。每个题材都有不同的轴范围,应该从这个角度切入(而不是挨个比较)。
最突出的一点是,可以将其视为一个包含多个数据点的面板。请你思考该面板在职场中的其他用法。
你可以下载完整的工作表单,在Tableau中进行实验。
传送门:https://public.tableau.com/profile/bo.mccready8742
9. 用D3.js生成数据可视化
要想创建绝佳的动态可视化效果,d3.js是个好工具。它是一个强大的库,能够为任何类型的网络故事构建自定义的可视化。
如果你想时不时地用上数据可视化,强烈推荐掌握d3.js这项技能。
以下是两篇很受欢迎的D3.js入门文章:
• 用D3.js生成网页数据可视化——初学者指南
传送门:https://www.analyticsvidhya.com/blog/2017/07/beginner-guide-build-data-visualisations-web-d3-js/?utm_source=blog&utm_medium=11-data-visualizations-python-r-tableau-d3js
• 如何用D3.js创建惊艳的网页数据可视化?
传送门:https://www.analyticsvidhya.com/blog/2017/08/visualizations-with-d3-js/?utm_source=blog&utm_medium=11-data-visualizations-python-r-tableau-d3js
10. 概念图–概念的相互关系
笔者经常使用概念图,这样可以很容易地描述不同概念或知识点之间的关系。维基百科是这样定义的,“概念图通常将想法和信息展现在方框或圆中,分别与下级结构中的标记箭头相连”。
概念图适用于业务决策、流程图、信息设计、知识可视化等场景。人们通常低估它的作用,但它其实十分有用。
此概念图具有一定的交互性,你也可以使用不同的节点:
http://www.findtheconversation.com/concept-map/
11. 用D3.js实现Sunburst序列的可视化
这种可视化展示了如何结合sunburst概念与描述事件序列的数据。
想想看——你可以用它来展示客户的行程。通过这种方式,用户可以看到所有可能性,而不止是静态漏斗。你的营销团队会为此拍手称赞的。
查看D3.js完整代码,生成sunburst序列:
https://bl.ocks.org/kerryrodden/766f8f6d31f645c39f488a0befa1e3c8
12. 《权力的游戏》人物关系的可视化
你是《权游》粉吗?如果是,那你一定会喜欢这种可视化的。上图展示了每一个角色在《冰雨的风暴》中的出场次数,从而显示每个角色的影响因子。
请注意,节点表示字符和链接,以及这两者之间的相互影响。节点和名称的大小表示角色的影响。小恶魔带来的影响最大,看到了吧?
可用此教程创建自己的《权力的游戏》可视化图像:
https://www.analyticsvidhya.com/blog/2017/08/visualizations-with-d3-js/?utm_source=blog&utm_medium=11-data-visualizations-python-r-tableau-d3js
13. 用Python生成数据可视化图像
人们通常认为Python是数据科学的终极编程语言。在清理数据、构建预测模型、甚至某些数据工程时都会用到它。但是你知道Python实际上也有强大的数据可视化功能吗?
没错,Python带有两个专用的可视化库——matplotlib和seaborn。
• 9种最受欢迎的用Python生成数据可视化的方法
传送门:https://www.analyticsvidhya.com/blog/2015/05/data-visualization-python/?utm_source=blog&utm_medium=11-data-visualizations-python-r-tableau-d3js
14. 火星地质图
这张火星地质图简直是艺术,它竟然是在Adobe Illustrator帮助下用Python创建的,这太不可思议了!
可用于创建这种美丽的可视化效果的Python库有:
• Matplotlib
• NumPy
• Pandas
• Cartopy
获取完整的高分辨率图像:https://external-preview.redd.it/YsUvGQZYDg6UpWoAg_4dR5s-B_8Y_JtPQfylTOG6p10.jpg?auto=webp&s=53ae6d53f5ce977ffb9f44caa336794dae1ad21e
Python代码:https://www.reddit.com/r/dataisbeautiful/comments/c4elys/oc_a_geologic_map_of_mars/
15. 用Python绘制地球同步卫星
笔者对数据科学界正在进行的卫星数据研究很感兴趣。目前已经发现了新的行星,重新创建了地面图像,NASA可进行地震预测等等。
PyEphem包可以在Python中创建此绘图。Pyephem基本允许在Python中实现天文算法。
很多数据科学爱好者尝试绘制这种可视化图,可以在此处找到所有的资源:https://www.reddit.com/r/dataisbeautiful/comments/3gxp87/i_just_plotted_every_tleinfo_satellite_above_my/
留言 点赞 关注
我们一起分享AI学习与发展的干货
编译组:dbdfn、失眠的秀发
相关链接:
https://www.analyticsvidhya.com/blog/2019/08/11-data-visualizations-python-r-tableau-d3js/
如需转载,请后台留言,遵守转载规范