数据可视化
📊 数据可视化项目
本页面展示了往期项目单元中的可视化叙事作品,使用了 R、Python、SAS 和 Tableau 等工具完成。
🦠 新冠疫情的趋势分析 (R)
使用公共数据集对全球及各大洲 COVID-19 病例和死亡数据进行可视化分析。 工具:R(ggplot2、dplyr)、Tableau 和 Python。
疫情在美国各大区域的传播趋势及分波段分析

各波次的病死率(CFR)变化趋势

各波次中超额死亡率与确诊率的关系


各州在不同波次的死亡率热力图分类展示

各波次中死亡率最高与最低的三个州柱状图展示

🎵 Billboard Music Trends (Shiny App)
一个交互式仪表板,分析 Billboard Top 100 数据,包含歌曲排名、艺术家表现以及专辑封面等内容。
🌐 点击启动应用

📈 葡萄牙学生成绩分析 (SAS)
总结: 通过聚类分析和回归线揭示学生成绩、出勤率和人口统计特征之间的模式关系。

🇺🇸 2016美国总统大选聚类分析 (Python)
轮廓分数图(Silhouette Plot)(12个聚类)

最优聚类数:基于轮廓系数

t-SNE 聚类可视化

肘部法则 (Elbow Method)

候选人得票率相关性热图

候选人得票率散点图

🧬 肾癌表达可视化分析
本项目通过火山图、通路富集分析、蛋白质相互作用网络和密度分布图等方法,比较正常肾组织与肿瘤肾组织的基因表达差异,从而识别重要的生物学差异。
🌋 差异表达火山图

📊 表达密度分布图

🎯 KEGG 通路富集分析图

🔗 蛋白质相互作用网络图

📈 富集分数 (NES) 与显著性关系图

使用工具与技术
- R 语言:使用了
ggplot2、shiny、dplyr、tidyr、DT、httr和jsonlite等包进行数据清洗、可视化与交互式开发 - Python:应用了
matplotlib、seaborn、scikit-learn、pandas、numpy进行可视化与建模 - SAS:用于聚类分析及教育类数据建模
- Tableau:用于构建交互式仪表盘和数据可视化故事展示
