科百科
当前位置: 首页 科技资讯

如何创建带平滑线的散点图(图形解读系列散点图也不简单)

时间:2023-05-31 作者: 小编 阅读量: 1 栏目名: 科技资讯

散点图研究的是两个数值型变量之间的关系,凡是想展示分布状态的都可以使用散点图。Y轴显示的是与表型性状的关联检验的p值。这个散点图的每一列是一个基因,每一行是一个细胞簇,不同颜色表示基因在对应细胞簇的平均表达量。而且相比于热图来讲,这个散点图中点的大小表示对应细胞簇中表达有对应基因的细胞所占的比例,这为结果解读提供了另一维度的信息。其展示优势是体现出检测的样本量。

识图:先理解每个点是什么(点代表基因、样品、通路或其它的,这个认识可以来自于常识,来自于自己对数据的认识,或来自于文章作者的描述),然后看横轴代表什么纵轴代表什么,再看图例中展示的其他信息如颜色、大小和形状分别代表什么。这些都理顺了,图理解就不难了。

来源:https://www.r-graph-gallery.com/272-basic-scatterplot-with-ggplot2.html

这是个一般的散点图,展示的是X轴变量Sepal.Length和Y轴变量Sepal.Width,展示的是花萼的长度和宽度的关系。

散点图研究的是两个数值型变量之间的关系,凡是想展示分布状态的都可以使用散点图。它在生物信息分析中有应用广泛,且基于多样的“面貌”,散点图的具体使用形式是根据所需要展现的“故事”来绘制。常见的有:

  • 差异基因火山图(Volcano plot | 别再问我这为什么是火山图):
  • 在一般散点图的基础上,根据P value/Q value和log(FC)值给点着色,用以标注需要关注的显著差异点。
  • 功能富集分析泡泡图(R语言 -富集分析泡泡图):
  • 一般X轴是对应通路差异基因占通路总基因的比例-Gene ratio(常用的是Odds Ratio),Y轴是富集的通路-Terms/Pathways,颜色变化表述富集显著性程度-Q value,点大小值表示为对应通路差异基因数目-conut(这些对应关系可能会根据需求调整)。
  • 相关性分析散点图
  • 在一般散点图的基础上添加数据趋势线。
  • 抖动图(jitter plot):
  • 一个轴为离散变量,一个轴为数值型变量时,为了避免点之间因数值相同而覆盖,故在离散轴做一些便宜,不改变数值轴,一般结合箱线图展示。
  • 曼哈顿图
  • 曼哈顿图是基因组学中使用的一种特殊类型的散点图。
  • X轴显示基因组上的基因变异体的位置。
  • 不同的颜色表示不同的样本。
  • Y轴显示的是与表型性状的关联检验的p值。
  • 当然也可以用来展示差异基因或差异OTU,如下面的例子。
  • PCA样品分类图(一文看懂PCA主成分分析)
具体使用基因表达散点图

>

  • 原文描述:
  • Dot plot visualization of each cell type in lung single-cell data. The size of the dot encodes the percentage of cells within a cell type, and the color encodes the average expression level
  • 来源文章链接:
  • https://www.cell.com/cell/pdf/S0092-8674(18)30116-8.pdf

Dot plot是单细胞中常用来展示不同细胞簇中代表性基因表达的一个图。

这个散点图来源于一篇cell文章-Mapping the Mouse Cell Atlas by Microwell-Seq。作者分析成年鼠肺组织单细胞数据聚类得到了32个细胞簇(Y轴)。这个散点图的每一列是一个基因,每一行是一个细胞簇,不同颜色表示基因在对应细胞簇的平均表达量。而且相比于热图来讲,这个散点图中点的大小表示对应细胞簇中表达有对应基因的细胞所占的比例,这为结果解读提供了另一维度的信息。

肿瘤大小散点图

>

  • 原文描述:
  • Tumour volume for individual animals(dots) on the day of euthanasia in the conditions indicated. Data are mean±s.d.
  • 来源文章链接:
  • https://www.nature.com/articles/nature23270

在上图中,Y轴是肿瘤体积大小,X轴有样本基因型分组信息(TCRα和WT)和样本接受的处理信息(GVAX和anti-PD1有无),每个点都是一个样本。*表示组与组之间Student’s t-tests的P值(** P<0.01; *** P<0.001; **** P<0.0001)。其展示优势是体现出检测的样本量。

当检测样本数且样本点趋势一致的时候,可以排布出悦人的性状和展示更高的可信度。此图在简单的散点图还添加了箱线图中的上四分位数、中位数和下四分位数,用以从统计角度地展示肿瘤大小分布情况(可视化之为什么要使用箱线图?)。

自对照样品或样品两两相比散点图展示

>

  • 原文描述:
  • Scatterplot of log2FC of genes from Reactome G1 pathway in each Library 1 screen. Each pairwise comparison is indicated by color. Pearson’s productmoment correlation coefficient is indicated (r).
  • 来源文章链接:
  • https://pubmed.ncbi.nlm.nih.gov/29576454/

这个图展示某个通路上的基因在不同样本表达的相对高低和样品内表达的一致性。纵坐标和横坐标都是样本间差异基因比较得到的log(FC)值。这在整合多套数据时可以根据趋势的共性信息互相印证。

Jitter-plot展示差异基因分布

>

  • 原文描述:
  • Log2 fold relative RNA probe distribution showing differential gene expression from bone marrow-derived macrophages (BMDMs) treated in vitro with mock or AzaITF-2357. Angiogenic pathwayassociated genes are highlighted (microarray, BMDM data representative of n = 3 mice)
  • 来源文章链接:
  • https://www.sciencedirect.com/science/article/pii/S0092867417312448

上图的抖动图jitter plot有着尽量多的二维信息,每个点是一个基因,类似于火山图的一维展示形式,横坐标是log2(FC),这意味着越往两侧的点,log2(FC)也就越小或者越大,即基因变化倍数越大,同时也可以用颜色标注出几个比较关注的基因,避免直接在图上标记名字而出现标签重叠的现象。

样本突变数目分布

>

  • 图片描述:
  • Two panels show mutation load for each sample in the dataset for SNVs。
  • Each dot of the sorted scatterplots shows the total number of mutations pre- and post-filtering per sample. Total mutation counts are separated by total number SNVs per samples. Lighter colors indicate pre-filtered mutations from the controlled-access MAF, and deeper colors indicate post-filtered (PASS only) mutations from the open-access MAF. Cancers are ordered by the median number of post-filtered SNVs per tissue. Furthermore, samples are sorted by increasing number of total mutation count for SNV plot.Samples removed during post-filtering are also shown, i.e., LAML and OV in lighter colors without an accompanying pair and are sorted accordingly. The total number of samples for each cancer type is displayed under each cancer label. Finally, the y axis limits were placed from 0 to 50,000 for clarity. This resulted in the removal of 14 hypermutator samples from SNV plot.
  • 来源文章链接:https://www.sciencedirect.com/science/article/pii/S2405471218300966
  • 这是另一种散点图,是用来展示样本过滤前后的突变数目。
  • 每种癌症所有样品按过滤后的突变数(深蓝点)的中位数排序,浅蓝点表示未过滤的突变数。
  • 图形的亮点再与排序,排序后点就不再是一堆散乱的点,而是一条有序的线,结果展示更清晰
曼哈顿图

曼哈顿图在用于差异基因时表达的意思与火山图类似,但信息更多了一些。此图中每个点代表1个OTU,颜色表示OTU所属的物种分类信息,形状表示其是否显著上下调,大小代表OTU的平均丰度。

绘图推荐教程
  • R语言 - 箱线图(小提琴图、抖动图、区域散点图)
  • R语言 - 散点图绘制
  • 解决散点图样品标签重叠ggrepel
  • 水稻微生物组时间序列分析
  • 水稻微生物组时间序列分析 1模式图与PCoA 2a相关分析 2b散点图拟合 3冲击图 4随机森林回归
无需代码即刻绘制Reference
  • https://www.data-to-viz.com/graph/scatter.html
  • https://www.r-graph-gallery.com/scatterplot.html
  • https://www.data-to-viz.com/graph/connectedscatter.html
,
    推荐阅读
  • 卡卡退役后还会看足球吗(卡卡随基普乔格跑完柏林全马)

    在9月25日进行的2022柏林马拉松赛上,37岁的肯尼亚名将基普乔格以2小时1分9秒的成绩夺冠,并创造了全新的世界纪录。后半程,卡卡的速度有所下降,但最终以3小时38分06秒完赛的成绩,在业余马拉松选手中还是算相当不错的。而且,这次卡卡参加柏林马拉松也有为父亲打气、鼓劲的原因。2016年镇江马拉松,李铁又以1小时45分的成绩完成半马比赛。

  • 学校预防新冠肺炎防控知识(复课防控小知识)

    对其它地区返校师生要做好体温监测及症状筛查。高校应设置集中隔离医学观察区,对来自或经停湖北以及疫情高发地区的师生和被判定为密切接触者进行集中医学观察。要配合辖区疾病预防控制中心做好疑似或确诊病例的流行病学调查、密切接触者排查。在辖区疾病预防控制中心和中小学卫生保健科的工作人员指导下进行消毒。所使用消毒剂应在有效期内。

  • 按部就班造句(按部就班造句一年级)

    7、即使是您认为应该按部就班,直截了当的技术决策,也会有政治参杂其中,特别是您处于决定是否批准购买某企业工具的职位。

  • 15分钟快速退烧(我娃快速退烧)

    我娃快速退烧昨天晚上10点半才回家,刚回到家里,老人家就说,娃发烧了,我赶紧到房里看娃,发现他还在被窝里打冷战急忙用手探他额头,哇!挺烫的,问他哪里不舒服?头疼头晕发热发冷������,用探热针测出来事38.9℃。

  • 产后怎么缩阴效果好

    运动法阴道本身有一定的修复功能,产后出现的扩张现象在产后3个月即可恢复。产后妈妈可以通过一些锻炼来加强弹性的恢复,促进阴道紧实。练习骨盆运动女人半蹲,两膝微屈,两足分开60厘米左右,两手叉腰。吸气,将骨盆前推;呼气,将骨盆拉回,同时臀部尽量向后撅起。练习展腿运动女人运动躯干、大腿时,腹压作用于阴道,产生快感,同时阴道口开张,利于局部气血通畅。女人坐姿,两手后撑,左腿屈立,右腿屈膝外展,平放垫上。

  • 手机新浪微博怎么取消关注(手机新浪微博如何取消关注)

    以下内容希望对你有帮助!手机新浪微博怎么取消关注打开新浪微博手机客户端,点击页面底部“我”菜单,在展开的页面中,点击“关注”选项。打开微博账号当前关注的用户之后,点击“关注的人”菜单按钮。接下来,可以看到当前已经关注的用户,想要取消关注的话,点击“已关注”按钮,在弹出的对话框中,点击“确定”按钮即可。

  • 广州人口(广州的介绍)

    广州人口广州人口数量:1530.59万人。广州是首批国家历史文化名城,广府文化的发祥地,从秦朝开始一直是郡治、州治、府治的所在地,华南地区的政治、军事、经济、文化和科教中心。广州被全球权威机构GaWC评为世界一线城市,每年举办的中国进出口商品交易会吸引了大量客商以及大量外资企业、世界500强企业的投资,国家高新技术企业达8700多家,总量居全国前三,集结了全省80%的高校、70%的科技人员,在校大学生总量居全国第一。

  • 夏天的租房市场(北京租房夏理银)

    2012年2月,女儿参加“国考”被录取到了国家机关。7月,接通知到单位报到上班。也就是说,租户与房东并无直接联系。我们签订的租期为一年,中介先收一个月的房租即3600元为中介费,另外还要一次性地交付“押二付三”的费用。所谓“押二付三”,就是将两个月的房租作为押金,另预付三个月的房租。如果合同到期双方无什么纠纷时则押金退回。合同签订后我们和中介按合同上的内容对室内设施进行查看清点,完毕后中介将钥匙交付我们。

  • 麻酱秋葵的做法凉拌(简单版凉拌(麻酱秋葵的做法)

    以下内容大家不妨参考一二希望能帮到您!麻酱秋葵的做法凉拌原料:秋葵、橄榄油、盐、芝麻酱、大蒜。秋葵洗干净入煮锅焯水后捞出沥干水。大蒜碎放入碗中加盐。加橄榄油搅拌均匀成芝麻酱汁。秋葵放入盘中,添加芝麻酱汁,稍加搅拌即可享用。

  • 稍的拼音和组词(稍的拼音和组词是怎样的)

    稍的拼音和组词稍的拼音和组词:稍许、稍微、稍纵即逝、稍稍、稍麦、脱稍、手稍、稍地、花稍、枝稍、稍伯、秩稍、稍芟、稍房、稍子、稍麻寺、稍属、眼稍、稍杀、稍问、四稍、稍黩筐篚、稍安勿躁、稍倾、上稍、俸稍、稍麄胆壮、稍长胆壮、乡稍、稍迁、拉稍寺、头稍自领、竿稍、稍绿、稍挽稍、稍侵、饩稍、稍天、奉稍、没下稍。稍有shāo和shào两种读音。作shāo时本义为禾末,引申为略微。作shào时〔~息〕军事或体操的口令。