HOMER 的定义

HOMER(Hypergeometric Optimization of Motif EnRichment)是一个用于调控元件发现的开源软件,可以用于发现非编码 RNA(ncRNA),转录因子(TF)结合位点,以及基因组结构变化的区域。它的基本思想是,可以使用单个样本或多个样本,将基因组上的特定区域与有利的调控元件进行比较,以发现结合位点,而不需要构建任何预先的模型。

HOMER peak calling 的步骤

1. 获取样本数据:使用 HOMER 进行 peak calling 需要获取样本数据,包括染色质免疫沉淀(ChIP-seq)数据和 RNA-seq 数据。

2. 数据处理:处理获取的样本数据,去除低质量的序列,将序列比对到参考基因组中,并且计算每个位点的 reads 覆盖度(coverage)。

3. peak calling:使用 HOMER 中的 findPeaks 工具进行 peak calling,它可以比较两组样本的 reads 覆盖度,并发现具有显著差异的位点。

4. 后处理:对 peak calling 结果进行进一步的处理,比如去除重复的位点,计算每个 peak 的大小等。