<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>ChIP-Seq on The Cat Way</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/index.html</link><description>Recent content in ChIP-Seq on The Cat Way</description><generator>Hugo -- gohugo.io</generator><language>ja</language><copyright>© 2026 dritoshi</copyright><atom:link href="https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/atom.xml" rel="self" type="application/rss+xml"/><item><title>2つのTF ChIP-seq の共通結合領域を探す</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/twochipseq.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/twochipseq.html</guid><description>&lt;p&gt;異なる2つの転写因子の結合領域がどのぐらい重なっているかを検討することで、
転写因子の同じ場所で協調、あるいは競合して働いているかどうかを知ることができる。
そこで2つの ChIP-seq 解析から得られたピークの重なりを探索する方法について述べる。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; library(“ChIPpeakAnno”)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.df &amp;lt;- read.table(&amp;#34;results/macs2/Oct4_peaks.bed&amp;#34;, header=F)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; sox2.df &amp;lt;- read.table(&amp;#34;results/macs2/Sox2_peaks.bed&amp;#34;, header=F)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.gr &amp;lt;- BED2RangedData(oct4.df, header=FALSE)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; sox2.gr &amp;lt;- BED2RangedData(sox2.df, header=FALSE)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.sox2.overlap &amp;lt;- findOverlappingPeaks(oct4.gr, sox2.gr)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;まずファイルからbed fileを入力し、そのデータフレームを BED2RangedData で RangedData というデータ構造に変換する。findOverlappingPeaks は2つのRangedData の共通した行を探す関数である。&lt;/p&gt;

&lt;h3 class="relative group"&gt;2つのTF ChIP-seq の共通結合領域をカウントしベン図を描く
 &lt;div id="2つのtf-chip-seq-の共通結合領域をカウントしベン図を描く" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#2%e3%81%a4%e3%81%aetf-chip-seq-%e3%81%ae%e5%85%b1%e9%80%9a%e7%b5%90%e5%90%88%e9%a0%98%e5%9f%9f%e3%82%92%e3%82%ab%e3%82%a6%e3%83%b3%e3%83%88%e3%81%97%e3%83%99%e3%83%b3%e5%9b%b3%e3%82%92%e6%8f%8f%e3%81%8f" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; library(“ChIPpeakAnno”)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.df &amp;lt;- read.table(&amp;#34;results/macs2/Oct4_peaks.bed&amp;#34;, header=F)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; sox2.df &amp;lt;- read.table(&amp;#34;results/macs2/Sox2_peaks.bed&amp;#34;, header=F)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.gr &amp;lt;- BED2RangedData(oct4.df, header=FALSE)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; sox2.gr &amp;lt;- BED2RangedData(sox2.df, header=FALSE)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; makeVennDiagram(RangedDataList(oct4.gr, sox2.gr), NameOfPeaks=c(&amp;#34;Oct4&amp;#34;, &amp;#34;Sox2&amp;#34;), totalTest=3000)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;</description></item><item><title>BowtieでChIP-seq のデータをリファレンスゲノムにマッピングする</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/bowtie_chipseq.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/bowtie_chipseq.html</guid><description>&lt;p&gt;RNA-Seq と同じ。インデックスファイルを対象のゲノムに置き換えること。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a href="https://catway-jp.pages.dev/bioinformatics/RNA-Seq/bowtie2_transcript.html" &gt;Bowtie2でRNA-seqデータをトランスクリプトームへマッピングする&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;</description></item><item><title>deeptools</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/deeptools.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/deeptools.html</guid><description>&lt;p&gt;&lt;a href="https://catway-jp.pages.dev/bioinformatics/etc/scipy.html" &gt;SciPy&lt;/a&gt;, &lt;a href="https://catway-jp.pages.dev/bioinformatics/etc/matplotlib.html" &gt;matplotlib&lt;/a&gt; をそれぞれセットアップをしておく。&lt;/p&gt;

&lt;h3 class="relative group"&gt;インストール
 &lt;div id="インストール" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%82%a4%e3%83%b3%e3%82%b9%e3%83%88%e3%83%bc%e3%83%ab" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;pip install deeptools --user&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;~/.local/bin 以下にある。&lt;/p&gt;</description></item><item><title>MACS2を利用してChIP-Seqのピークを探す</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/macs2.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/macs2.html</guid><description>&lt;p&gt;MACS2、はおそらくもっとも良く使われている peak caller である MACS のベータバージョンである。&lt;/p&gt;
&lt;p&gt;インストール:
Python 2.6 以上、Cython 0.14.1以上, numpy が必要。&lt;/p&gt;
&lt;p&gt;numpy のインストール:&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ wget &amp;#34;http://downloads.sourceforge.net/project/numpy/NumPy/1.6.1/numpy-1.6.1.tar.gz&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ tar zxvf numpy-1.6.1.tar.gz 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ cd numpy-1.6.1
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ python setup.py build --fcompiler=gnu
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ sudo python setup.py install&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;MACS2のインストール:&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ w3m http://github.com/downloads/taoliu/MACS/MACS-2.0.9-1.tar.gz
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ tar zxvf MACS-2.0.9.tar.gz
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ cd MACS-2.0.9/
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ sudo python setup.py install --prefix=/opt
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ export PYTHONPATH=/opt/lib/python2.6/site-packages/:$PYTHONPATH&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;実行例:&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ macs2 callpeak -t results/bowtie/Sox2/Sox2.bowtie.sort.rmRepeat.bam -c results/bowtie/GFP/GFP.bowtie.sort.rmRepeat.bam -f BAM -g mm -n Sox2 -B -q 0.01 --shiftsize 100&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;-t はターゲットとするTFの bam ファイル、-c はネガティブコントロールとなるサンプルの bam ファイル、-f は入力ファイルの形式を指定、-g はゲノムサイズを指定、-n は任意の実験名、-q は q-value の閾値を指定する。-B は extended fragment pileup, local lambda and score tracks を graphBed file に保存するオプションである。-g のゲノムサイズ指定には数値による指定と生物名を指定することができ、ヒトゲノムは、hs, マウスゲノムは mm, 線虫ゲノムが ce, ハエゲノムが、dm である。&lt;/p&gt;</description></item><item><title>Peakを近傍に持つ遺伝子によく観察されるGene Ontolgyを挙げる</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/chipgo.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/chipgo.html</guid><description>&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; library(“ChIPpeakAnno”)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; library(org.Mm.eg.db)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.df &amp;lt;- read.table(&amp;#34;results/macs2/Oct4_peaks.bed&amp;#34;, header=F)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; sox2.df &amp;lt;- read.table(&amp;#34;results/macs2/Sox2_peaks.bed&amp;#34;, header=F)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.gr &amp;lt;- BED2RangedData(oct4.df, header=FALSE)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; sox2.gr &amp;lt;- BED2RangedData(sox2.df, header=FALSE)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.go &amp;lt;- getEnrichedGO(oct4.anno, orgAnn=&amp;#34;org.Mm.eg.db&amp;#34;, maxP=0.01, multiAdj=TRUE, minGOterm=10, multiAdjMethod=&amp;#34;BH&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.bp.goterm &amp;lt;- unique(oct4.go$bp[order(oct4.go$bp[,10]),c(2,10)])
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.bp.goterm[1:10,]&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;getEnrichedGo の引数 multiAdjMethod で指定できる多重検定補正の手法は以下の通りである。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Bonferroni: Bonferroni single-step adjusted p-values for strong control of the FWER.&lt;/li&gt;
&lt;li&gt;Holm: Holm (1979) step-down adjusted p-values for strong control of the FWER.&lt;/li&gt;
&lt;li&gt;Hochberg: Hochberg (1988) step-up adjusted p-values for strong control of the FWER (for raw (unadjusted) p-values satisfying the Simes inequality).&lt;/li&gt;
&lt;li&gt;SidakSS: Sidak single-step adjusted p-values for strong control of the FWER (for positive orthant dependent test statistics).&lt;/li&gt;
&lt;li&gt;SidakSD: Sidak step-down adjusted p-values for strong control of the FWER (for positive orthant dependent test statistics).&lt;/li&gt;
&lt;li&gt;BH: adjusted p-values for the Benjamini &amp;amp; Hochberg (1995) step-up FDR controlling procedure (independent and positive regression dependent test statistics).&lt;/li&gt;
&lt;li&gt;BY: adjusted p-values for the Benjamini &amp;amp; Yekutieli (2001) step-up FDR controlling procedure (general dependency structures)&lt;/li&gt;
&lt;/ul&gt;</description></item><item><title>Position weight matrix から Sequence Logo を描く</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/seqlog.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/seqlog.html</guid><description>&lt;p&gt;ピーク内もモチーフを発見した後にそのモチーフ配列とその position weight matrix (PWM)が出力される。PWMは”Sequence Logo”という可視化方法によってモチーフ配列を表示するのが一般的である。ここでは「ピーク内に頻出するDNAモチーフ配列を発見する」の PWMを利用する。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; library(“seqLogo”)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; pdf(“oct4.motif01.pdf”)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; seqLog(oct4.motif.pwms[[1]])
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; dev.off()&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;</description></item><item><title>Position weight matrix を既知モチーフデータベースに対して検索する</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/motifsearch.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/motifsearch.html</guid><description>&lt;p&gt;予測した PWM が既知のモチーフに一致するかを検索する。これによって新規モチーフなのか、既知のモチーフかを分けることができる。またPWMや sequence logo をみていても、それが既知のタンパク質結合サイトかどうかを判断することは難しいため、既知のデータベースと比較するのがよい。ここではデータベースとの比較、比較結果の出力について述べる。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; library(&amp;#34;MotIV&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; path &amp;lt;- system.file(package=&amp;#34;MotIV&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; jaspar &amp;lt;- readPWMfile(paste(path,&amp;#34;/extdata/jaspar2010.txt&amp;#34;,sep=&amp;#34;&amp;#34;))
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; jaspar.scores &amp;lt;- readDBScores(paste(path,&amp;#34;/extdata/jaspar2010_PCC_SWU.scores&amp;#34;,sep=&amp;#34;&amp;#34;))
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.jaspar &amp;lt;- motifMatch(inputPWM = oct4.motif.pwms, align = &amp;#34;SWU&amp;#34;, cc = &amp;#34;PCC&amp;#34;, database = jaspar, DBscores = jaspar.scores, top=5)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; Ungapped Alignment
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; Scores read
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; Database read
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; Motif matches : 5
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; summary(oct4.jaspar)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; Number of input motifs : 4 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; Input motifs names : m1 m2 m3 m4 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; Number of matches per motif: 5 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; Matches repartition : 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; SP1 EWSR1-FLI1 SPI1 SPIB INSM1 MZF1_1-4 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; 3 2 2 2 1 1 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;PPARG::RXRA Pax4 Pou5f1 RREB1 SOX10 SOX9 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; 1 1 1 1 1 1 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; Sox2 Sox5 Tal1::Gata1 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; 1 1 1 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; Arguments used : 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; -metric name : PCC 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; -alignment : SWU 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; pdf(&amp;#34;results/oct4.motif.logo.pdf&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; plot(oct4.jaspar, ncol = 2, top = 5, rev = FALSE, main = &amp;#34;Logo&amp;#34;, bysim = TRUE)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; dev.off()&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;</description></item><item><title>summit からのモチーフまでの距離分布を描く</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/summitdist.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/summitdist.html</guid><description>&lt;p&gt;summit からモチーフまでの距離を計算し、そのヒストグラムを描く。もしChIPに関係のないモチーフ配列の場合、その分布は一様分布になるはずである。しかし、実際に結合に関与しているモチーフ配列ならばその分布はsubmitにその平均値を持つ正規分布になると考えあれる。ここではMACS2の summit のデータからこのモチーフ分布を描く。以下のコードでは、Peak を上流下流に延長した場合のことは考慮されていないことに注意。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## Load summit data
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;oct4.sm.df &amp;lt;- read.table(&amp;#34;results/macs2/Oct4_summits.bed&amp;#34;, header=F)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sox2.sm.df &amp;lt;- read.table(&amp;#34;results/macs2/Sox2_summits.bed&amp;#34;, header=F)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;oct4.sm.gr &amp;lt;- BED2RangedData(oct4.sm.df, header=FALSE)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sox2.sm.gr &amp;lt;- BED2RangedData(sox2.sm.df, header=FALSE)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## calc. distance between motif event and summit
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;num.peaks &amp;lt;- length(oct4.motif.search.fwd)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;oct4.motif.summit.dist &amp;lt;- rep(0, num.peaks)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;summit.on.peak &amp;lt;- start(oct4.sm.gr) - start(oct4.gr)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;num.peaks &amp;lt;- length(oct4.motif.search.fwd)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;num &amp;lt;- 0
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;oct4.motif.summit.dist &amp;lt;- 0
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;for (peak in 1:num.peaks) {
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; if (! identical(start(oct4.motif.search.fwd[[peak]]), integer(0))) {
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; dists &amp;lt;- start(oct4.motif.search.fwd[[peak]]) - summit.on.peak[peak]
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; if (length(dists) == 1) {
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; num &amp;lt;- num + 1
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; oct4.motif.summit.dist[num] &amp;lt;- dists
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; } else if (length(dists) &amp;gt; 1) {
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; for(i in 1:length(dists)) {
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; num &amp;lt;- num + 1
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; oct4.motif.summit.dist[num] &amp;lt;- dists[i]
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; }
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; }
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; } 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;}
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;pdf(&amp;#34;results/oct4.motifdist.pdf&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;plot(density(oct4.motif.summit.dist), main=&amp;#34;Motif distribution (m1)&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;dev.off()&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;</description></item><item><title>ピーク内に頻出するDNAモチーフ配列を発見する</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/chipmotif.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/chipmotif.html</guid><description>&lt;p&gt;タンパク質がDNAに結合するときには、ある特定のDNA配列に結合することが知られている。ChIP-seq のピーク内には、ほとんどの場合、DNAとタンパク質が結合しているはずである。その領域のなかに、ほかの領域では見られないような、特徴的なDNA配列が発見できれば、それがDNA結合配列の候補となる。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; library(“rGADEM”)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; library(&amp;#34;BSgenome.Mmusculus.UCSC.mm9&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.seqs &amp;lt;- read.DNAStringSet(“results/oct4.peaksWithSeqs.fa”, &amp;#34;fasta&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.motif &amp;lt;- GADEM(oct4.seqs, verbose=1, genome=Mmulculs)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; nMotifs(oct4.motif)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;[1] 4
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; consensus(oct4.motif)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;[1] &amp;#34;ywTTswnATGCAAAT&amp;#34; &amp;#34;nyyyyyyyyCwsyyn&amp;#34; &amp;#34;sCwGswGrnrG&amp;#34; &amp;#34;sCCCCrCCCCm&amp;#34; 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.motif.pwms &amp;lt;- getPWM(oct4.motif)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.motif.pwms[[1]]&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;</description></item><item><title>ピーク内のゲノム配列をFASTA形式で得る</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/peakseq.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/peakseq.html</guid><description>&lt;p&gt;ピーク内のDNA配列を得ることができれば、ChIP-qPCRのような確認実験用の PCR primer を設計したり、配列に頻出するDNA motifを計算機で発見することに利用できる。ここでは、ChIPpeakAnno を利用した方法を述べる。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; library(“ChIPpeakAnno”)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; library(&amp;#34;BSgenome.Mmusculus.UCSC.mm9&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.peaksWithSeqs &amp;lt;- getAllPeakSequence(oct4.gr, upstream = 20, downstream = 20, genome = Mmusculus)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; write2FASTA(oct4.peaksWithSeqs, file=&amp;#34;resutls/oct4.peaksWithSeqs.fa&amp;#34;)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;ローカルディレクトリに oct4.peaksWithSeqs.fa が保存されている。&lt;/p&gt;</description></item><item><title>ピーク内の配列のなかから既知のDNAモチーフ配列を発見する</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/pwmsearch.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/pwmsearch.html</guid><description>&lt;p&gt;発見されたモチーフ配列をDNA配列に対して検索する方法を述べる。これを行うモチベーションはいくつか考えられるが、主な理由は、発見したモチーフがどのピークに含まれているか、いくつ含まれているかを知る、ということである。これによって、発見したモチーフ配列とピーク/遺伝子との関係を理解することができる。この方法は、既知のモチーフ配列を収集したデータベースの PWM をゲノム配列に検索する方法と全く同じである。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; hit.fwd &amp;lt;- matchPWM(oct4.motif.pwms$m1, oct4.seqs[[4]])
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; hit.rev &amp;lt;- matchPWM(reverseComplement(oct4.motif.pwms$m1), oct4.seqs[[4]])
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## スコアを計算する
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; PWMscoreStartingAt(oct4.motif.pwms$m1, subject(hit.fwd), start(hit.fwd))
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; PWMscoreStartingAt(oct4.motif.pwms$m1, subject(hit.rev), start(hit.rev))&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;matchPWM はフォワード鎖のみ検索することに注意。配列を reverseComplement() で逆相補鎖に変換する必要がある。hit.rev はヒットがないので、PWMscoreStartingAt() の戻り値は numeric(0) になる。&lt;/p&gt;
&lt;p&gt;複数のピーク内DNA配列に対して、まとめて検索するには以下のようにする&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;oct4.motif.search.fwd &amp;lt;- lapply( 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; oct4.seqs, 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; function(x) { 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; matchPWM(oct4.motif.pwms$m1, x) 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; } 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;) 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;oct4.motif.search.fwd.score &amp;lt;- lapply(
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; oct4.motif.search.fwd,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; function(hits) {
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; PWMscoreStartingAt(
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; oct4.motif.pwms$m1,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; subject(hits),
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; start(hits)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; )
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; }
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;</description></item><item><title>モチーフ間距離分布を描く</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/motifdist.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/motifdist.html</guid><description>&lt;p&gt;2つのDNAモチーフ間の距離の分布をプロットする。この距離が近い場合、分布が単峰性になる。ここから2つの転写因子がヘテロダイマーなどのように近くで働いているという分子メカニムズが想像できる。距離が離れている場合は二峰性の分布になる。これは、一次配列としての距離は遠くとも、ゲノムDNAが折り曲がることにより、クロマチン構造上、近くに存在する場合や、ほかのコファクターとなるタンパク質を介して、タンパク質間相互作用がある場合などがが考えられる。&lt;/p&gt;
&lt;p&gt;まず2つの転写因子の結合サイトを計算する。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;library(&amp;#34;ChIPpeakAnno&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;library(&amp;#34;MotIV&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;load(&amp;#34;results/3rd/03motifdbSearch.rdat&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;oct4.sox2.overlappingPeaks.seq &amp;lt;- read.DNAStringSet(&amp;#34;results/3rd/oct4.sox2.overlappingPeaksWithSeqs.fa&amp;#34;, &amp;#34;fasta&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;oct4.motif.pwms &amp;lt;- getPWM(oct4.motif)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;oct4.motif.search.fwd &amp;lt;- lapply(
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; oct4.sox2.overlappingPeaks.seq,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; function(x) {
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; matchPWM(oct4.motif.pwms$m1, x)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; }
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;oct4.motif.search.rev &amp;lt;- lapply(
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; oct4.sox2.overlappingPeaks.seq,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; function(x) {
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; matchPWM(reverseComplement(oct4.motif.pwms$m1), x)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; }
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sox2.motif.pwms &amp;lt;- getPWM(sox2.motif)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sox2.motif.search.fwd &amp;lt;- lapply(
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; oct4.sox2.overlappingPeaks.seq,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; function(x) {
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; matchPWM(sox2.motif.pwms$m1, x)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; }
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sox2.motif.search.rev &amp;lt;- lapply(
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; oct4.sox2.overlappingPeaks.seq,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; function(x) {
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; matchPWM(reverseComplement(sox2.motif.pwms$m1), x)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; }
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;save(list = ls(), file = &amp;#34;results/3rd/04motifsearchInOverlappingPeakseq.rdat&amp;#34;)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;この2つの転写因子の距離の関係をプロットする。&lt;/p&gt;</description></item><item><title>既知のモチーフ配列/PWMのデータを得る: JASPAR</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/pwm_jaspar.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/pwm_jaspar.html</guid><description>&lt;p&gt;既知のモチーフ配列/PWMを整理したデータベースJASPARの情報は、rGADEM に付属している。以下の例では、名前に Pou5f1 (Oct3/4) の文字列が含まれている PWM を検索し取り出している。&lt;/p&gt;
&lt;blockquote&gt;&lt;p&gt;jaspar.path &amp;lt;- system.file(&amp;ldquo;extdata/jaspar2009.txt&amp;rdquo;,package=&amp;ldquo;rGADEM&amp;rdquo;)
seeded.pwm &amp;lt;- readPWMfile(jaspar.path)
oct4.jaspar.id &amp;lt;- grep(&amp;ldquo;Pou5f1&amp;rdquo;, names(seeded. pwd)&lt;/p&gt;
&lt;/blockquote&gt;&lt;p&gt;これを配列に対して検索するには「ピーク内の配列のなかから既知のDNAモチーフ配列を発見する」を参照せよ。&lt;/p&gt;</description></item><item><title>結合サイトの予測 GPS</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/gps.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/gps.html</guid><description>&lt;p&gt;GPS (Genome Positioning System) はChIP-seqのデータからタンパク質-DNA結合サイトを1塩基解像度で予測するプログラムである。シーケンスリードの分布を混合確率分布と考えて、分布のパラメータ予測を行うことで、結合サイトの位置を予測する。バックグラウンドには実験データのほか、ポアソン分布を仮定したローカルなバックグラウンドを利用した予測も可能である。&lt;/p&gt;
&lt;p&gt;使い方&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ java -Xmx80G -jar gps.jar --d Read_Distribution_default.txt 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; --s 240000000
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; --exptCTCF-GM12878 GM12878_chr1_ip.bed
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; --exptCTCF-HUVEC HUVEC_chr1_ip.bed
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; --ctrlCTCF-GM12878 GM12878_chr1_ctrl.bed
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; --ctrlCTCF-HUVEC HUVEC_chr1_ctrl.bed
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; --f BED --g hg18_chr1.info --out HumanCTCF &lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;-Xmx でメモリを指定する。mulit-condition mode では大量のメモリと計算時間を必要とする。&amp;ndash;d には初期条件に利用する read distribution を指定する。read distribution は予測された結合サイト周辺に存在するシーケンスリードの分布に関するデータが含まれている。&amp;ndash;s にはマッピングされるリファレンスゲノム領域のサイズを指定する。大抵はゲノムサイズ * 0.8 を指定する。&amp;mdash;exptXXX, &amp;ndash;ctrlXXX でそれぞれ実験データ、コントロールデータ (例えば IgGやKO, input genome のデータなど)を指定する。&amp;ndash;f は入力ファイル形式を指定し、&amp;ndash;out には出力ファイル名を指定する。&lt;/p&gt;
&lt;p&gt;Guo Y, Papachristoudis G, Altshuler RC, Gerber GK, Jaakkola TS, Gifford DK, Mahony S. Discovering homotypic binding events at high spatial resolution. Bioinformatics. 2010 Dec 15;26(24):3028-34. Epub 2010 Oct 21. PubMed PMID: 20966006; PubMed Central PMCID: PMC2995123.&lt;/p&gt;</description></item></channel></rss>