<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>The Cat Way</title><link>https://catway-jp.pages.dev/</link><description>Recent content on The Cat Way</description><generator>Hugo -- gohugo.io</generator><language>ja</language><copyright>© 2026 dritoshi</copyright><lastBuildDate>Mon, 04 Apr 2016 10:50:38 +0900</lastBuildDate><atom:link href="https://catway-jp.pages.dev/atom.xml" rel="self" type="application/rss+xml"/><item><title>2016年3月のAWSのコスト</title><link>https://catway-jp.pages.dev/blog/2016/04/04/cost/</link><pubDate>Mon, 04 Apr 2016 10:50:38 +0900</pubDate><guid>https://catway-jp.pages.dev/blog/2016/04/04/cost/</guid><description>&lt;p&gt;3月分の invoice が届いた。&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;Service&lt;/th&gt;
 &lt;th&gt;$&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;R53&lt;/td&gt;
 &lt;td&gt;0.55&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Data transfer&lt;/td&gt;
 &lt;td&gt;0.11&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;S3&lt;/td&gt;
 &lt;td&gt;0.03&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Total&lt;/td&gt;
 &lt;td&gt;0.69&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;今日のレートで76.90円ぐらい。&lt;/p&gt;</description></item><item><title>2016年2月のAWSのコスト</title><link>https://catway-jp.pages.dev/blog/2016/03/04/cost/</link><pubDate>Fri, 04 Mar 2016 11:00:18 +0900</pubDate><guid>https://catway-jp.pages.dev/blog/2016/03/04/cost/</guid><description>&lt;p&gt;2月分の invoice が届いた。&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;Service&lt;/th&gt;
 &lt;th&gt;$&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;R53&lt;/td&gt;
 &lt;td&gt;0.55&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Data transfer&lt;/td&gt;
 &lt;td&gt;0.19&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;S3&lt;/td&gt;
 &lt;td&gt;0.03&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Total&lt;/td&gt;
 &lt;td&gt;0.77&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;今日のレートで87.54円ぐらい。&lt;/p&gt;</description></item><item><title>サイトの維持コスト</title><link>https://catway-jp.pages.dev/blog/2016/02/04/cost/</link><pubDate>Thu, 04 Feb 2016 18:28:54 +0900</pubDate><guid>https://catway-jp.pages.dev/blog/2016/02/04/cost/</guid><description>&lt;p&gt;このサイトで利用しているAWSから請求がきた。S3, Data transfer でそれぞれ$0.03, R53に$0.55で、合計$0.61だった。今日現在のレートで71円ぐらい。&lt;/p&gt;</description></item><item><title>Bioinformatics Tipsの更新</title><link>https://catway-jp.pages.dev/blog/2016/01/11/bioinformatics-tips/</link><pubDate>Mon, 11 Jan 2016 00:46:59 +0900</pubDate><guid>https://catway-jp.pages.dev/blog/2016/01/11/bioinformatics-tips/</guid><description>&lt;p&gt;GitBookで書いている Bioinformatics Tipsを少し更新した。
なぜかMarkdownがHTMLに変換されなかったが、SUMMERY.mdを更新しないと
HTMLにならず、markdown のままだった。&lt;/p&gt;
&lt;p&gt;あと前回の記事作った Rakefile では、GitBookのHTMLをOctpressのディレクトリに
出力できなくなった。なので、単純に &lt;code&gt;gitbook build&lt;/code&gt;
したあとに、&lt;code&gt;cp -a _book [octopress]/source&lt;/code&gt; にコピーすること
にした。&lt;/p&gt;</description></item><item><title>Bioinformatics Tips</title><link>https://catway-jp.pages.dev/blog/2015/12/31/bioinformatics-tips/</link><pubDate>Thu, 31 Dec 2015 01:42:20 +0900</pubDate><guid>https://catway-jp.pages.dev/blog/2015/12/31/bioinformatics-tips/</guid><description>&lt;p&gt;このサイトを整理しはじめたので、ついでに
gitbookで書いてきたバイオインフォマティクスのTips集を、このサイトに統合した。
並行して進めていた研究のほうの計算結果が期待外れだったので現実逃避。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a href="http://catway.jp/bioinformatics" target="_blank" rel="noreferrer"&gt;バイオインフォマティクスTips&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;これまでは github においていたが、こちらに統合したほうがみやすい。
ただ gitbook で出力したページから Octopress のページのほうにリンクバックできないのが不便かもしれない。&lt;/p&gt;
&lt;p&gt;更新の方法をメモしておく。
まず、いつも通りにgitbookのディレクトリに markdown 形式で tips を書く。
その後、以下のコマンドを実行する。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;rake build&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;実際は、&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;gitbook build ./ [octopressのsourceディレクトリ]&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;を実行すればよいのだが、忘れるのでRakefileにしておいた。
すると、gitbook で静的ページを Octopress のディレクトリに出力する。
あとは Octopress のディレクトリに移動して、&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;rake generate
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;rake deploy&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;とすればS3バケットが更新される。&lt;/p&gt;
&lt;p&gt;gitbookのMacクライアントも改めて試してみるが、日本語環境ではフォントが崩れたりしていまいち。
今後もSublime Text 3で編集することにしよう。&lt;/p&gt;
&lt;p&gt;そうこうしているうちに計算がうまくいっていない理由を調べる方法が思い付いたので明日試してみよう。&lt;/p&gt;</description></item><item><title>restart</title><link>https://catway-jp.pages.dev/blog/2015/12/28/restart/</link><pubDate>Mon, 28 Dec 2015 17:42:43 +0900</pubDate><guid>https://catway-jp.pages.dev/blog/2015/12/28/restart/</guid><description>&lt;p&gt;間違えてVM落して放置していたこのサイトをS3で復活させた。が独自ドメインの振りかたがわからん。
R53使わないと駄目なのか?&lt;/p&gt;
&lt;p&gt;&lt;a href="http://kaede-ngc.hateblo.jp/entry/2014/11/02/001533" target="_blank" rel="noreferrer"&gt;ここ&lt;/a&gt;みながら sublime Text 3 の設定を修正。Package Control を入れ markdown 関連の設定をする。どうやら、Cmd+Shift+pで
Package Controlが起動するようだ。Markmonを入れ、Package Control から Markmon launchすると
ウェブブラウザが起動し、リアルタイムでMarkdownがレンダリングされていく。快適すぎる。&lt;/p&gt;
&lt;p&gt;octopressの更新の仕方を忘れているのでメモ。まず octopress, s3cmdを入れる。&lt;/p&gt;

&lt;h2 class="relative group"&gt;ブログの更新のしかた
 &lt;div id="ブログの更新のしかた" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%83%96%e3%83%ad%e3%82%b0%e3%81%ae%e6%9b%b4%e6%96%b0%e3%81%ae%e3%81%97%e3%81%8b%e3%81%9f" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;rake title[&amp;#39;タイトル&amp;#39;]
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;rake generate
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;rake preview # プレビューを確認したいなら
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;rake deploy&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;

&lt;h2 class="relative group"&gt;ページの追加の方法
 &lt;div id="ページの追加の方法" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%83%9a%e3%83%bc%e3%82%b8%e3%81%ae%e8%bf%bd%e5%8a%a0%e3%81%ae%e6%96%b9%e6%b3%95" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;rake new_page[&amp;#39;dir/title&amp;#39;]&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;以下を編集してメニューバーに入れる。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;source/_includes/custom/navigation.html&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;rake generate
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;rake preview # プレビューを確認したいなら
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;rake deploy&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;</description></item><item><title>Learning sqlite3 for bioinformatics researcher</title><link>https://catway-jp.pages.dev/bioinfo_tips/Learning-sqlite3.html</link><pubDate>Sat, 01 Sep 2012 13:28:00 +0900</pubDate><guid>https://catway-jp.pages.dev/bioinfo_tips/Learning-sqlite3.html</guid><description>&lt;p&gt;SQLite3 はリレーショナルデータベース管理システムのひとつ。サーバクライアントモデルではなく、データベースがファイルになっています。ライセンスがパブリックドメインであることもあり、組み込みDBとしてよく使われます。iPhone の位置情報などのデータを格納しているのも SQLite3 です。ウェブアプリケーションのフレームワークである、Ruby on Rails では標準の組み込みDBとして使われています。また中規模のデータベースならMySQLなどと比較しても遜色ない速度で利用できます。&lt;/p&gt;
&lt;p&gt;バイオ業界でも、マイクロアレイやNGSデータを格納する際によく利用されており、Bioconductor の annotation package に含まれるデータも SQLite3 のデータベースになっています。&lt;/p&gt;

&lt;h3 class="relative group"&gt;インストール
 &lt;div id="インストール" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%82%a4%e3%83%b3%e3%82%b9%e3%83%88%e3%83%bc%e3%83%ab" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;p&gt;Mac OS X には標準でインストールされており、設定なしでターミナルから利用できます。Linuxでもほとんどのディストリビューションでパッケージマネジメントシステムでインストール可能です。Windows は知りません。&lt;/p&gt;

&lt;h3 class="relative group"&gt;使いかた
 &lt;div id="使いかた" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e4%bd%bf%e3%81%84%e3%81%8b%e3%81%9f" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;p&gt;SQLite3 が正常にインストールされていれば、以下のようにして対話型のクライアントを起動することができます。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-sh" data-lang="sh"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sqlite3&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;データベースを作成するには (ここでは expressions.sqlite という名前のデータベースを作成する)&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-sh" data-lang="sh"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sqlite3 expressions.sqlite&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;とする。&lt;/p&gt;
&lt;p&gt;テーブルを作りスキーマを確認する。スキーマとはテーブルの定義のこと。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-sql" data-lang="sql"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sqlite&lt;span style="color:#719e07"&gt;&amp;gt;&lt;/span&gt; &lt;span style="color:#719e07"&gt;create&lt;/span&gt; &lt;span style="color:#719e07"&gt;table&lt;/span&gt; transcripts(id &lt;span style="color:#b58900"&gt;varchar&lt;/span&gt;(&lt;span style="color:#2aa198"&gt;10&lt;/span&gt;), sample &lt;span style="color:#b58900"&gt;varchar&lt;/span&gt;(&lt;span style="color:#2aa198"&gt;10&lt;/span&gt;), fpkm &lt;span style="color:#b58900"&gt;real&lt;/span&gt;);
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sqlite&lt;span style="color:#719e07"&gt;&amp;gt;&lt;/span&gt; .&lt;span style="color:#719e07"&gt;schema&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#719e07"&gt;CREATE&lt;/span&gt; &lt;span style="color:#719e07"&gt;TABLE&lt;/span&gt; transcripts(id &lt;span style="color:#b58900"&gt;varchar&lt;/span&gt;(&lt;span style="color:#2aa198"&gt;10&lt;/span&gt;), sample &lt;span style="color:#b58900"&gt;varchar&lt;/span&gt;(&lt;span style="color:#2aa198"&gt;10&lt;/span&gt;), fpkm &lt;span style="color:#b58900"&gt;real&lt;/span&gt;);
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sqlite&lt;span style="color:#719e07"&gt;&amp;gt;&lt;/span&gt; &lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;データを格納する。&lt;/p&gt;</description></item><item><title>How to manipulate DNA sequences in R</title><link>https://catway-jp.pages.dev/bioinfo_tips/Biostrings.html</link><pubDate>Sat, 25 Aug 2012 22:35:00 +0900</pubDate><guid>https://catway-jp.pages.dev/bioinfo_tips/Biostrings.html</guid><description>&lt;p&gt;DNA配列をRで操作する&lt;/p&gt;
&lt;p&gt;基本的なDNA配列の操作方法や、FASTA/FASTQ file を取り込む方法を解説します。また全ゲノム配列を読み込み操作する方法についても述べます。&lt;/p&gt;

&lt;h2 class="relative group"&gt;準備
 &lt;div id="準備" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e6%ba%96%e5%82%99" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;source(&amp;#34;http://bioconductor.org/biocLite.R&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;biocLite(&amp;#34;Biostrings&amp;#34;)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;

&lt;h3 class="relative group"&gt;基本的なDNA, アミノ酸配列の操作
 &lt;div id="基本的なdna-アミノ酸配列の操作" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e5%9f%ba%e6%9c%ac%e7%9a%84%e3%81%aadna-%e3%82%a2%e3%83%9f%e3%83%8e%e9%85%b8%e9%85%8d%e5%88%97%e3%81%ae%e6%93%8d%e4%bd%9c" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-r" data-lang="r"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#268bd2"&gt;library&lt;/span&gt;(&lt;span style="color:#2aa198"&gt;&amp;#34;Biostrings&amp;#34;&lt;/span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;x &lt;span style="color:#719e07"&gt;&amp;lt;-&lt;/span&gt; &lt;span style="color:#268bd2"&gt;DNAString&lt;/span&gt;(&lt;span style="color:#2aa198"&gt;&amp;#34;actttGtag&amp;#34;&lt;/span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#268bd2"&gt;is&lt;/span&gt;(x)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## [1] &amp;#34;DNAString&amp;#34; &amp;#34;XString&amp;#34; &amp;#34;XRaw&amp;#34; &amp;#34;XVector&amp;#34; &amp;#34;Vector&amp;#34; &amp;#34;Annotated&amp;#34;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-r" data-lang="r"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;x&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## 9-letter &amp;#34;DNAString&amp;#34; instance
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## seq: ACTTTGTAG&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;XString クラスを継承した DNAString オブジェクトを作成しています。このオブジェケクトにしておくと、いろいろな配列操作が可能になります。RNA, アミノ酸は、それぞれ、RNAString and AAString を使います。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-r" data-lang="r"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;x[1&lt;span style="color:#719e07"&gt;:&lt;/span&gt;&lt;span style="color:#2aa198"&gt;2&lt;/span&gt;]&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## 2-letter &amp;#34;DNAString&amp;#34; instance
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## seq: AC&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-r" data-lang="r"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;aa &lt;span style="color:#719e07"&gt;&amp;lt;-&lt;/span&gt; &lt;span style="color:#268bd2"&gt;translate&lt;/span&gt;(x)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#268bd2"&gt;is&lt;/span&gt;(aa)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## [1] &amp;#34;AAString&amp;#34; &amp;#34;XString&amp;#34; &amp;#34;XRaw&amp;#34; &amp;#34;XVector&amp;#34; &amp;#34;Vector&amp;#34; &amp;#34;Annotated&amp;#34;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-r" data-lang="r"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;aa&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## 3-letter &amp;#34;AAString&amp;#34; instance
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## seq: TL*&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-r" data-lang="r"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;aa.revcomp &lt;span style="color:#719e07"&gt;&amp;lt;-&lt;/span&gt; &lt;span style="color:#268bd2"&gt;translate&lt;/span&gt;(&lt;span style="color:#268bd2"&gt;reverseComplement&lt;/span&gt;(x))
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;aa.revcomp&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## 3-letter &amp;#34;AAString&amp;#34; instance
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## seq: LQS&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-r" data-lang="r"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;x.freq &lt;span style="color:#719e07"&gt;&amp;lt;-&lt;/span&gt; &lt;span style="color:#268bd2"&gt;alphabetFrequency&lt;/span&gt;(x, baseOnly &lt;span style="color:#719e07"&gt;=&lt;/span&gt; &lt;span style="color:#cb4b16"&gt;TRUE&lt;/span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#268bd2"&gt;is&lt;/span&gt;(x.freq)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## [1] &amp;#34;integer&amp;#34; &amp;#34;numeric&amp;#34; &amp;#34;vector&amp;#34; 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## [4] &amp;#34;data.frameRowLabels&amp;#34; &amp;#34;EnumerationValue&amp;#34; &amp;#34;atomic&amp;#34; 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## [7] &amp;#34;vectorORfactor&amp;#34;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-r" data-lang="r"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;x.freq&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## A C G T other 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## 2 1 2 4 0&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;

&lt;h3 class="relative group"&gt;DNA配列やコード表のデータ
 &lt;div id="dna配列やコード表のデータ" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#dna%e9%85%8d%e5%88%97%e3%82%84%e3%82%b3%e3%83%bc%e3%83%89%e8%a1%a8%e3%81%ae%e3%83%87%e3%83%bc%e3%82%bf" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;p&gt;もちろんDNAやコードのデータも用意されています。&lt;/p&gt;</description></item><item><title>How to get a microarray data from NCBI GEO</title><link>https://catway-jp.pages.dev/bioinfo_tips/HowToGetAMicroarrayDataFromGEOquery.html</link><pubDate>Fri, 24 Aug 2012 15:43:00 +0900</pubDate><guid>https://catway-jp.pages.dev/bioinfo_tips/HowToGetAMicroarrayDataFromGEOquery.html</guid><description>&lt;p&gt;GEOquery を使って公共データベースから発現データを入手する&lt;/p&gt;
&lt;p&gt;例としてこのデータを取り出します。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a href="http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE20349" target="_blank" rel="noreferrer"&gt;GSE20349&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 class="relative group"&gt;準備
 &lt;div id="準備" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e6%ba%96%e5%82%99" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;source(&amp;#34;http://bioconductor.org/biocLite.R&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;biocLite(&amp;#34;GEOquery&amp;#34;)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;データをダウンロードします。ネットワークからダウンロードするので時間がかかります。この例では数秒から数分ぐらいだと思います。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-r" data-lang="r"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#268bd2"&gt;library&lt;/span&gt;(&lt;span style="color:#2aa198"&gt;&amp;#34;GEOquery&amp;#34;&lt;/span&gt;)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## Loading required package: Biobase&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## Loading required package: BiocGenerics&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## Attaching package: &amp;#39;BiocGenerics&amp;#39;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## The following object(s) are masked from &amp;#39;package:stats&amp;#39;:
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## xtabs&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## The following object(s) are masked from &amp;#39;package:base&amp;#39;:
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## anyDuplicated, cbind, colnames, duplicated, eval, Filter, Find, get,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## intersect, lapply, Map, mapply, mget, order, paste, pmax, pmax.int, pmin,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## pmin.int, Position, rbind, Reduce, rep.int, rownames, sapply, setdiff,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## table, tapply, union, unique&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## Welcome to Bioconductor
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## Vignettes contain introductory material; view with &amp;#39;browseVignettes()&amp;#39;. To
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## cite Bioconductor, see &amp;#39;citation(&amp;#34;Biobase&amp;#34;)&amp;#39;, and for packages
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## &amp;#39;citation(&amp;#34;pkgname&amp;#34;)&amp;#39;.&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## Setting options(&amp;#39;download.file.method.GEOquery&amp;#39;=&amp;#39;auto&amp;#39;)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-r" data-lang="r"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;g &lt;span style="color:#719e07"&gt;&amp;lt;-&lt;/span&gt; &lt;span style="color:#268bd2"&gt;getGEO&lt;/span&gt;(&lt;span style="color:#2aa198"&gt;&amp;#34;GSE20349&amp;#34;&lt;/span&gt;)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## Found 1 file(s)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## GSE20349_series_matrix.txt.gz&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## File stored at:&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## /var/folders/cz/cny0ysmx205dnj0y2_34k8cc0000gn/T//RtmpqdGru3/GPL8492.soft&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-r" data-lang="r"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#268bd2"&gt;is&lt;/span&gt;(g)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## [1] &amp;#34;list&amp;#34; &amp;#34;vector&amp;#34; &amp;#34;AssayData&amp;#34;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-r" data-lang="r"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;g&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## $GSE20349_series_matrix.txt.gz
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## ExpressionSet (storageMode: lockedEnvironment)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## assayData: 16331 features, 4 samples 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## element names: exprs 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## protocolData: none
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## phenoData
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## sampleNames: GSM509823 GSM509824 GSM509825 GSM509826
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## varLabels: title geo_accession ... data_row_count (35 total)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## varMetadata: labelDescription
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## featureData
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## featureNames: 100009600_at 100012_at ... 99982_at (16331 total)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## fvarLabels: ID Gene_ID ... SPOT_ID (5 total)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## fvarMetadata: Column Description labelDescription
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## experimentData: use &amp;#39;experimentData(object)&amp;#39;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## Annotation: GPL8492&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-r" data-lang="r"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#268bd2"&gt;is&lt;/span&gt;(g[[1]])&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## [1] &amp;#34;ExpressionSet&amp;#34; &amp;#34;eSet&amp;#34; &amp;#34;VersionedBiobase&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## [4] &amp;#34;Versioned&amp;#34;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-r" data-lang="r"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;g[[1]]&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## ExpressionSet (storageMode: lockedEnvironment)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## assayData: 16331 features, 4 samples 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## element names: exprs 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## protocolData: none
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## phenoData
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## sampleNames: GSM509823 GSM509824 GSM509825 GSM509826
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## varLabels: title geo_accession ... data_row_count (35 total)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## varMetadata: labelDescription
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## featureData
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## featureNames: 100009600_at 100012_at ... 99982_at (16331 total)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## fvarLabels: ID Gene_ID ... SPOT_ID (5 total)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## fvarMetadata: Column Description labelDescription
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## experimentData: use &amp;#39;experimentData(object)&amp;#39;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## Annotation: GPL8492&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;データは、&lt;em&gt;&lt;strong&gt;ExpressionSet&lt;/strong&gt;&lt;/em&gt; が要素にはいった、&lt;em&gt;&lt;strong&gt;List&lt;/strong&gt;&lt;/em&gt; のデータ構造で保存されます。&lt;em&gt;&lt;strong&gt;ExpressionSet&lt;/strong&gt;&lt;/em&gt; は、Bioconductor で発現データを持つ際に良く使われるデータ構造です。この構造にしておけば、あらゆる発現解析の関数が利用できるようになります。なぜ &lt;em&gt;&lt;strong&gt;List&lt;/strong&gt;&lt;/em&gt; になっているかと言うと、検索で複数の結果が帰ってくる場合を想定しているためです。&lt;/p&gt;</description></item><item><title>ChIP-seq analysis with R/Bioconductor</title><link>https://catway-jp.pages.dev/lecture/biwako/NGS-R-Bioconductor-3rd.html</link><pubDate>Mon, 13 Aug 2012 18:00:00 +0900</pubDate><guid>https://catway-jp.pages.dev/lecture/biwako/NGS-R-Bioconductor-3rd.html</guid><description>&lt;p&gt;RとBioconductorでNGS解析: 3限 ChIP-seq データ解析&lt;/p&gt;

&lt;h2 class="relative group"&gt;はじめに
 &lt;div id="はじめに" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%81%af%e3%81%98%e3%82%81%e3%81%ab" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;この文章は統合データベース講習会：AJACSみちのく2「RとBioconductorを使ったNGS解析」3限目「ChIP-seq データ解析の基礎」の講義資料です。&lt;/p&gt;
&lt;p&gt;この文章の著作権は二階堂愛にあります。ファイルのダウンロード、印刷、複製、大量の印刷は自由におこなってよいです。企業、アカデミアに関わらず講義や勉強会で配布してもよいです。ただし販売したり営利目的の集まりで使用してはいけません。ここで許可した行為について二階堂愛に連絡や報告する必要はありません。常に最新版を配布したいので&lt;strong&gt;ネット上での再配布や転載は禁止&lt;/strong&gt;します。ネット上でのリンクはご自由にどうぞ。内容についての問い合わせはお気軽にメールしてください。&lt;/p&gt;

&lt;h2 class="relative group"&gt;対象
 &lt;div id="対象" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e5%af%be%e8%b1%a1" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;ここでは、Rの基礎知識がある人を対象に、RとBioconductor を使った ChIP-seq データ解析について説明します。基本的な Unix コマンドが利用できることが前提です。&lt;/p&gt;

&lt;h2 class="relative group"&gt;学習範囲
 &lt;div id="学習範囲" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e5%ad%a6%e7%bf%92%e7%af%84%e5%9b%b2" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;ChIP-seq を取り扱う。Peak解析については、Rではなく、ほかのオープンソースプログラムを利用して解析を行う。Rと Bioconductor ではその後の高次解析から論文の図の作成に至るまでを紹介します。&lt;/p&gt;

&lt;h2 class="relative group"&gt;ChIP-seq
 &lt;div id="chip-seq" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#chip-seq" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;illumina HiSeq は、塩基とその精度を表す quality value のセットで出力します。これは fastq file と呼ばれており、すべての解析のスタートになります。&lt;/p&gt;</description></item><item><title>ChIP-seq analysis with R/Bioconductor</title><link>https://catway-jp.pages.dev/lecture/tohoku-u/NGS-R-Bioconductor-3rd.html</link><pubDate>Mon, 13 Aug 2012 18:00:00 +0900</pubDate><guid>https://catway-jp.pages.dev/lecture/tohoku-u/NGS-R-Bioconductor-3rd.html</guid><description>&lt;p&gt;RとBioconductorでNGS解析: 3限 ChIP-seq データ解析&lt;/p&gt;

&lt;h2 class="relative group"&gt;はじめに
 &lt;div id="はじめに" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%81%af%e3%81%98%e3%82%81%e3%81%ab" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;この文章は統合データベース講習会：AJACSみちのく2「RとBioconductorを使ったNGS解析」3限目「ChIP-seq データ解析の基礎」の講義資料です。&lt;/p&gt;
&lt;p&gt;この文章の著作権は二階堂愛にあります。ファイルのダウンロード、印刷、複製、大量の印刷は自由におこなってよいです。企業、アカデミアに関わらず講義や勉強会で配布してもよいです。ただし販売したり営利目的の集まりで使用してはいけません。ここで許可した行為について二階堂愛に連絡や報告する必要はありません。常に最新版を配布したいので&lt;strong&gt;ネット上での再配布や転載は禁止&lt;/strong&gt;します。ネット上でのリンクはご自由にどうぞ。内容についての問い合わせはお気軽にメールしてください。&lt;/p&gt;

&lt;h2 class="relative group"&gt;対象
 &lt;div id="対象" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e5%af%be%e8%b1%a1" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;ここでは、Rの基礎知識がある人を対象に、RとBioconductor を使った ChIP-seq データ解析について説明します。基本的な Unix コマンドが利用できることが前提です。&lt;/p&gt;

&lt;h2 class="relative group"&gt;学習範囲
 &lt;div id="学習範囲" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e5%ad%a6%e7%bf%92%e7%af%84%e5%9b%b2" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;ChIP-seq を取り扱う。Peak解析については、Rではなく、ほかのオープンソースプログラムを利用して解析を行う。Rと Bioconductor ではその後の高次解析から論文の図の作成に至るまでを紹介します。&lt;/p&gt;

&lt;h2 class="relative group"&gt;ChIP-seq
 &lt;div id="chip-seq" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#chip-seq" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;illumina HiSeq は、塩基とその精度を表す quality value のセットで出力します。これは fastq file と呼ばれており、すべての解析のスタートになります。&lt;/p&gt;</description></item><item><title>Learning R</title><link>https://catway-jp.pages.dev/lecture/biwako/NGS-R-Bioconductor-1st.html</link><pubDate>Mon, 13 Aug 2012 18:00:00 +0900</pubDate><guid>https://catway-jp.pages.dev/lecture/biwako/NGS-R-Bioconductor-1st.html</guid><description>&lt;p&gt;R 入門—統計解析初歩から NGS 解析まで: 付録 RとBioconductorの基礎&lt;/p&gt;

&lt;h2 class="relative group"&gt;はじめに
 &lt;div id="はじめに" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%81%af%e3%81%98%e3%82%81%e3%81%ab" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;この文章は、「微研部員会 夏の学校: R 入門—統計解析初歩から NGS 解析まで」の講義資料です。&lt;/p&gt;
&lt;p&gt;この文章の著作権は二階堂愛にあります。ファイルのダウンロード、印刷、複製、大量の印刷は自由におこなってよいです。企業、アカデミアに関わらず講義や勉強会で配布してもよいです。ただし販売したり営利目的の集まりで使用してはいけません。ここで許可した行為について二階堂愛に連絡や報告する必要はありません。常に最新版を配布したいので&lt;strong&gt;ネット上での再配布や転載は禁止&lt;/strong&gt;します。ネット上でのリンクはご自由にどうぞ。内容についての問い合わせはお気軽にメールしてください。&lt;/p&gt;

&lt;h2 class="relative group"&gt;対象
 &lt;div id="対象" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e5%af%be%e8%b1%a1" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;ここでは、本講義を理解する上で知っておきたい、Rの基本的な使いかたについて解説します。対象とするのはプログラミング初心者でRを利用したことがない人が対象です。また、なんとなくRを覚えてきた人が基礎的な知識を整理するためにも役に立つでしょう。&lt;/p&gt;

&lt;h2 class="relative group"&gt;準備
 &lt;div id="準備" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e6%ba%96%e5%82%99" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;&lt;em&gt;&lt;strong&gt;本講義はハンズオンではなく講師の操作を眺めるスタイルですが、一緒に実行してみたい場合は、ご自分のパソコンを持ち込み、以下の準備をしてくることを強くお勧めします。推奨環境は Mac OS X や Linux ですが、Rで実行するプログラムはすべて Windows でも同じように動作します。&lt;/strong&gt;&lt;/em&gt;&lt;/p&gt;
&lt;p&gt;まずは R をインストールします。&lt;a href="http://rstudio.org/" target="_blank" rel="noreferrer"&gt;http://rstudio.org/&lt;/a&gt; から、利用しているOSに適した RStudio Desktop をインストールします。起動や終了は普通のアプリケーションと同じです。起動したときに3つのペイン(ウィンドウ内にある小窓)が見えますが、左下の console という部分に、Rのプログラムを書き込んでいきます。&lt;/p&gt;</description></item><item><title>Learning R</title><link>https://catway-jp.pages.dev/lecture/tohoku-u/NGS-R-Bioconductor-1st.html</link><pubDate>Mon, 13 Aug 2012 18:00:00 +0900</pubDate><guid>https://catway-jp.pages.dev/lecture/tohoku-u/NGS-R-Bioconductor-1st.html</guid><description>&lt;p&gt;RとBioconductorでNGS解析: 1限 Rの基礎&lt;/p&gt;

&lt;h2 class="relative group"&gt;はじめに
 &lt;div id="はじめに" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%81%af%e3%81%98%e3%82%81%e3%81%ab" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;この文章は統合データベース講習会：AJACSみちのく2「RとBioconductorを使ったNGS解析」1限目「Rの基礎」講義資料です。&lt;/p&gt;
&lt;p&gt;この文章の著作権は二階堂愛にあります。ファイルのダウンロード、印刷、複製、大量の印刷は自由におこなってよいです。企業、アカデミアに関わらず講義や勉強会で配布してもよいです。ただし販売したり営利目的の集まりで使用してはいけません。ここで許可した行為について二階堂愛に連絡や報告する必要はありません。常に最新版を配布したいので&lt;strong&gt;ネット上での再配布や転載は禁止&lt;/strong&gt;します。ネット上でのリンクはご自由にどうぞ。内容についての問い合わせはお気軽にメールしてください。&lt;/p&gt;

&lt;h2 class="relative group"&gt;対象
 &lt;div id="対象" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e5%af%be%e8%b1%a1" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;ここでは、本講義を理解する上で知っておきたい、Rの基本的な使いかたについて解説します。対象とするのはプログラミング初心者でRを利用したことがない人が対象です。また、なんとなくRを覚えてきた人が基礎的な知識を整理するためにも役に立つでしょう。&lt;/p&gt;

&lt;h2 class="relative group"&gt;準備
 &lt;div id="準備" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e6%ba%96%e5%82%99" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;&lt;em&gt;&lt;strong&gt;本講義はハンズオンではなく講師の操作を眺めるスタイルですが、一緒に実行してみたい場合は、ご自分のパソコンを持ち込み、以下の準備をしてくることを強くお勧めします。推奨環境は Mac OS X や Linux ですが、Rで実行するプログラムはすべて Windows でも同じように動作します。&lt;/strong&gt;&lt;/em&gt;&lt;/p&gt;
&lt;p&gt;まずは R をインストールします。&lt;a href="http://rstudio.org/" target="_blank" rel="noreferrer"&gt;http://rstudio.org/&lt;/a&gt; から、利用しているOSに適した RStudio Desktop をインストールします。起動や終了は普通のアプリケーションと同じです。起動したときに3つのペイン(ウィンドウ内にある小窓)が見えますが、左下の console という部分に、Rのプログラムを書き込んでいきます。&lt;/p&gt;

&lt;h4 class="relative group"&gt;Proxyの設定
 &lt;div id="proxyの設定" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#proxy%e3%81%ae%e8%a8%ad%e5%ae%9a" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h4&gt;
&lt;p&gt;もし http_proxy の設定が必要な場合は、以下のように設定します。&lt;/p&gt;</description></item><item><title>RNA-seq analysis with R/Bioconductor</title><link>https://catway-jp.pages.dev/lecture/biwako/NGS-R-Bioconductor-2nd.html</link><pubDate>Mon, 13 Aug 2012 18:00:00 +0900</pubDate><guid>https://catway-jp.pages.dev/lecture/biwako/NGS-R-Bioconductor-2nd.html</guid><description>&lt;p&gt;R 入門—統計解析初歩から NGS 解析まで&lt;/p&gt;

&lt;h2 class="relative group"&gt;はじめに
 &lt;div id="はじめに" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%81%af%e3%81%98%e3%82%81%e3%81%ab" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;この文章は、「微研部員会 夏の学校: R 入門—統計解析初歩から NGS 解析まで」の講義資料です。&lt;/p&gt;
&lt;p&gt;この文章の著作権は二階堂愛にあります。ファイルのダウンロード、印刷、複製、大量の印刷は自由におこなってよいです。企業、アカデミアに関わらず講義や勉強会で配布してもよいです。ただし販売したり営利目的の集まりで使用してはいけません。ここで許可した行為について二階堂愛に連絡や報告する必要はありません。常に最新版を配布したいので&lt;strong&gt;ネット上での再配布や転載は禁止&lt;/strong&gt;します。ネット上でのリンクはご自由にどうぞ。内容についての問い合わせはお気軽にメールしてください。&lt;/p&gt;

&lt;h2 class="relative group"&gt;対象
 &lt;div id="対象" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e5%af%be%e8%b1%a1" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;ここでは、Rの基礎知識がある人を対象に、RとBioconductor を使った RNA-seq データ解析について説明します。基本的な R/Bioconductor と Unix コマンドが利用できることが望ましいです。R の使い方については、&lt;a href="https://catway-jp.pages.dev/lecture/biwako/NGS-R-Bioconductor-1st.html" &gt;付録: R/Bioconductor&lt;/a&gt; を参考にしてください。&lt;/p&gt;

&lt;h2 class="relative group"&gt;学習範囲
 &lt;div id="学習範囲" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e5%ad%a6%e7%bf%92%e7%af%84%e5%9b%b2" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;RNA-seq を取り扱います。データのQCやマッピング、発現量の定量については、Rではなく、ほかのオープンソースプログラムを利用して解析を行います。Rと Bioconductor ではその後の高次解析から論文の図の作成に至るまでを紹介します。データについては Bioconductor のパッケージに添付されている RNA-seq データを使います。&lt;/p&gt;</description></item><item><title>RNA-seq analysis with R/Bioconductor</title><link>https://catway-jp.pages.dev/lecture/tohoku-u/NGS-R-Bioconductor-2nd.html</link><pubDate>Mon, 13 Aug 2012 18:00:00 +0900</pubDate><guid>https://catway-jp.pages.dev/lecture/tohoku-u/NGS-R-Bioconductor-2nd.html</guid><description>&lt;p&gt;RとBioconductorでNGS解析: 2限 RNA-seq データ解析&lt;/p&gt;

&lt;h2 class="relative group"&gt;はじめに
 &lt;div id="はじめに" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%81%af%e3%81%98%e3%82%81%e3%81%ab" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;この文章は統合データベース講習会：AJACSみちのく2「RとBioconductorを使ったNGS解析」2限目「RNA-seq データ解析」の講義資料です。&lt;/p&gt;
&lt;p&gt;この文章の著作権は二階堂愛にあります。ファイルのダウンロード、印刷、複製、大量の印刷は自由におこなってよいです。企業、アカデミアに関わらず講義や勉強会で配布してもよいです。ただし販売したり営利目的の集まりで使用してはいけません。ここで許可した行為について二階堂愛に連絡や報告する必要はありません。常に最新版を配布したいので&lt;strong&gt;ネット上での再配布や転載は禁止&lt;/strong&gt;します。ネット上でのリンクはご自由にどうぞ。内容についての問い合わせはお気軽にメールしてください。&lt;/p&gt;

&lt;h2 class="relative group"&gt;対象
 &lt;div id="対象" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e5%af%be%e8%b1%a1" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;ここでは、Rの基礎知識がある人を対象に、RとBioconductor を使った RNA-seq データ解析について説明します。基本的な Unix コマンドが利用できることが望ましいです。&lt;/p&gt;

&lt;h2 class="relative group"&gt;学習範囲
 &lt;div id="学習範囲" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e5%ad%a6%e7%bf%92%e7%af%84%e5%9b%b2" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;RNA-seq を取り扱います。データのQCやマッピング、発現量の定量については、Rではなく、ほかのオープンソースプログラムを利用して解析を行います。Rと Bioconductor ではその後の高次解析から論文の図の作成に至るまでを紹介します。データについては Bioconductor のパッケージに添付されている RNA-seq データを使います。&lt;/p&gt;

&lt;h2 class="relative group"&gt;RNA-seq
 &lt;div id="rna-seq" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#rna-seq" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;illumina HiSeq は、塩基とその精度を表す quality value のセットで出力します。これは fastq file と呼ばれており、すべての解析のスタートになります。&lt;/p&gt;</description></item><item><title>2つのTF ChIP-seq の共通結合領域を探す</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/twochipseq.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/twochipseq.html</guid><description>&lt;p&gt;異なる2つの転写因子の結合領域がどのぐらい重なっているかを検討することで、
転写因子の同じ場所で協調、あるいは競合して働いているかどうかを知ることができる。
そこで2つの ChIP-seq 解析から得られたピークの重なりを探索する方法について述べる。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; library(“ChIPpeakAnno”)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.df &amp;lt;- read.table(&amp;#34;results/macs2/Oct4_peaks.bed&amp;#34;, header=F)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; sox2.df &amp;lt;- read.table(&amp;#34;results/macs2/Sox2_peaks.bed&amp;#34;, header=F)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.gr &amp;lt;- BED2RangedData(oct4.df, header=FALSE)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; sox2.gr &amp;lt;- BED2RangedData(sox2.df, header=FALSE)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.sox2.overlap &amp;lt;- findOverlappingPeaks(oct4.gr, sox2.gr)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;まずファイルからbed fileを入力し、そのデータフレームを BED2RangedData で RangedData というデータ構造に変換する。findOverlappingPeaks は2つのRangedData の共通した行を探す関数である。&lt;/p&gt;

&lt;h3 class="relative group"&gt;2つのTF ChIP-seq の共通結合領域をカウントしベン図を描く
 &lt;div id="2つのtf-chip-seq-の共通結合領域をカウントしベン図を描く" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#2%e3%81%a4%e3%81%aetf-chip-seq-%e3%81%ae%e5%85%b1%e9%80%9a%e7%b5%90%e5%90%88%e9%a0%98%e5%9f%9f%e3%82%92%e3%82%ab%e3%82%a6%e3%83%b3%e3%83%88%e3%81%97%e3%83%99%e3%83%b3%e5%9b%b3%e3%82%92%e6%8f%8f%e3%81%8f" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; library(“ChIPpeakAnno”)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.df &amp;lt;- read.table(&amp;#34;results/macs2/Oct4_peaks.bed&amp;#34;, header=F)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; sox2.df &amp;lt;- read.table(&amp;#34;results/macs2/Sox2_peaks.bed&amp;#34;, header=F)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.gr &amp;lt;- BED2RangedData(oct4.df, header=FALSE)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; sox2.gr &amp;lt;- BED2RangedData(sox2.df, header=FALSE)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; makeVennDiagram(RangedDataList(oct4.gr, sox2.gr), NameOfPeaks=c(&amp;#34;Oct4&amp;#34;, &amp;#34;Sox2&amp;#34;), totalTest=3000)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;</description></item><item><title>bed file の重複領域をマージして行数を減らす</title><link>https://catway-jp.pages.dev/bioinformatics/qc/reducebed.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/qc/reducebed.html</guid><description>&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-R" data-lang="R"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#268bd2"&gt;library&lt;/span&gt;(&lt;span style="color:#2aa198"&gt;&amp;#34;GenomicRanges&amp;#34;&lt;/span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;x &lt;span style="color:#719e07"&gt;&amp;lt;-&lt;/span&gt; &lt;span style="color:#268bd2"&gt;read.table&lt;/span&gt;(hoge.bed)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;y &lt;span style="color:#719e07"&gt;&amp;lt;-&lt;/span&gt; &lt;span style="color:#268bd2"&gt;GRanges&lt;/span&gt;(seqname &lt;span style="color:#719e07"&gt;=&lt;/span&gt; &lt;span style="color:#268bd2"&gt;Rle&lt;/span&gt;(x[,&lt;span style="color:#2aa198"&gt;1&lt;/span&gt;]), ranges &lt;span style="color:#719e07"&gt;=&lt;/span&gt; &lt;span style="color:#268bd2"&gt;IRanges&lt;/span&gt;(start &lt;span style="color:#719e07"&gt;=&lt;/span&gt; x[,&lt;span style="color:#2aa198"&gt;2&lt;/span&gt;], end &lt;span style="color:#719e07"&gt;=&lt;/span&gt; x[,&lt;span style="color:#2aa198"&gt;3&lt;/span&gt;]))
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;y.reduced &lt;span style="color:#719e07"&gt;&amp;lt;-&lt;/span&gt; &lt;span style="color:#268bd2"&gt;reduce&lt;/span&gt;(y)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#268bd2"&gt;write.table&lt;/span&gt;(file &lt;span style="color:#719e07"&gt;=&lt;/span&gt; &lt;span style="color:#2aa198"&gt;&amp;#34;hoge.bed&amp;#34;&lt;/span&gt;, &lt;span style="color:#268bd2"&gt;as.data.frame&lt;/span&gt;(y.reduced)[,&lt;span style="color:#2aa198"&gt;1&lt;/span&gt;&lt;span style="color:#719e07"&gt;:&lt;/span&gt;&lt;span style="color:#2aa198"&gt;3&lt;/span&gt;], quote &lt;span style="color:#719e07"&gt;=&lt;/span&gt; &lt;span style="color:#268bd2"&gt;F&lt;/span&gt;, sep &lt;span style="color:#719e07"&gt;=&lt;/span&gt; &lt;span style="color:#2aa198"&gt;&amp;#34;\t&amp;#34;&lt;/span&gt;, row.names&lt;span style="color:#719e07"&gt;=&lt;/span&gt;&lt;span style="color:#268bd2"&gt;F&lt;/span&gt;, col.names&lt;span style="color:#719e07"&gt;=&lt;/span&gt;&lt;span style="color:#268bd2"&gt;F&lt;/span&gt;)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;</description></item><item><title>bed file を染色体ごとのファイルへ分割する</title><link>https://catway-jp.pages.dev/bioinformatics/qc/splitbedbychrom.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/qc/splitbedbychrom.html</guid><description>&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ cat hoge.bed
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;chr1 100 199
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;chr1 200 299
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;:
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;chr2 100 199
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;chr2 200 299
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;:&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;のようなファイルを染色体ごとに分割する。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;awk &amp;#39;{print $0 &amp;gt;&amp;gt; $1&amp;#34;.bed&amp;#34;}&amp;#39; hoge.bed&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;これは awk というツールを使っています。
パターン {アクション} は特定のパターンにマッチしたら、括弧内のアクションを実行するための記法です。
パターンが記載されていない場合は、すべての行を対象に処理をおこないます。
print $0 を表示しています。$0 は1行を意味します。$1は入力を空白文字で区切ったときの行番号です。&lt;/p&gt;
&lt;p&gt;chr1.bed, chr2.bed,&amp;hellip; がディレクトリに保存されます。&lt;/p&gt;</description></item><item><title>Bioconductor 日本ミラーを利用する</title><link>https://catway-jp.pages.dev/bioinformatics/etc/biocjp.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/etc/biocjp.html</guid><description>&lt;p&gt;日本ミラーの bioconductor.jp を選択するには、以下のように、&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;chooseBioCmirror()&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;で 6 番を選ぶだけです。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;options(&amp;#34;BioC_mirror&amp;#34;)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;で切り替わっていることを確認できます。試しに、BrainStars package をインストールしてみると、ちゃんと bioconductor.jp からインストールされているのがわかります。&lt;/p&gt;</description></item><item><title>Bioconductorのソースコードを検索する</title><link>https://catway-jp.pages.dev/bioinformatics/etc/biocsearch.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/etc/biocsearch.html</guid><description>&lt;p&gt;&lt;a href="http://search.bioconductor.jp/" target="_blank" rel="noreferrer"&gt;Bioconductor Code Search&lt;/a&gt;&lt;/p&gt;</description></item><item><title>Blog Archives</title><link>https://catway-jp.pages.dev/blog/archives/</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/blog/archives/</guid><description/></item><item><title>Bowtie2でRNA-seqデータをトランスクリプトームへマッピングする</title><link>https://catway-jp.pages.dev/bioinformatics/RNA-Seq/bowtie2_transcript.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/RNA-Seq/bowtie2_transcript.html</guid><description>&lt;p&gt;RNA-Seq のデータをトランスクリプトームへマッピングする方法について述べる。RNA-Seqデータはスプライシング後のRNAをシーケンスするのが一般的である。そのためスプライシングされるイントロンとエクソンの境界にあるシーケンスリードは、ゲノムにはマッピングされない。そのためTopHatなどスプライスドアラインメントに対応したアルゴリズムを利用する必要がある。もうひとつの方法は、トランスクリプトームに対して、シーケンスリードをそのままマッピングすれば、この問題は考慮の必要がない。このデータは、トランスクリプトごとにマッピングされたリードを操作できるようになるので、トランスクリプトごとに、カウントやカバレッジを計算する際などには便利である。ただし、トランスクリプトームデータベースに含まれないトランスクリプトを考慮できない点に注意すること。&lt;/p&gt;
&lt;p&gt;まずトランスクリプトームのデータベース (bowtie2 index) を作成する。このステップは一度やればよい。ここではマウスゲノム mm10 の座標系の RefSeq を利用する。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ curl -O http://hgdownload.cse.ucsc.edu/goldenPath/mm10/bigZips/mrna.fa.gz
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ gzip -d mrna.fa.gz
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ bowtie2-build mrna.fa mrna&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;次にbowtie2でシーケンスリードをトランスクリプトームにマッピングする。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ bowtie2 -p 8 -x mrna -U hoge.fastq -S hoge.bowtie2.sam&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;参考までにファイルサイズの目安を書いておく。RNA-Seq (4 multiplex/lane, HiSeq 2000, v3)から得られた約11GBの sam ファイルを bam に変換すると、約2.6GBになる。これをソートすると、2.1GB程度のファイルになる。インデックスファイルは、15M程度である。&lt;/p&gt;
&lt;p&gt;結果が sam で出力されるため、その後の解析や可視化のために、bam へ変換する必要がある。&lt;/p&gt;

&lt;h3 class="relative group"&gt;中間ファイルを残さずにマッピングして sort された bam と bam index を作成する
 &lt;div id="中間ファイルを残さずにマッピングして-sort-された-bam-と-bam-index-を作成する" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e4%b8%ad%e9%96%93%e3%83%95%e3%82%a1%e3%82%a4%e3%83%ab%e3%82%92%e6%ae%8b%e3%81%95%e3%81%9a%e3%81%ab%e3%83%9e%e3%83%83%e3%83%94%e3%83%b3%e3%82%b0%e3%81%97%e3%81%a6-sort-%e3%81%95%e3%82%8c%e3%81%9f-bam-%e3%81%a8-bam-index-%e3%82%92%e4%bd%9c%e6%88%90%e3%81%99%e3%82%8b" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ bowtie -p 16 --chunkmbs 512 --verbose -m 1 \
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; -1 hoge_1.fastq -2 -2 hoge_2.fastq mrna -S 2&amp;gt; bowtie.log \
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; | samtools view -bSu - | samtools sort -m 10G - hoge.sort; \
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; samtools index hoge.sort.bam&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;</description></item><item><title>BowtieでChIP-seq のデータをリファレンスゲノムにマッピングする</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/bowtie_chipseq.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/bowtie_chipseq.html</guid><description>&lt;p&gt;RNA-Seq と同じ。インデックスファイルを対象のゲノムに置き換えること。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a href="https://catway-jp.pages.dev/bioinformatics/RNA-Seq/bowtie2_transcript.html" &gt;Bowtie2でRNA-seqデータをトランスクリプトームへマッピングする&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;</description></item><item><title>deeptools</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/deeptools.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/deeptools.html</guid><description>&lt;p&gt;&lt;a href="https://catway-jp.pages.dev/bioinformatics/etc/scipy.html" &gt;SciPy&lt;/a&gt;, &lt;a href="https://catway-jp.pages.dev/bioinformatics/etc/matplotlib.html" &gt;matplotlib&lt;/a&gt; をそれぞれセットアップをしておく。&lt;/p&gt;

&lt;h3 class="relative group"&gt;インストール
 &lt;div id="インストール" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%82%a4%e3%83%b3%e3%82%b9%e3%83%88%e3%83%bc%e3%83%ab" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;pip install deeptools --user&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;~/.local/bin 以下にある。&lt;/p&gt;</description></item><item><title>DNA配列のGC%を計算する</title><link>https://catway-jp.pages.dev/bioinformatics/qc/gc.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/qc/gc.html</guid><description>&lt;p&gt;multi fasta 形式で保存されたDNAの GC content を計算するには、EMBOSSのgeeceeを利用すると簡単である。一般的なコンピュータでなら、マウスの全転写産物のGC contentの計算が、8秒程度で終了する。例では、ensmust.67.fa に保存されているmRNA配列のGC%を計算し、ensmust.67.gc.txt に保存する。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ geecee -sequence ensmust.67.fa -outfile ensmust.67.gc.txt&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;出力の中身は以下のようになっている。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ cat ensmust.67.gc.txt
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;#Sequence GC content
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ENSMUST00000000096 0.53
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ENSMUST00000000137 0.40
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ENSMUST00000000109 0.43
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ENSMUST00000000127 0.53&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;長さとGC content の両方が欲しい場合は infoseq を利用したほうがよい。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ infoseq -heading N -usa N -database N -type N -description N -accession N -sequence ensmust.67.fa | perl -lpe &amp;#34;s/ +$//; s/ +/\t/g&amp;#34; &amp;gt; ensmust.67.infoseq.txt&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;</description></item><item><title>DNA配列をRで操作する</title><link>https://catway-jp.pages.dev/bioinformatics/etc/biostrings.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/etc/biostrings.html</guid><description>&lt;p&gt;基本的なDNA配列の操作方法や、FASTA/FASTQ file を取り込む方法を解説します。また全ゲノム配列を読み込み操作する方法についても述べます。&lt;/p&gt;

&lt;h3 class="relative group"&gt;準備
 &lt;div id="準備" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e6%ba%96%e5%82%99" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;source(&amp;#34;http://bioconductor.org/biocLite.R&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;biocLite(&amp;#34;Biostrings&amp;#34;)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;

&lt;h4 class="relative group"&gt;基本的なDNA, アミノ酸配列の操作
 &lt;div id="基本的なdna-アミノ酸配列の操作" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e5%9f%ba%e6%9c%ac%e7%9a%84%e3%81%aadna-%e3%82%a2%e3%83%9f%e3%83%8e%e9%85%b8%e9%85%8d%e5%88%97%e3%81%ae%e6%93%8d%e4%bd%9c" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h4&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;library(&amp;#34;Biostrings&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;x &amp;lt;- DNAString(&amp;#34;actttGtag&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;is(x)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## [1] &amp;#34;DNAString&amp;#34; &amp;#34;XString&amp;#34; &amp;#34;XRaw&amp;#34; &amp;#34;XVector&amp;#34; &amp;#34;Vector&amp;#34; &amp;#34;Annotated&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;x
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## 9-letter &amp;#34;DNAString&amp;#34; instance
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## seq: ACTTTGTAG&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;XString クラスを継承した DNAString オブジェクトを作成しています。このオブジェケクトにしておくと、いろいろな配列操作が可能になります。RNA, アミノ酸は、それぞれ、RNAString and AAString を使います。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;x[1:2]
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## 2-letter &amp;#34;DNAString&amp;#34; instance
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## seq: AC
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;aa &amp;lt;- translate(x)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;is(aa)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## [1] &amp;#34;AAString&amp;#34; &amp;#34;XString&amp;#34; &amp;#34;XRaw&amp;#34; &amp;#34;XVector&amp;#34; &amp;#34;Vector&amp;#34; &amp;#34;Annotated&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;aa
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## 3-letter &amp;#34;AAString&amp;#34; instance
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## seq: TL*
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;aa.revcomp &amp;lt;- translate(reverseComplement(x))
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;aa.revcomp
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## 3-letter &amp;#34;AAString&amp;#34; instance
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## seq: LQS
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;x.freq &amp;lt;- alphabetFrequency(x, baseOnly = TRUE)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;is(x.freq)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## [1] &amp;#34;integer&amp;#34; &amp;#34;numeric&amp;#34; &amp;#34;vector&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## [4] &amp;#34;data.frameRowLabels&amp;#34; &amp;#34;EnumerationValue&amp;#34; &amp;#34;atomic&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## [7] &amp;#34;vectorORfactor&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;x.freq
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## A C G T other
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## 2 1 2 4 0&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;

&lt;h3 class="relative group"&gt;DNA配列やコード表のデータ
 &lt;div id="dna配列やコード表のデータ" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#dna%e9%85%8d%e5%88%97%e3%82%84%e3%82%b3%e3%83%bc%e3%83%89%e8%a1%a8%e3%81%ae%e3%83%87%e3%83%bc%e3%82%bf" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;p&gt;もちろんDNAやコードのデータも用意されています。&lt;/p&gt;</description></item><item><title>eXpress で RNA-seq データから発現量を計算する</title><link>https://catway-jp.pages.dev/bioinformatics/RNA-Seq/express.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/RNA-Seq/express.html</guid><description>&lt;p&gt;トランスクリプートムを bowtie1 index にする。bowtie を利用して、その index file に fastq をマッピングし、eXpress で FPKM を計算する。&lt;/p&gt;

&lt;h3 class="relative group"&gt;bowtie1 を入れる
 &lt;div id="bowtie1-を入れる" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#bowtie1-%e3%82%92%e5%85%a5%e3%82%8c%e3%82%8b" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ wget &amp;#34;http://downloads.sourceforge.net/project/bowtie-bio/bowtie/1.1.1/bowtie-1.1.1-linux-x86_64.zip
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ unzip bowtie-1.1.1-linux-x86_64.zip
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ sudo mv bowtie-1.1.1-linux-x86_64 /usr/local&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;

&lt;h3 class="relative group"&gt;トランスクリプトームをダウンロード
 &lt;div id="トランスクリプトームをダウンロード" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%83%88%e3%83%a9%e3%83%b3%e3%82%b9%e3%82%af%e3%83%aa%e3%83%97%e3%83%88%e3%83%bc%e3%83%a0%e3%82%92%e3%83%80%e3%82%a6%e3%83%b3%e3%83%ad%e3%83%bc%e3%83%89" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ wget http://hgdownload.soe.ucsc.edu/goldenPath/hg38/bigZips/refMrna.fa.gz
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ gzip -d refMrna.fa.gz&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;

&lt;h3 class="relative group"&gt;インデックスを作成する
 &lt;div id="インデックスを作成する" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%82%a4%e3%83%b3%e3%83%87%e3%83%83%e3%82%af%e3%82%b9%e3%82%92%e4%bd%9c%e6%88%90%e3%81%99%e3%82%8b" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ /usr/local/bowtie-1.1.1-linux-x86_64 --offrate 1 refMrna.fa refMrna&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;refMrna.ebwt のようなファイルがいくつかできる。&lt;/p&gt;</description></item><item><title>FASTA/FASTQ/SAM/BAMの詳しいステータスを得る</title><link>https://catway-jp.pages.dev/bioinformatics/qc/samstat.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/qc/samstat.html</guid><description>&lt;p&gt;&lt;a href="http://samstat.sourceforge.net/" target="_blank" rel="noreferrer"&gt;samstat&lt;/a&gt; はFASTA/FASTQ/SAM/BAMから、nucleotide composition, length distribution, base quality distribution, mapping statistics, mismatch, insertion and deletion error profiles, di-nucleotide and 10-mer over-representation を計算するツールである。&lt;/p&gt;
&lt;p&gt;インストール:&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ wget http://downloads.sourceforge.net/project/samstat/samstat.tgz
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ tar zxvf samstat.tgz
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ cd samstat/src
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ make
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ sudo cp ./samstat /opt/local/bin/
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ rehash&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;実行方法:&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ samstat test.bam&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;結果は test.bam.html というファイルにhtml5形式で出力される。このファイルを閲覧するには通常のWebブラウザを使う。表示されるグラフは JavaScript だけで生成されているので、画像ファイルが出力されるわけではない。&lt;/p&gt;</description></item><item><title>FASTQ format について</title><link>https://catway-jp.pages.dev/bioinformatics/qc/fastq.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/qc/fastq.html</guid><description>&lt;p&gt;FASTQ はシーケンス配列とそのクオリティを記載するためのファイルフォーマットである。ファイル形式はテキストファイルなので、Unix/Linux の less コマンドやテキストエディタで見ることができる。イルミナ社のシーケンサーやNCBI Short Read Archive などのデータベースでもこのフォーマットが採用されており、多くの解析ソフトがこの形式を前提としている。
FASTQファイルはひとつのシーケンスリードの情報が4行単位で表現され、その単位が一枚のファイルに連らなっているファイルである。@で始まる最初の行は、シーケンスリードの情報が含まれたヘッダー行であり、FASTA形式の “&amp;gt;“ に値すると考えるとわかりやすい。次の行がリーケンスリードの塩基配列そのもので、ATGCNからなる。3行目も1行目と同じリードの情報を記載する行で+から始まる。大抵の場合は、単に “+”か、最初の行と同じ文字列になっている。4行目がシーケンスクオリティのスコアが符号化されたものである。&lt;/p&gt;
&lt;p&gt;イルミナ社の FASTQ file は1行目の意味について述べる。イルミナ社のFASTQ file はシーケンサーが出力するバイナリファイルである BCL file から Casava というソフトウェアで生成する。Casava はイルミナ社が提供するシーケンサーに付属するソフトウェアである。Casava のバージョンによって、一部フォーマットが異なるのでそれについても解説する。&lt;/p&gt;
&lt;p&gt;まず、Casava 1.8 より前の FASTQ file について解説する。@で始まるヘッダー行は”:”でセパレートされている。まず最初のフィールド HWI-ST554_0072 はシーケンサーの機械につけられたIDを示す。次の 8 はフローセルのレーン番号を示し、HiSeq, GAIIx シリーズでは1-8まである。フローセルのひとつのレーンは、tile に分けられているが、1はそのタイル番号を表している。1131, 1901 はそれぞれ tile 内にあるクラスターの x, y 座標を表わす。# の次の番号はマルチプレックス番号を示し、0の場合はマルチプレックスされていないことを示す。/の後の数字が 1 なら single-end, 2の場合は paired-end, あるいは、mate-pair read であることを示す。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;@HWI-ST554_0072:8:1:1131:1901#0/1
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;TCCCAAGGAAGGCGTGCGTGTGTTTGAGTACTTTCAAAACACACTTCCTAC
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;+HWI-ST554_0072:8:1:1131:1901#0/1
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;fcfefffffaefff^edeceZccccddd`dffeefffffffef_deffdff&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;図. HiSeqから出力されたFASTQ file の例 (Casava 1.8より前)&lt;/p&gt;
&lt;p&gt;Casava 1.8 以降の FASTQ file について解説する。@で始まるヘッダー行の形式が変更されている。まず、HWI-1KL121 がシーケンサにユニークに振られた機器IDである。これは以前のバージョンと変更はない。次の 46 は run ID でシーケンスを実行するたびに割り振られる。D0MVAACXX は flowcell に割り振られた ID である。以降については以前のバージョンと同じ意味である。1.8以降のヘッダーはスペースを挟んで、さらに情報が追加されている。最初の数字が 1 なら single-end, 2 なら paired-end である。次の文字は悪いリードを省くためのフィルターの結果を示しており、Y だと悪いリード、Nだとそれ以外という意味である。その次の数字は、XXX???を示す。最後の塩基はインデックスのシーケンスを表わしている。&lt;/p&gt;</description></item><item><title>FastQCによるシーケンス実験の品質チェック</title><link>https://catway-jp.pages.dev/bioinformatics/qc/fastqc.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/qc/fastqc.html</guid><description>&lt;p&gt;FastQC はシーケンス実験の品質をチェックするために便利がプロットを生成するプログラムである。サイクル(リードの塩基)あたりのシーケンスクオリティや、クオリティスコアの分布、同一シーケンスリードの重複率などを計算しプロットしてくれる。シーケンスクオリティはシーケンス実験の成否を、同一リードの重複率は、ライブラリ作成時の PCR バイアスなどを評価するために重要な指標である。重複率が高い場合は、PCRサイクルを減らすことで、ダイナミックレンジの向上を図ることができる。&lt;/p&gt;
&lt;p&gt;インストール:&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ curl -O http://www.bioinformatics.bbsrc.ac.uk/projects/fastqc/fastqc_v0.10.0.zip
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ unzip fastqc_v0.10.0.zip
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ sudo cp fastqc_v0.10.0 /opt
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ sudo ln -s /opt/fastqc_v0.10.0 /opt/fastqc
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ emacs -nw ~/.zshenv
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ export PATH=$PATH:/opt/fastqc&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;

&lt;h2 class="relative group"&gt;FastQCをコマンドラインから利用する
 &lt;div id="fastqcをコマンドラインから利用する" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#fastqc%e3%82%92%e3%82%b3%e3%83%9e%e3%83%b3%e3%83%89%e3%83%a9%e3%82%a4%e3%83%b3%e3%81%8b%e3%82%89%e5%88%a9%e7%94%a8%e3%81%99%e3%82%8b" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;実験が多くなるとGUIから実行するのが面倒になる。FastQCはコマンドラインからの実行にも対応している。以下のコマンドは test.fastq に対して、fastqc を実行し、結果を test ディレクトリに保存するというコマンドである。-t オプションは CPU を利用する数を指定する。この場合は 8 CPUs を使って計算する。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ fastqc -t 8 test.fastq -o test&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;FastQC は fastq file だけでなく、gzip (*.gz)で圧縮されたファイルに対しても実行可能である。結果はウェブブラウザで閲覧できる html ファイル、テキストファイル、html ファイルが圧縮された zip ファイルの3種類出力される。&lt;/p&gt;</description></item><item><title>featureCount で bam と gtf からリードカウントを得る</title><link>https://catway-jp.pages.dev/bioinformatics/qc/featureCount.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/qc/featureCount.html</guid><description>&lt;p&gt;&lt;a href="http://bioinf.wehi.edu.au/featureCounts/" target="_blank" rel="noreferrer"&gt;featureCount&lt;/a&gt;は、bamからの高速なリードカウントツール。
Rやコマンドラインから実行できる。コマンドライン版は &lt;a href="http://subread.sourceforge.net/" target="_blank" rel="noreferrer"&gt;Subread&lt;/a&gt;に含まれている。R版は、&lt;a href="http://bioconductor.org/packages/release/bioc/html/Rsubread.html" target="_blank" rel="noreferrer"&gt;Rsubread&lt;/a&gt;に
実装されている。&lt;/p&gt;

&lt;h3 class="relative group"&gt;featureについて
 &lt;div id="featureについて" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#feature%e3%81%ab%e3%81%a4%e3%81%84%e3%81%a6" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;p&gt;featureCount は feature ごとにリードをカウントするツールである。feture とは、リファレンス配列上のある区間のこと。その feature をまとめたセットをmeta-featureと呼んでいる。
RNA-seq の場合は、feature は exon であるし、meta-feature は gene や transcript になる。&lt;/p&gt;

&lt;h3 class="relative group"&gt;コマンドライン版 Subread
 &lt;div id="コマンドライン版-subread" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%82%b3%e3%83%9e%e3%83%b3%e3%83%89%e3%83%a9%e3%82%a4%e3%83%b3%e7%89%88-subread" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;

&lt;h4 class="relative group"&gt;インストール
 &lt;div id="インストール" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%82%a4%e3%83%b3%e3%82%b9%e3%83%88%e3%83%bc%e3%83%ab" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h4&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;wget http://downloads.sourceforge.net/project/subread/subread-1.5.0-p2/subread-1.5.0-p2-source.tar.gz
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;cd subread-1.5.0-p2-source/src
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;make -f Makefile.Linux # 正常に終了すると ../bin に実行ファイルができる
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;cd ../../
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;cp -a subread-1.5.0-p2-source $HOME/opt/local
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;export PATH=$HOME/opt/local/subread-1.5.0-p2-source/bin:$PATH&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;

&lt;h4 class="relative group"&gt;featureCount でリードカウントを得る
 &lt;div id="featurecount-でリードカウントを得る" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#featurecount-%e3%81%a7%e3%83%aa%e3%83%bc%e3%83%89%e3%82%ab%e3%82%a6%e3%83%b3%e3%83%88%e3%82%92%e5%be%97%e3%82%8b" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h4&gt;
&lt;p&gt;まず遺伝子アノテーションファイルを得る。&lt;/p&gt;</description></item><item><title>MACS2を利用してChIP-Seqのピークを探す</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/macs2.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/macs2.html</guid><description>&lt;p&gt;MACS2、はおそらくもっとも良く使われている peak caller である MACS のベータバージョンである。&lt;/p&gt;
&lt;p&gt;インストール:
Python 2.6 以上、Cython 0.14.1以上, numpy が必要。&lt;/p&gt;
&lt;p&gt;numpy のインストール:&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ wget &amp;#34;http://downloads.sourceforge.net/project/numpy/NumPy/1.6.1/numpy-1.6.1.tar.gz&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ tar zxvf numpy-1.6.1.tar.gz 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ cd numpy-1.6.1
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ python setup.py build --fcompiler=gnu
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ sudo python setup.py install&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;MACS2のインストール:&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ w3m http://github.com/downloads/taoliu/MACS/MACS-2.0.9-1.tar.gz
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ tar zxvf MACS-2.0.9.tar.gz
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ cd MACS-2.0.9/
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ sudo python setup.py install --prefix=/opt
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ export PYTHONPATH=/opt/lib/python2.6/site-packages/:$PYTHONPATH&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;実行例:&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ macs2 callpeak -t results/bowtie/Sox2/Sox2.bowtie.sort.rmRepeat.bam -c results/bowtie/GFP/GFP.bowtie.sort.rmRepeat.bam -f BAM -g mm -n Sox2 -B -q 0.01 --shiftsize 100&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;-t はターゲットとするTFの bam ファイル、-c はネガティブコントロールとなるサンプルの bam ファイル、-f は入力ファイルの形式を指定、-g はゲノムサイズを指定、-n は任意の実験名、-q は q-value の閾値を指定する。-B は extended fragment pileup, local lambda and score tracks を graphBed file に保存するオプションである。-g のゲノムサイズ指定には数値による指定と生物名を指定することができ、ヒトゲノムは、hs, マウスゲノムは mm, 線虫ゲノムが ce, ハエゲノムが、dm である。&lt;/p&gt;</description></item><item><title>matplotlib をセットアップ</title><link>https://catway-jp.pages.dev/bioinformatics/etc/matplotlib.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/etc/matplotlib.html</guid><description>&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;git clone https://github.com/matplotlib/matplotlib.git
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;cd matplotlib
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;python setup.py install&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;</description></item><item><title>Nextflow で複数の解析プログラムを次々に実行する</title><link>https://catway-jp.pages.dev/bioinformatics/etc/nextflow.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/etc/nextflow.html</guid><description>&lt;p&gt;NGSのデータ解析は複数のプログラムやデータベースを組み合わて実行する必要がある。これをパイプライン処理やワークフロー処理と呼ぶ。通常、Make, Rake, シェルスクリプトなどを利用して、ワークフローを実装する。&lt;/p&gt;
&lt;p&gt;ワークフロー作成・管理ツールもあり、Galaxy はウェブUIやデータ管理機能もあり、よく使われている。ここではコマンドラインベースの軽量ワークフローシステムである、Nextflow について述べる。&lt;/p&gt;

&lt;h3 class="relative group"&gt;インストール
 &lt;div id="インストール" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%82%a4%e3%83%b3%e3%82%b9%e3%83%88%e3%83%bc%e3%83%ab" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;p&gt;まず Java 8 をインストールする。Nextflow の動作は Java 7以上が求められる。Java のバージョン確認は以下の通り。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;java -version&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;次にコマンドラインから以下を実行する。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;cd ~/opt/local/bin
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;curl -fsSL get.nextflow.io | bash
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;export PATH=$HOME/opt/local/bin/:$PATH # 必要ならパスを通す&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;Nextflowを実行してみる。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;nextflow run hello
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;Picked up _JAVA_OPTIONS: -Duser.language=en -Dfile.encoding=UTF-8
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;N E X T F L O W ~ version 0.18.0
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;Launching &amp;#39;nextflow-io/hello&amp;#39; - revision: 35f898dfe5 [master]
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;[warm up] executor &amp;gt; local
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;[59/99fce6] Submitted process &amp;gt; sayHello (5)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;[d8/890e37] Submitted process &amp;gt; sayHello (4)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;[44/e3768b] Submitted process &amp;gt; sayHello (1)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;[84/9af872] Submitted process &amp;gt; sayHello (2)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;[5c/3dc2d9] Submitted process &amp;gt; sayHello (3)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;Γεια σου world!
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;Bojour world!
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;Hola world!
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;Ciao world!
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;Hello world!&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;

&lt;h3 class="relative group"&gt;ワークフローを作る
 &lt;div id="ワークフローを作る" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%83%af%e3%83%bc%e3%82%af%e3%83%95%e3%83%ad%e3%83%bc%e3%82%92%e4%bd%9c%e3%82%8b" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;p&gt;簡単なワークフローを作ってみる。&lt;/p&gt;</description></item><item><title>NGSの情報の集めかた</title><link>https://catway-jp.pages.dev/bioinformatics/etc/ngsinfo.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/etc/ngsinfo.html</guid><description>&lt;ul&gt;
&lt;li&gt;講演&amp;amp;チュートリアル
&lt;ul&gt;
&lt;li&gt;&lt;a href="http://togotv.dbcls.jp/ja/" target="_blank" rel="noreferrer"&gt;統合TV&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;li&gt;QAサイト
&lt;ul&gt;
&lt;li&gt;&lt;a href="https://www.biostars.org/" target="_blank" rel="noreferrer"&gt;Biostars&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="http://seqanswers.com/" target="_blank" rel="noreferrer"&gt;SEQanswers&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="http://qa.lifesciencedb.jp/" target="_blank" rel="noreferrer"&gt;LSQA&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;li&gt;コミュニティ
&lt;ul&gt;
&lt;li&gt;&lt;a href="http://ngs-field.org/" target="_blank" rel="noreferrer"&gt;NGS-field (NGS現場の会)&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;/ul&gt;</description></item><item><title>orenogb2 を使って、複数の bam を可視化する</title><link>https://catway-jp.pages.dev/bioinformatics/vis/orenogb2.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/vis/orenogb2.html</guid><description>&lt;p&gt;orenogb2 を利用すると、複数の bam と遺伝子名や座標を指定すると、周辺の遺伝子と bam から計算したカバレッジがグラフ化できます。&lt;/p&gt;

&lt;h3 class="relative group"&gt;インストール
 &lt;div id="インストール" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%82%a4%e3%83%b3%e3%82%b9%e3%83%88%e3%83%bc%e3%83%ab" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ sudo R&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;パッケージをインストールする&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;source(&amp;#34;http://bioconductor.org/biocLite.R&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;biocLite(c(&amp;#34;ggbio&amp;#34;, &amp;#34;GenomicRanges&amp;#34;, &amp;#34;GenomicAlignments&amp;#34;, &amp;#34;devtools&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;biocLite(c(&amp;#34;Mus.musculus&amp;#34;, &amp;#34;BSgenome.Mmusculus.UCSC.mm10&amp;#34;))
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;biocLite(c(&amp;#34;Homo.sapiens&amp;#34;, &amp;#34;BSgenome.Hsapiens.UCSC.hg19&amp;#34;))
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;library(devtools)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;install_github(&amp;#34;dritoshi/orenogb2&amp;#34;)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;

&lt;h3 class="relative group"&gt;座標を指定して描画する
 &lt;div id="座標を指定して描画する" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e5%ba%a7%e6%a8%99%e3%82%92%e6%8c%87%e5%ae%9a%e3%81%97%e3%81%a6%e6%8f%8f%e7%94%bb%e3%81%99%e3%82%8b" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;q01.bam &amp;lt;- system.file(&amp;#34;extdata&amp;#34;, &amp;#34;Quartz_01.Pou5f1.bam&amp;#34;, package = &amp;#34;orenogb2&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;q02.bam &amp;lt;- system.file(&amp;#34;extdata&amp;#34;, &amp;#34;Quartz_02.Pou5f1.bam&amp;#34;, package = &amp;#34;orenogb2&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;genome.ver &amp;lt;- &amp;#39;mm10&amp;#39;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;zoom.power &amp;lt;- 1
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;quartz.bam.files &amp;lt;- c(q01.bam, q02.bam)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;gb.quartz &amp;lt;- orenogb2$new(
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; genome.ver = genome.ver,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; zoom.power = zoom.power,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; bam.files = quartz.bam.files
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;# Coordination
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;gb.quartz$chr &amp;lt;- &amp;#34;chr17&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;gb.quartz$start.bp &amp;lt;- 35492880
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;gb.quartz$end.bp &amp;lt;- 35526079
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;gb.quartz$plotgb()&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;&lt;figure&gt;&lt;img
 class="my-0 rounded-md"
 loading="lazy"
 decoding="async"
 fetchpriority="low"
 alt="demo"
 src="Pou5f1.png"
 &gt;&lt;/figure&gt;
&lt;/p&gt;</description></item><item><title>Peakを近傍に持つ遺伝子によく観察されるGene Ontolgyを挙げる</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/chipgo.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/chipgo.html</guid><description>&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; library(“ChIPpeakAnno”)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; library(org.Mm.eg.db)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.df &amp;lt;- read.table(&amp;#34;results/macs2/Oct4_peaks.bed&amp;#34;, header=F)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; sox2.df &amp;lt;- read.table(&amp;#34;results/macs2/Sox2_peaks.bed&amp;#34;, header=F)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.gr &amp;lt;- BED2RangedData(oct4.df, header=FALSE)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; sox2.gr &amp;lt;- BED2RangedData(sox2.df, header=FALSE)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.go &amp;lt;- getEnrichedGO(oct4.anno, orgAnn=&amp;#34;org.Mm.eg.db&amp;#34;, maxP=0.01, multiAdj=TRUE, minGOterm=10, multiAdjMethod=&amp;#34;BH&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.bp.goterm &amp;lt;- unique(oct4.go$bp[order(oct4.go$bp[,10]),c(2,10)])
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.bp.goterm[1:10,]&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;getEnrichedGo の引数 multiAdjMethod で指定できる多重検定補正の手法は以下の通りである。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Bonferroni: Bonferroni single-step adjusted p-values for strong control of the FWER.&lt;/li&gt;
&lt;li&gt;Holm: Holm (1979) step-down adjusted p-values for strong control of the FWER.&lt;/li&gt;
&lt;li&gt;Hochberg: Hochberg (1988) step-up adjusted p-values for strong control of the FWER (for raw (unadjusted) p-values satisfying the Simes inequality).&lt;/li&gt;
&lt;li&gt;SidakSS: Sidak single-step adjusted p-values for strong control of the FWER (for positive orthant dependent test statistics).&lt;/li&gt;
&lt;li&gt;SidakSD: Sidak step-down adjusted p-values for strong control of the FWER (for positive orthant dependent test statistics).&lt;/li&gt;
&lt;li&gt;BH: adjusted p-values for the Benjamini &amp;amp; Hochberg (1995) step-up FDR controlling procedure (independent and positive regression dependent test statistics).&lt;/li&gt;
&lt;li&gt;BY: adjusted p-values for the Benjamini &amp;amp; Yekutieli (2001) step-up FDR controlling procedure (general dependency structures)&lt;/li&gt;
&lt;/ul&gt;</description></item><item><title>Position weight matrix から Sequence Logo を描く</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/seqlog.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/seqlog.html</guid><description>&lt;p&gt;ピーク内もモチーフを発見した後にそのモチーフ配列とその position weight matrix (PWM)が出力される。PWMは”Sequence Logo”という可視化方法によってモチーフ配列を表示するのが一般的である。ここでは「ピーク内に頻出するDNAモチーフ配列を発見する」の PWMを利用する。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; library(“seqLogo”)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; pdf(“oct4.motif01.pdf”)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; seqLog(oct4.motif.pwms[[1]])
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; dev.off()&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;</description></item><item><title>Position weight matrix を既知モチーフデータベースに対して検索する</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/motifsearch.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/motifsearch.html</guid><description>&lt;p&gt;予測した PWM が既知のモチーフに一致するかを検索する。これによって新規モチーフなのか、既知のモチーフかを分けることができる。またPWMや sequence logo をみていても、それが既知のタンパク質結合サイトかどうかを判断することは難しいため、既知のデータベースと比較するのがよい。ここではデータベースとの比較、比較結果の出力について述べる。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; library(&amp;#34;MotIV&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; path &amp;lt;- system.file(package=&amp;#34;MotIV&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; jaspar &amp;lt;- readPWMfile(paste(path,&amp;#34;/extdata/jaspar2010.txt&amp;#34;,sep=&amp;#34;&amp;#34;))
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; jaspar.scores &amp;lt;- readDBScores(paste(path,&amp;#34;/extdata/jaspar2010_PCC_SWU.scores&amp;#34;,sep=&amp;#34;&amp;#34;))
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.jaspar &amp;lt;- motifMatch(inputPWM = oct4.motif.pwms, align = &amp;#34;SWU&amp;#34;, cc = &amp;#34;PCC&amp;#34;, database = jaspar, DBscores = jaspar.scores, top=5)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; Ungapped Alignment
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; Scores read
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; Database read
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; Motif matches : 5
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; summary(oct4.jaspar)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; Number of input motifs : 4 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; Input motifs names : m1 m2 m3 m4 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; Number of matches per motif: 5 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; Matches repartition : 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; SP1 EWSR1-FLI1 SPI1 SPIB INSM1 MZF1_1-4 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; 3 2 2 2 1 1 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;PPARG::RXRA Pax4 Pou5f1 RREB1 SOX10 SOX9 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; 1 1 1 1 1 1 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; Sox2 Sox5 Tal1::Gata1 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; 1 1 1 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; Arguments used : 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; -metric name : PCC 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; -alignment : SWU 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; pdf(&amp;#34;results/oct4.motif.logo.pdf&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; plot(oct4.jaspar, ncol = 2, top = 5, rev = FALSE, main = &amp;#34;Logo&amp;#34;, bysim = TRUE)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; dev.off()&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;</description></item><item><title>Python環境と整える</title><link>https://catway-jp.pages.dev/bioinformatics/etc/scipy.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/etc/scipy.html</guid><description>&lt;p&gt;Python 2.7 系が前提。&lt;/p&gt;

&lt;h3 class="relative group"&gt;LAPACK/BLAS をセットアップ
 &lt;div id="lapackblas-をセットアップ" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#lapackblas-%e3%82%92%e3%82%bb%e3%83%83%e3%83%88%e3%82%a2%e3%83%83%e3%83%97" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;cd ~/src
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;curl -O http://www.netlib.org/lapack/lapack-3.5.0.tgz
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;tar zxvf lapack-3.5.0.tgz
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;cd lapack-3.5.0
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;cp make.inc.example make.inc&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;make.inc の以下の2行を書き換える&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;OPTS = -O2 -frecursive -m64 -fPIC
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;NOOPT = -O0 -frecursive -m64 -fPIC&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;make blaslib
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;make
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;cp *.a ~/opt/lib&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;~/.zshenv に以下を追記する&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;# BLAS/LAPACK
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;export BLAS=~/opt/lib/librefblas.a
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;export LAPACK=~/opt/lib/liblapack.a&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;

&lt;h3 class="relative group"&gt;scipy をインストール
 &lt;div id="scipy-をインストール" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#scipy-%e3%82%92%e3%82%a4%e3%83%b3%e3%82%b9%e3%83%88%e3%83%bc%e3%83%ab" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;pip install --user scypy&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;</description></item><item><title>R で EnsEMBL Gene ID を NCBI Entrez Gene ID へ変換する</title><link>https://catway-jp.pages.dev/bioinformatics/etc/idconv.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/etc/idconv.html</guid><description>&lt;p&gt;org.Mm.eg.db というアノテーションパッケージを利用する。Bioconductor のアノテーションパッケージは、AnnDbBimap オブジェクトになっている。これはID変換のテーブルを 1:1 で扱うオブジェクトで、これを操作してIDを変換する。&lt;/p&gt;
&lt;p&gt;いや別に Mm じゃなくてもいいし、EnsEMBL じゃなくても共通する話です、はい。&lt;/p&gt;
&lt;p&gt;まず、この AnnDbBimap をベクターにしてから変換してみる。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;library(&amp;#34;org.Mm.eg.db&amp;#34;) 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;my.ensmusg &amp;lt;- c(&amp;#34;ENSMUSG00000000275&amp;#34;, &amp;#34;ENSMUSG00000002844&amp;#34;, &amp;#34;ENSMUSG00000003868&amp;#34;, &amp;#34;ENSMUSG00000091821&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ensmusg &amp;lt;- unlist(as.list(org.Mm.egENSEMBL2EG))
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;# convert EnsMUSG -&amp;gt; Entrez Gene ID 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;my.eg &amp;lt;- ensmusg[my.ensmusg] 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;my.eg
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ENSMUSG00000000275 ENSMUSG00000002844 ENSMUSG00000003868 &amp;lt;NA&amp;gt; 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; &amp;#34;217069&amp;#34; &amp;#34;11544&amp;#34; &amp;#34;20174&amp;#34; NA &lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;最後のIDが複数の Entrez ID に対応しているので、変換がうまくいっていない。これは、単に操作ミスによって対応のつくIDが少なくなり、その後の解析結果に影響を及ぼす可能性が高いのでよろしくない。&lt;/p&gt;
&lt;p&gt;次は、mget を利用して、AnnDbBimap オブジェクトを直接検索してみる。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;my.eg2 &amp;lt;- mget(my.ensmusg, org.Mm.egENSEMBL2EG)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;R&amp;gt; my.eg2
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ENSMUSG00000000275
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;[1] &amp;#34;217069&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ENSMUSG00000002844
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;[1] &amp;#34;11544&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ENSMUSG00000003868
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;[1] &amp;#34;20174&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ENSMUSG00000091821
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; [1] &amp;#34;100151772&amp;#34; &amp;#34;100502688&amp;#34; &amp;#34;100502744&amp;#34; &amp;#34;100502884&amp;#34; &amp;#34;100502947&amp;#34; &amp;#34;100502996&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; [7] &amp;#34;100503346&amp;#34; &amp;#34;100503401&amp;#34; &amp;#34;100503451&amp;#34; &amp;#34;100504531&amp;#34; &amp;#34;100504596&amp;#34; &amp;#34;100504635&amp;#34;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;この方法だと、list でデータが返ってくるので 1:n の対応でも正しくデータを得ることができる。AnnDbBimap はいわゆる環境のようなものなので、exists, ls, eapply なども使える。&lt;a href="https://speakerdeck.com/u/dritoshi/p/environment-and-scope-rule-in-r" target="_blank" rel="noreferrer"&gt;Rの環境について&lt;/a&gt;はこちらの資料を。&lt;/p&gt;</description></item><item><title>R でアニメーションするグラフを描く</title><link>https://catway-jp.pages.dev/bioinformatics/vis/ranimation.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/vis/ranimation.html</guid><description>&lt;p&gt;まずは、非線形モデル y = mesor + a * cos(2&lt;em&gt;pi&lt;/em&gt;(t-acrophase)/P) にN(0,0.5)のガウシアンノイズを加えたデータを用意し、これを測定されたデータと考える。そのデータに対して非線形回帰するために、Nelder-Mead法で目的関数sum( (y-yhat)^2 )を最大化する。いわゆる cosinor analysis ですね。その計算過程を各ステップごとにプロットし、animation libraryを使ってアニメ化する。&lt;/p&gt;
&lt;p&gt;アニメーションの動きが激しくなるように、わざと初期値をおおげざにはずしてある。青が測定データで、緑が予測した回帰曲線。緑のほうの線が動いてみえるはず。収束間近ではあまり動かないのでしばらくみつめていると、ループしてまた初期値から計算しなおす。&lt;/p&gt;
&lt;p&gt;コードは以下の通り。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;library(animation)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;t &amp;lt;- seq(0,48,1)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;mesor &amp;lt;- 0
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;a &amp;lt;- 3
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;acrophase &amp;lt;- 12
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;P &amp;lt;- 24
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;y &amp;lt;- mesor + a * cos(2*pi*(t-acrophase)/P)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;y.noise &amp;lt;- mesor + a * cos(2*pi*(t-acrophase)/P) + rnorm(length(t), mean=0, sd=1)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;resid &amp;lt;- function(par) {
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;mesor &amp;lt;- par[1]
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;a &amp;lt;- par[2]
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;acrophase &amp;lt;- par[3]
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;P &amp;lt;- par[4]
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;yhat &amp;lt;- mesor + a * cos(2*pi*(t-acrophase)/P)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;matplot(t,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;matrix(c(y.noise, yhat), ncol=2),
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;col=c(&amp;#34;#1E5692&amp;#34;, &amp;#34;#3E9A3B&amp;#34;),
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;type=&amp;#34;l&amp;#34;, lty=1, pch=21, lwd=5, cex=2,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ylim=c(-5,5))
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sum( (y-yhat)^2 )
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;}
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;saveMovie(optim(c(5,10,2,18), resid), interval = 0.01, movietype = &amp;#34;gif&amp;#34;, outdir = getwd())&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;ようするにユーザはプロットを何枚か出力するような関数を用意するだけ。それをsaveMovie()関数に渡せば、内部でImageMagickやらSWF Toolsががんばってくれてアニメになる、という仕組みになっている。ImageMagickを MacPortsあたりで入れておく必要がある。&lt;/p&gt;</description></item><item><title>R でソートできるテーブルを作成する</title><link>https://catway-jp.pages.dev/bioinformatics/vis/rsorttable.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/vis/rsorttable.html</guid><description>&lt;p&gt;テーブルのタイトル行をクリックするとソートできるテーブルを R で作ります。&lt;/p&gt;
&lt;p&gt;まず、インストールします。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sudo R
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;install.packages(&amp;#39;SortableHTMLTables&amp;#39;)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;テーブルを作ってみましょう。デモデータ iris をソートできるHTMLテーブルにしてみます。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;library(&amp;#39;SortableHTMLTables&amp;#39;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;data(iris)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sortable.html.table(iris, &amp;#34;./index.html&amp;#34;, &amp;#39;iris&amp;#39;)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;iris というディレクトリのなかに、index.html と必要なファイルが生成されているはずです。ブラウザで開くと以下のような感じになっているはず。&lt;/p&gt;
&lt;p&gt;中身をみてみます。jquery の jquery.tablesorter.js を利用していますね。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;lt;html lang=&amp;#34;en&amp;#34;&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;lt;head&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;lt;title&amp;gt;Untitled Page&amp;lt;/title&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;lt;link rel=&amp;#34;stylesheet&amp;#34; href=&amp;#34;style.css&amp;#34; type=&amp;#34;text/css&amp;#34; /&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;lt;script type=&amp;#34;text/javascript&amp;#34; src=&amp;#34;jquery-1.4.2.js&amp;#34;&amp;gt;&amp;lt;/script&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;lt;script type=&amp;#34;text/javascript&amp;#34; src=&amp;#34;jquery.tablesorter.js&amp;#34;&amp;gt;&amp;lt;/script&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;lt;script type=&amp;#34;text/javascript&amp;#34;&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$(document).ready(function() {
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; $(&amp;#34;#myTable&amp;#34;).tablesorter();
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; }
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;);
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;lt;/script&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;lt;/head&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;lt;body&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;lt;table id=&amp;#34;myTable&amp;#34; class=&amp;#34;tablesorter&amp;#34; border=&amp;#34;0&amp;#34; cellspacing=&amp;#34;1&amp;#34; cellpadding=&amp;#34;0&amp;#34;&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;lt;thead&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;lt;tr&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;lt;th&amp;gt;Sepal.Length&amp;lt;/th&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;lt;th&amp;gt;Sepal.Width&amp;lt;/th&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;lt;th&amp;gt;Petal.Length&amp;lt;/th&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;lt;th&amp;gt;Petal.Width&amp;lt;/th&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;lt;th&amp;gt;Species&amp;lt;/th&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;lt;/tr&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;lt;/thead&amp;gt;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;</description></item><item><title>R で家系図を書く</title><link>https://catway-jp.pages.dev/bioinformatics/vis/familytree.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/vis/familytree.html</guid><description>&lt;p&gt;まず次のようなデータ familytree.csv を作成する。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;#34;ped&amp;#34;,&amp;#34;id&amp;#34;,&amp;#34;father&amp;#34;,&amp;#34;mother&amp;#34;,&amp;#34;sex&amp;#34;,&amp;#34;affected&amp;#34;,&amp;#34;avail&amp;#34;,&amp;#34;firstname&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,101,0,0,1,0,0,&amp;#34;hoge1&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,102,0,0,2,1,0,&amp;#34;hoge2&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,103,135,136,1,1,0,&amp;#34;hoge3&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,104,0,0,2,0,0,&amp;#34;hoge4&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,105,0,0,1,NA,0,&amp;#34;hoge5&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,106,0,0,2,NA,0,&amp;#34;hoge6&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,107,0,0,1,1,0,&amp;#34;hoge7&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,108,0,0,2,0,0,&amp;#34;hoge8&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,109,101,102,2,0,1,&amp;#34;hoge9&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,110,103,104,1,1,1,&amp;#34;hoge10&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,111,103,104,2,1,0,&amp;#34;hoge11&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,112,103,104,1,1,0,&amp;#34;hoge12&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,113,0,0,2,0,1,&amp;#34;hoge13&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,114,103,104,1,1,0,&amp;#34;hoge14&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,115,105,106,2,0,0,&amp;#34;hoge15&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,116,105,106,2,1,1,&amp;#34;hoge16&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,117,0,0,1,1,0,&amp;#34;hoge17&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,118,105,106,2,1,1,&amp;#34;hoge18&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,119,105,106,1,1,1,&amp;#34;hoge19&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,120,107,108,2,0,0,&amp;#34;hoge20&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,121,110,109,1,1,0,&amp;#34;hoge21&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,122,110,109,2,0,0,&amp;#34;hoge22&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,123,110,109,2,0,0,&amp;#34;hoge23&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,124,110,109,1,1,1,&amp;#34;hoge24&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,125,112,118,2,0,1,&amp;#34;hoge25&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,126,112,118,2,0,1,&amp;#34;hoge26&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,127,114,115,1,1,1,&amp;#34;hoge27&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,128,114,115,1,1,1,&amp;#34;hoge28&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,129,117,116,1,0,1,&amp;#34;hoge29&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,130,119,120,1,0,1,&amp;#34;hoge30&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,131,119,120,1,1,0,&amp;#34;hoge31&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,132,119,120,1,0,0,&amp;#34;hoge32&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,133,119,120,2,0,1,&amp;#34;hoge33&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,134,119,120,2,1,0,&amp;#34;hoge34&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,135,0,0,1,NA,0,&amp;#34;hoge35&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,136,0,0,2,NA,0,&amp;#34;hoge36&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,137,0,0,1,NA,0,&amp;#34;hoge37&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,138,135,136,2,NA,0,&amp;#34;hoge38&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,139,137,138,1,1,0,&amp;#34;hoge39&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,140,137,138,2,0,1,&amp;#34;hoge40&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;1,141,137,138,2,0,1,&amp;#34;hoge41&amp;#34;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;次に famillytree.R を作成する。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;library(&amp;#34;kinship2&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;# get data filename from command option
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;args &amp;lt;- commandArgs(TRUE)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;file &amp;lt;- args[1]
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;# make pdf file name
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;pdf.file &amp;lt;- sub(&amp;#34;.csv&amp;#34;, &amp;#34;.pdf&amp;#34;, file)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;# load data from data file
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sample.ped &amp;lt;- read.csv(file, header=T)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;# make pedigree object
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;pedAll &amp;lt;- pedigree(
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; id = sample.ped$id,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; dadid = sample.ped$father,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; momid = sample.ped$mother,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; sex = sample.ped$sex,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; famid = sample.ped$ped
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;# get a family
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ped1basic &amp;lt;- pedAll[&amp;#34;1&amp;#34;]
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;# make id strings
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ids &amp;lt;- paste(sample.ped$id, sample.ped$firstname, sep =&amp;#34;\n&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;# plot and save pdf file
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;pdf(pdf.file)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;plot(ped1basic, id = ids, status = sample.ped$avail, 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; affected = sample.ped$affected, cex = 0.7)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;dev.off()&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;実行する。&lt;/p&gt;</description></item><item><title>reference transcriptome</title><link>https://catway-jp.pages.dev/bioinformatics/RNA-Seq/reference_transcriptome.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/RNA-Seq/reference_transcriptome.html</guid><description>&lt;p&gt;Reference transcriptomeについての論文&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a href="http://www.biomedcentral.com/1471-2164/16/S8/S2" target="_blank" rel="noreferrer"&gt;Comparison of GENCODE and RefSeq gene annotation and the impact of reference geneset on variant effect prediction&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="http://www.biomedcentral.com/1471-2164/16/97/abstract" target="_blank" rel="noreferrer"&gt;A comprehensive evaluation of ensembl, RefSeq, and UCSC annotations in the context of RNA-seq read mapping and gene quantification&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;</description></item><item><title>RNA-seq データからの rRNA除去</title><link>https://catway-jp.pages.dev/bioinformatics/RNA-Seq/rrna.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/RNA-Seq/rrna.html</guid><description>&lt;p&gt;ここではリファレンスゲノムへのマッピングした bam file から、bedtools のなかの intersectBed を利用して、 rRNA 配列を除く方法を述べる。-abam は入力ファイル形式を、-b は除くべきゲノム領域を記載した bed file を指定する。ここでは rRNA 遺伝子が存在するゲノム領域の bed fileである。-v は -b で指定した領域に含まれないものだけ出力するという意味である。 grep -v を思い浮べると良いだろう。&lt;/p&gt;
&lt;p&gt;RNA-seq は mRNAを転写量を定量するのが目的である。しかし、RNA-seq のデータには rRNA 由来の配列が含まれる。そもそも抽出した Total RNA には 99 %程度の rRNA が含まれてしまう。これを分子生物学実験的に取り除いてはいるが、そもそもrRNAが大量にあるため、除去効率が高くても多少の rRNA が残る。rRNAが残ってしまうと、その分シーケンスリードが割かれてしまうため、mRNAの転写量や構造予測をするために必要な有効シーケンスリード数に届かない遺伝子が出てくる可能性がある。よってrRNAが含まれてしまった量を定量することはサンプルの評価に重要である。&lt;/p&gt;
&lt;p&gt;使い方&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ intersectBed -abam input.bam -b rRNA.ucsc.mm9.bed -v &amp;gt; output.bam&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;</description></item><item><title>RNA-seqのリードをHISAT2でゲノムへ高速にマッピングする</title><link>https://catway-jp.pages.dev/bioinformatics/RNA-Seq/HISAT.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/RNA-Seq/HISAT.html</guid><description>&lt;p&gt;HISAT2はTophat2の実装をしていた人が新しく開発した、高速でメモリ使用量の少ないRNA-seq用のマッピングツール。
まず、リファレンスゲノムのHISAT用のインデックスファイルを、ダウンロードする。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;wget ftp://ftp.ccb.jhu.edu/pub/data/hisat_indexes/mm10_hisat.tar.gz
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;tar zxvf mm10_hisat.tar.gz&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;*.bt2というファイルが&lt;code&gt;mm10_hisa&lt;/code&gt;以下に解凍される。&lt;/p&gt;
&lt;p&gt;自分でインデックスを作るには以下の通り。例は Ensemblからニワトリのゲノムを落してインデックスを作成している。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;wget ftp://ftp.ensembl.org/pub/release-83/fasta/gallus_gallus/dna/Gallus_gallus.Galgal4.dna_rm.toplevel.fa.gz
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;gzip -d Gallus_gallus.Galgal4.dna_rm.toplevel.fa.gz
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;hisat2-build Gallus_gallus.Galgal4.dna_rm.toplevel.fa Gallus_gallus.Galgal4.dna_rm.toplevel&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;次に HISAT2 を用意しセットアップする。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;wget http://www.ccb.jhu.edu/software/hisat/downloads/hisat-0.1.6-beta-Linux_x86_64.zip
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;unzip zxvf hisat-0.1.6-beta-Linux_x86_64.zip&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;実行する。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;hisat2 -p 12 -q -x gallus_gallus.Galgal4.dna_rm.toplevel -U &amp;lt;(gzip -dc test.fastq.gz) -S test.sam&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;

&lt;h2 class="relative group"&gt;あとは samtools で bam にすればよい。
 &lt;div id="あとは-samtools-で-bam-にすればよい" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%81%82%e3%81%a8%e3%81%af-samtools-%e3%81%a7-bam-%e3%81%ab%e3%81%99%e3%82%8c%e3%81%b0%e3%82%88%e3%81%84" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;2015/02/08&lt;/p&gt;</description></item><item><title>RNA-seqのリードをSTARでゲノムへ高速にマッピングする</title><link>https://catway-jp.pages.dev/bioinformatics/RNA-Seq/STAR.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/RNA-Seq/STAR.html</guid><description>&lt;p&gt;STARは高速なRNA-seq用のマッピングツール。&lt;/p&gt;

&lt;h3 class="relative group"&gt;インストール
 &lt;div id="インストール" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%82%a4%e3%83%b3%e3%82%b9%e3%83%88%e3%83%bc%e3%83%ab" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;p&gt;まずSTARをインストールする。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;git clone git@github.com:alexdobin/STAR.git
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;make STAR&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;マニュアルのPDFも作りたい場合は以下のコマンドを入力する。ただし latexmk がいる。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;make manual&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;マニュアルのPDFは以下に落ちているので必須ではない。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a href="https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf" target="_blank" rel="noreferrer"&gt;STAR Manual&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 class="relative group"&gt;使い方
 &lt;div id="使い方" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e4%bd%bf%e3%81%84%e6%96%b9" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;

&lt;h2 class="relative group"&gt;(つづく)
 &lt;div id="つづく" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%81%a4%e3%81%a5%e3%81%8f" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;2015/01/10&lt;/p&gt;</description></item><item><title>RNA-Seqのトランスクリプトへのリードカバレッジを確認する</title><link>https://catway-jp.pages.dev/bioinformatics/RNA-Seq/RNA-Seq_coverage.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/RNA-Seq/RNA-Seq_coverage.html</guid><description>&lt;p&gt;RNA-Seq のリードがどのぐらい遺伝子領域をカバーしているかを確認する。これにより、RNA-Seqのライブラリ作成で、どの程度までRNAが捉えられているか確認できる。
シーケンスやライブラリ作成の原理や実験上の問題により3&amp;rsquo;や5&amp;rsquo;端にカバレッジが偏る場合がある。
Whole Transcript Amplification (WTA) をする場合、オリゴdTによる逆転写を利用していれば
3&amp;rsquo;端に偏る場合がある。実験の狙い通りのカバレッジになっているかを確認することで実験の質を
判断できる。&lt;/p&gt;
&lt;p&gt;ここでは、RSeQC の genebody_coverage.py を利用する。&lt;/p&gt;

&lt;h3 class="relative group"&gt;インストールする
 &lt;div id="インストールする" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%82%a4%e3%83%b3%e3%82%b9%e3%83%88%e3%83%bc%e3%83%ab%e3%81%99%e3%82%8b" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ tar zxvf RSeQC-2.4.tar.gz
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ cd RSeQC-VERSION
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ python setup.py install
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ export PYTHONPATH=/home/user/lib/python2.7/site-packages:$PYTHONPATH
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ export PATH=/home/user/bin:$PATH&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;以下のコマンドでエラーがでなければインストールに成功している。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ python -c &amp;#39;from qcmodule import SAM&amp;#39;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;</description></item><item><title>Rから Refseq や UniProt-KBの情報を高速に検索する</title><link>https://catway-jp.pages.dev/bioinformatics/etc/genesearchr.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/etc/genesearchr.html</guid><description>&lt;p&gt;ここでは、R package の genesearchR を使って、NCBI RefSeq と UniProt-KB の全文検索を高速に行う
方法を述べます。&lt;/p&gt;

&lt;h3 class="relative group"&gt;インストール
 &lt;div id="インストール" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%82%a4%e3%83%b3%e3%82%b9%e3%83%88%e3%83%bc%e3%83%ab" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;p&gt;Rを起動します。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sudo R&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;関連するパッケージをインストールします。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-r" data-lang="r"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#268bd2"&gt;source&lt;/span&gt;(&lt;span style="color:#2aa198"&gt;&amp;#34;http://bioconductor.org/biocLite.R&amp;#34;&lt;/span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#268bd2"&gt;biocLite&lt;/span&gt;(&lt;span style="color:#2aa198"&gt;&amp;#34;GenomicRanges&amp;#34;&lt;/span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#268bd2"&gt;install.packages&lt;/span&gt;(&lt;span style="color:#2aa198"&gt;&amp;#34;devtools&amp;#34;&lt;/span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#268bd2"&gt;install.packages&lt;/span&gt;(&lt;span style="color:#2aa198"&gt;&amp;#34;roxygen2&amp;#34;&lt;/span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#268bd2"&gt;library&lt;/span&gt;(devtools)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#268bd2"&gt;install_github&lt;/span&gt;(&lt;span style="color:#2aa198"&gt;&amp;#34;genesearchr&amp;#34;&lt;/span&gt;, &lt;span style="color:#2aa198"&gt;&amp;#34;dritoshi&amp;#34;&lt;/span&gt;)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;

&lt;h3 class="relative group"&gt;使い方
 &lt;div id="使い方" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e4%bd%bf%e3%81%84%e6%96%b9" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-r" data-lang="r"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#268bd2"&gt;library&lt;/span&gt;(&lt;span style="color:#2aa198"&gt;&amp;#34;genesearchr&amp;#34;&lt;/span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#586e75"&gt;## RefSeq&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;my.hs.gene &lt;span style="color:#719e07"&gt;&amp;lt;-&lt;/span&gt; &lt;span style="color:#268bd2"&gt;refSeqSearch&lt;/span&gt;(query &lt;span style="color:#719e07"&gt;=&lt;/span&gt; &lt;span style="color:#2aa198"&gt;&amp;#34;NM_001518&amp;#34;&lt;/span&gt;, species &lt;span style="color:#719e07"&gt;=&lt;/span&gt; &lt;span style="color:#2aa198"&gt;&amp;#34;hs&amp;#34;&lt;/span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;my.mm.gene &lt;span style="color:#719e07"&gt;&amp;lt;-&lt;/span&gt; &lt;span style="color:#268bd2"&gt;refSeqSearch&lt;/span&gt;(query &lt;span style="color:#719e07"&gt;=&lt;/span&gt; &lt;span style="color:#2aa198"&gt;&amp;#34;homeobox&amp;#34;&lt;/span&gt;, species &lt;span style="color:#719e07"&gt;=&lt;/span&gt; &lt;span style="color:#2aa198"&gt;&amp;#34;mm&amp;#34;&lt;/span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#586e75"&gt;## UniProt-KB&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;my.gid.gene &lt;span style="color:#719e07"&gt;&amp;lt;-&lt;/span&gt; &lt;span style="color:#268bd2"&gt;uniprotSearch&lt;/span&gt;(query &lt;span style="color:#719e07"&gt;=&lt;/span&gt; &lt;span style="color:#2aa198"&gt;&amp;#34;GeneID:93986&amp;#34;&lt;/span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;my.eco.gene &lt;span style="color:#719e07"&gt;&amp;lt;-&lt;/span&gt; &lt;span style="color:#268bd2"&gt;uniprotSearch&lt;/span&gt;(query &lt;span style="color:#719e07"&gt;=&lt;/span&gt; &lt;span style="color:#2aa198"&gt;&amp;#34;eco:b2699&amp;#34;&lt;/span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#586e75"&gt;## Genome DNA Sequence&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;my.mm10.dna &lt;span style="color:#719e07"&gt;&amp;lt;-&lt;/span&gt; &lt;span style="color:#268bd2"&gt;genomeSearch&lt;/span&gt;(query &lt;span style="color:#719e07"&gt;=&lt;/span&gt; &lt;span style="color:#2aa198"&gt;&amp;#34;TTCATTGACAACATTGCGT&amp;#34;&lt;/span&gt;, db &lt;span style="color:#719e07"&gt;=&lt;/span&gt; &lt;span style="color:#2aa198"&gt;&amp;#34;mm10&amp;#34;&lt;/span&gt;, k &lt;span style="color:#719e07"&gt;=&lt;/span&gt; &lt;span style="color:#2aa198"&gt;2&lt;/span&gt;)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;

&lt;h4 class="relative group"&gt;Search オプション
 &lt;div id="search-オプション" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#search-%e3%82%aa%e3%83%97%e3%82%b7%e3%83%a7%e3%83%b3" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h4&gt;
&lt;p&gt;検索ワードの指定の仕方は以下のサイトを参考にしてください。&lt;/p&gt;</description></item><item><title>Rでマゼンタ-黒-緑になるバリアフリーなカラーパレットを生成する</title><link>https://catway-jp.pages.dev/bioinformatics/vis/rmagentagreen.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/vis/rmagentagreen.html</guid><description>&lt;p&gt;バリアフリーなヒートマップを描くために、マゼンタ-黒-緑のカラーパレットが使いたかったのですが、R でどうやって良いのかわからなかったので自作しました。簡単な方法を知っている人がいれば教えてください。&lt;/p&gt;

&lt;h3 class="relative group"&gt;colorRampPalette を使う
 &lt;div id="colorramppalette-を使う" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#colorramppalette-%e3%82%92%e4%bd%bf%e3%81%86" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;m2b2g &amp;lt;- colorRampPalette(c(&amp;#34;#EC008C&amp;#34;, &amp;#34;black&amp;#34;, &amp;#34;green&amp;#34;))
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;pie(rep(1,50), col=m2b2g(50))&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;

&lt;h3 class="relative group"&gt;gplots を使う
 &lt;div id="gplots-を使う" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#gplots-%e3%82%92%e4%bd%bf%e3%81%86" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;library(gplots)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;m2b2g &amp;lt;- colorpanel(50, low=&amp;#34;magenta&amp;#34;, mid=&amp;#34;black&amp;#34;, high=&amp;#34;green&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;pie(rep(1,50), col=m2b2g)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;</description></item><item><title>Rで遺伝子構造を描く</title><link>https://catway-jp.pages.dev/bioinformatics/vis/genomegraphs.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/vis/genomegraphs.html</guid><description>&lt;p&gt;超並列DNAシーケンサーの登場で、遺伝子構造など、ゲノム上のイベントやオブジェクトのデータを大量に得ることができるようになってきました。データ解析にとって可視化は重要ですが、ゲノム上で起きているイベントなので、ゲノム上に配置して可視化したい場面がよくでてきます。しかし、さまざまなゲノム上のオブジェクトをゲノム座標から画像座標に変換して、絵を書くのは意外と面倒な作業です。&lt;/p&gt;
&lt;p&gt;例えば遺伝子構造の絵を書こうとします。これは、遺伝子構造をどのように入手するか、遺伝子構造をどのように描くか、の2つの問題に分けることができます。ここでは、遺伝子構造のデータは、R + Bioconductor の biomaRt パッケージを使って、Ensembl Biomart からダウンロードすることで解決します。遺伝子構造をどのように描くかについては、GenomeGraphs パッケージを利用します。&lt;/p&gt;
&lt;p&gt;まずはインストールします。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ sudo R
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; source(&amp;#34;http://www.bioconductor.org/biocLite.R&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; biocLite(&amp;#34;biomaRt&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; biocLite(&amp;#34;GenomeGraphs&amp;#34;)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;ここでは、Ensembl biomart からヒトの SMN1 という splicing 異常によって疾患になる例が知られている遺伝子名(Gene symbol)の遺伝子構造を描きます。&lt;/p&gt;
&lt;p&gt;まず、SMN1 という名前から、Ensembl Gene ID と染色体位置などを入手します。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;library(GenomeGraphs)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;library(biomaRt)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;gene.symbol &amp;lt;- &amp;#34;SMN1&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;png.file &amp;lt;- paste(gene.symbol, &amp;#34;.png&amp;#34;, sep = &amp;#34;&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## construct an object of Human Ensembl Biomart
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;human &amp;lt;- useMart(biomart = &amp;#34;ensembl&amp;#34;, dataset = &amp;#34;hsapiens_gene_ensembl&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;gene &amp;lt;- getBM(
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; attributes = c(&amp;#39;hgnc_symbol&amp;#39;, &amp;#39;ensembl_gene_id&amp;#39;, &amp;#39;chromosome_name&amp;#39;),
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; filters = &amp;#39;hgnc_symbol&amp;#39;,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; values = gene.symbol,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; mart = human
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ensgene.id &amp;lt;- gene[,2]
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;chr.num &amp;lt;- as.character(gene[,3])&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;次に、Ensembl Gene ID から Ensembl Gene の構造情報(染色体名とその exon/intron の位置) を入手します。また、これに対応する Ensembl Transcript のリストとその構造も入手します。&lt;/p&gt;</description></item><item><title>sailfishでアライメントなしに高速に発現定量する</title><link>https://catway-jp.pages.dev/bioinformatics/RNA-Seq/sailfish.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/RNA-Seq/sailfish.html</guid><description>&lt;h3 class="relative group"&gt;インストール
 &lt;div id="インストール" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%82%a4%e3%83%b3%e3%82%b9%e3%83%88%e3%83%bc%e3%83%ab" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;p&gt;sailfish は実行可能なバイナリ形式の配布があるが、ここではソースコードからコンパイルする方法を述べる。&lt;/p&gt;
&lt;p&gt;まずは boost をインストールする。
boost とはプログラミング言語C++のライブラリで、sailfish はこのライブラリの機能を利用しているため、事前にインストールしておく必要がある。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;wget http://downloads.sourceforge.net/project/boost/boost/1.60.0/boost_1_60_0.tar.bz2
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;tar jxvf boost_1_60_0.tar.bz2
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;./bootstrap.sh --prefix=/home/itoshi/opt/local
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;./b2 install&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;次に sailfish をインストールする。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;git clone git@github.com:kingsfordgroup/sailfish.git
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;cd sailfish
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;mkdir build
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;cd build
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;cmake -DBOOST_ROOT=/home/itoshi/opt -DCMAKE_INSTALL_PREFIX=/home/itoshi/opt/local ..&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;</description></item><item><title>samtools で sam/bam ファイルを操作する</title><link>https://catway-jp.pages.dev/bioinformatics/qc/samtools.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/qc/samtools.html</guid><description>&lt;p&gt;samファイルはシーケンスリードがゲノムのどの位置にあるかを記述するファイル形式であり、様々なシーケンス解析のツールで利用されている。samファイルはテキスト形式のデータであり、ファイルサイズが大きくなったり、ソフトウェアから効率的に個々のデータにアクセスすることが難しい。そこでbam形式というバイナリ形式のファイルを作成することで、ファイルサイズの縮小、アクセスの高速化、リードのゲノム座標でのソートによるアクセスの効率化が期待できる。bai形式は bam のインデックスファイルで、このファイルをプログラムが参照することで、効率的に bam file にアクセスできる。&lt;/p&gt;

&lt;h3 class="relative group"&gt;samtools 1.x 系のインストール
 &lt;div id="samtools-1x-系のインストール" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#samtools-1x-%e7%b3%bb%e3%81%ae%e3%82%a4%e3%83%b3%e3%82%b9%e3%83%88%e3%83%bc%e3%83%ab" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;p&gt;HTSlibが必要なので先にインストールする。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;wget https://github.com/samtools/htslib/releases/download/1.3/htslib-1.3.tar.bz2
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;tar jxvf htslib-1.3.tar.bz2
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;cd htslib-1.3
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;./configure --prefix=$HOME/opt/local
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;make 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;make install
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;export LD_LIBRARY_PATH=$HOME/opt/local/lib:$$LD_LIBRARY_PATH # 必要なら&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;次に samtools をインストールする。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;wget https://github.com/samtools/samtools/releases/download/1.3/samtools-1.3.tar.bz2
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;tar jxvf samtools-1.3.tar.bz2
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;cd samtools-1.3
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;./configure --prefix=$HOME/opt/local
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;make 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;make install
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;export PATH=$HOME/opt/local/bin:$$PATH # 必要なら&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;

&lt;h3 class="relative group"&gt;sam を bam に変換し index を作成する
 &lt;div id="sam-を-bam-に変換し-index-を作成する" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#sam-%e3%82%92-bam-%e3%81%ab%e5%a4%89%e6%8f%9b%e3%81%97-index-%e3%82%92%e4%bd%9c%e6%88%90%e3%81%99%e3%82%8b" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;p&gt;シーケンスリードのゲノムマッピングツールであるbowtie2や HISAT2, Tophat もsamファイルを出力する。これをbam形式変換するには、samtoolsを利用することで簡単にできる。&lt;/p&gt;</description></item><item><title>summit からのモチーフまでの距離分布を描く</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/summitdist.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/summitdist.html</guid><description>&lt;p&gt;summit からモチーフまでの距離を計算し、そのヒストグラムを描く。もしChIPに関係のないモチーフ配列の場合、その分布は一様分布になるはずである。しかし、実際に結合に関与しているモチーフ配列ならばその分布はsubmitにその平均値を持つ正規分布になると考えあれる。ここではMACS2の summit のデータからこのモチーフ分布を描く。以下のコードでは、Peak を上流下流に延長した場合のことは考慮されていないことに注意。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## Load summit data
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;oct4.sm.df &amp;lt;- read.table(&amp;#34;results/macs2/Oct4_summits.bed&amp;#34;, header=F)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sox2.sm.df &amp;lt;- read.table(&amp;#34;results/macs2/Sox2_summits.bed&amp;#34;, header=F)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;oct4.sm.gr &amp;lt;- BED2RangedData(oct4.sm.df, header=FALSE)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sox2.sm.gr &amp;lt;- BED2RangedData(sox2.sm.df, header=FALSE)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## calc. distance between motif event and summit
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;num.peaks &amp;lt;- length(oct4.motif.search.fwd)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;oct4.motif.summit.dist &amp;lt;- rep(0, num.peaks)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;summit.on.peak &amp;lt;- start(oct4.sm.gr) - start(oct4.gr)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;num.peaks &amp;lt;- length(oct4.motif.search.fwd)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;num &amp;lt;- 0
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;oct4.motif.summit.dist &amp;lt;- 0
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;for (peak in 1:num.peaks) {
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; if (! identical(start(oct4.motif.search.fwd[[peak]]), integer(0))) {
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; dists &amp;lt;- start(oct4.motif.search.fwd[[peak]]) - summit.on.peak[peak]
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; if (length(dists) == 1) {
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; num &amp;lt;- num + 1
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; oct4.motif.summit.dist[num] &amp;lt;- dists
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; } else if (length(dists) &amp;gt; 1) {
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; for(i in 1:length(dists)) {
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; num &amp;lt;- num + 1
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; oct4.motif.summit.dist[num] &amp;lt;- dists[i]
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; }
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; }
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; } 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;}
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;pdf(&amp;#34;results/oct4.motifdist.pdf&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;plot(density(oct4.motif.summit.dist), main=&amp;#34;Motif distribution (m1)&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;dev.off()&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;</description></item><item><title>TopHatでRNA-seq のデータをリファレンスゲノムへマッピングする</title><link>https://catway-jp.pages.dev/bioinformatics/RNA-Seq/tophat.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/RNA-Seq/tophat.html</guid><description>&lt;p&gt;RNA-seq で読まれるシーケンスリードはスプライシング後の配列である。そのためリファレンスゲノムにマッピングするときには、リードがスプライスされる部分(スプライスジャンクション)を跨ぐことが多々ある。そのためジャンクションを考慮したマッピングが求められる。一般に spliced mapping と呼ばれる。
TopHat は良く使われる spliced alignment に対応したマッピングソフトである。ここでは、TopHat を用いて、fastq file に保存されたリードをリファレンスゲノムにマップする方法について述べる。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ tophat -p 8 -r 100 -o output_dir bowtie2_indexes/mm9 input_1.fastq input_2.fastq&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;Paired end の場合は2つの fastq file を順に指定する。また、paired-end の場合は、-r を使う。これは、シーケンスされたリード間にどのぐらいの長さDNAがあるかを base pair で指定する。これはシーケンスライブラリを作成するときに、生物学的実験によって設定されているものである。そのため実験担当者に事前に問い合わせておくべきである。具体的には、Agilent社のBioAnalyzerでDNA断片の分布と平均が得られている。またシーケンスを何bpしたのかも聞いておく(これは fastq をみればわかるが)。&lt;/p&gt;
&lt;p&gt;-r に指定する数値を計算する方法を述べる。例えば、典型的なライブラリでは、300 bp のDNA断片からライブラリを作成するが、これを 50 bp の Paired-end でシーケンスすると、その間にあるDNAの長さは 200 bp である。よって、-r 200 と指定する。&lt;/p&gt;
&lt;p&gt;indexs/mm9 でははリファレンスゲノム配列が検索しやすようインデックス化されたファイルを指定している。これは &lt;a href="http://bowtie-bio.sourceforge.net/" target="_blank" rel="noreferrer"&gt;bowtie&lt;/a&gt;に含まれる bowtie-build で行う。TopHat はマッピングの計算の部分には、Bowtie を利用している。-p には CPU core の数を指定することで、その数だけ並列計算が可能になる。&lt;/p&gt;
&lt;p&gt;TopHat のデフォルトでは、ひとつのリードが複数箇所にマップされる場合は、mapping socre の高い順に 20 箇所まで許される設定になっている。best なスコアで、一箇所 (unique) にマッピングされるようにするには、-g 1 と指定する。一般的にはマルチヒットを許したほうが発現定量の値が良くなることが知られている。&lt;/p&gt;</description></item><item><title>UCSCとEnsemblの染色体番号の表記の違いについて</title><link>https://catway-jp.pages.dev/bioinformatics/etc/notation_chr.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/etc/notation_chr.html</guid><description>&lt;p&gt;UCSCの染色体番号の表記法では、chr1, chr2 のように chr が付く。ゲノムシーケンスやアセンブルが荒いと、どの染色体にも割り当てられなかったコンティグがでてきる。
これは、XXX.1みたいになる。&lt;/p&gt;
&lt;p&gt;Ensemblは、chrがつかないで、1, 2, 3, &amp;hellip;, X のようになる。またコンティグは、Un_* のようになる。末尾に *.1はつかない。&lt;/p&gt;
&lt;p&gt;これがどのようなときに問題になるか。まず、Ensembl と UCSC どちらのゲノム配列を利用して解析しているかを意識する必要がある。例えば、bowtie, tophat などでマッピングするときに、どちらのゲノムを使うかによって、bam/sam の染色体名の表記の仕方が決まる。これはそれぞれで配布されている fasta file の
ヘッダーに書いてある染色体番号の表記に従うからだ。&lt;/p&gt;
&lt;p&gt;次に、アノテーションファイル(bedやgtfなど)をどこから手にいれたかによっても異なる。Biomart や Ensembl から落すと、chr はつかない、いわゆる、ensembl 方式の表記になる。
しかし、UCSCのアノテーションを落してくると、UCSC形式になる。&lt;/p&gt;
&lt;p&gt;なので、bam とアノテーションファイルで表記が違うものを使っていると、そんな染色体はないよ、というエラーになる。また、ツールによって、どちらかの表記を前提にしている、ということは少ないかもしれないが、注意が必要。&lt;/p&gt;
&lt;p&gt;これを修正するには、アノテーションファイルかbam/samの染色体表記を修正する必要がある。めんどくさい。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a href="http://hgdownload.soe.ucsc.edu/downloads.html" target="_blank" rel="noreferrer"&gt;UCSCのゲノムやアノテーション&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="http://www.ensembl.org/Homo_sapiens/Info/Index" target="_blank" rel="noreferrer"&gt;Ensemblのゲノム(dna)や遺伝子アノテーション(cdna)&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;</description></item><item><title>Vagrant を使って Bioconductor Devel の解析・開発環境をAWSに構築する</title><link>https://catway-jp.pages.dev/bioinformatics/etc/biocdevelonaws.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/etc/biocdevelonaws.html</guid><description>&lt;h3 class="relative group"&gt;vagrant のインストール
 &lt;div id="vagrant-のインストール" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#vagrant-%e3%81%ae%e3%82%a4%e3%83%b3%e3%82%b9%e3%83%88%e3%83%bc%e3%83%ab" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;p&gt;&lt;a href="http://www.vagrantup.com/" target="_blank" rel="noreferrer"&gt;http://www.vagrantup.com/&lt;/a&gt; から dmg ダウンロードし、インストールする。&lt;/p&gt;

&lt;h3 class="relative group"&gt;vargrant をセットアップする
 &lt;div id="vargrant-をセットアップする" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#vargrant-%e3%82%92%e3%82%bb%e3%83%83%e3%83%88%e3%82%a2%e3%83%83%e3%83%97%e3%81%99%e3%82%8b" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;p&gt;aws にプロビジョニングできるプラグインをインストールする。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ vagrant plugin install vagrant-aws&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;AMIを起動するとは言え、ダミーの仮想マシンが必要。ちょっとわかりにくい。
$ vagrant box add dummy &lt;a href="https://github.com/mitchellh/vagrant-aws/raw/master/dummy.box" target="_blank" rel="noreferrer"&gt;https://github.com/mitchellh/vagrant-aws/raw/master/dummy.box&lt;/a&gt;&lt;/p&gt;

&lt;h3 class="relative group"&gt;Vagrantfile を作る
 &lt;div id="vagrantfile-を作る" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#vagrantfile-%e3%82%92%e4%bd%9c%e3%82%8b" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;p&gt;Bioconductor 公式のBioC-Devel入りの AMI を利用する。リージョンはバージニアだけ。知る必要はないがアカウント名は root です。&lt;/p&gt;
&lt;p&gt;まず適当なディレクトリを作る。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ mkdir bioc-devel
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ cd bioc-devel&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;初期化する。&lt;/p&gt;</description></item><item><title>アダプター配列除去 FASTX_Toolkit fastx_clipper</title><link>https://catway-jp.pages.dev/bioinformatics/qc/removeseq.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/qc/removeseq.html</guid><description>&lt;p&gt;short-read な FASTQ/A をいろいろいぢるツール群である FASTX_Toolkit に含まれるコマンドのひとつである fastx_clipper。(→トリムしたい場所が決まっている場合は fastx_trimmer を使う)。後に紹介する Galaxy に組み込み済みである。ちなみにそれぞれのコマンドの動作は Galaxy 内の解説にある図を見るのが良い。&lt;/p&gt;
&lt;p&gt;インストール:
まず、http://hannonlab.cshl.edu/fastx_toolkit/download.html からpre-compiled binary 版を落して、/usr/local/bin などに入れる PATH を通す。本体とは別に実行に必要とされるプログラムは、libgtextutils-0.6, PerlIO::gzip, GD::Graph::bars, gnuplot version 4.2 or newer であるので、事前に入れておく。-l でリードの最小サイズ、-M で一致する最小の長さを指定する。illumina CASAVA 1.8 以降の FASTQ や Sanger FASTQ には -Q 33 を指定する。それ以前で illumina 1.3 以降の FASTQ の場合は、-Q 64 を指定すること。トリムした配列だけ出力するには -C を、trim されなかった配列を出力するには、-c を指定する。なにも指定しなければ、両方が表示される。&lt;/p&gt;
&lt;p&gt;使いかた:&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ fastx_clipper -l 18 -M 12 -Q 33 -v -i input.fastq -a ACACTCTTTCCCTACACGACGCTGTTCCATCT -o output.fastq &amp;gt; input.fastq.log&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;

&lt;h2 class="relative group"&gt;アダプター除去 TagDust
 &lt;div id="アダプター除去-tagdust" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%82%a2%e3%83%80%e3%83%97%e3%82%bf%e3%83%bc%e9%99%a4%e5%8e%bb-tagdust" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h2&gt;
&lt;p&gt;概要
理研OSCで開発されたシーケンスアダプター配列除去ソフト。入出力形式は fastq/a が使える。アダプター配列を multi fasta 形式で入力できるのが地味に便利である。なぜなら複数のアダプタ/プライマーを1回の実行で除去できるためである。これに対応しているものがなかなかない。アダプター/プライマー配列の検索には Muth–Manber algorithm (Approximate multiple string search) を利用している。FDRを調節することで除去の強さを指定できる。ライセンスはGPL3&lt;/p&gt;</description></item><item><title>シーケンスリードのカバレッジ(被覆率)を計算する</title><link>https://catway-jp.pages.dev/bioinformatics/qc/coverage.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/qc/coverage.html</guid><description>&lt;h3 class="relative group"&gt;bedtools で計算する方法 (bam を bed形式に変換する)
 &lt;div id="bedtools-で計算する方法-bam-を-bed形式に変換する" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#bedtools-%e3%81%a7%e8%a8%88%e7%ae%97%e3%81%99%e3%82%8b%e6%96%b9%e6%b3%95-bam-%e3%82%92-bed%e5%bd%a2%e5%bc%8f%e3%81%ab%e5%a4%89%e6%8f%9b%e3%81%99%e3%82%8b" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;p&gt;bamからカバレッジを計算し、bedファイルを作成する。bedはテキストファイルなので、bamのサイズ(リード数)によっては、かなり巨大なファイルができる。遺伝子単位や限られたゲノム領域のみについて計算し、
自作のプログラムや表計算ソフトで、処理したいときになどに利用できる。全ゲノムレベルのカバレッジを計算し
たい場合は、bigwigへの変換をお勧めする。&lt;/p&gt;
&lt;p&gt;インストール&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ curl -O //github.com/arq5x/bedtools2/releases/download/v2.25.0/bedtools-2.25.0.tar.gz
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ tar zxvf bedtools-2.25.0.tar.gz
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ cd bedtools2/
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ make
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ cd ..
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ cp -a bedtools2 $HOME/opt/local&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;設定&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ emacs -nw ~/.zshenv
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;export PATH=$HOME/opt/local/bedtools/bin:$PATH
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ source ~/.zshenv&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;ここでは、bed ファイル (Pou5f1.bed) に記述された座標にマップされたリードのカバレッジを bam ファイルから(hoge.bam) 計算する。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ coverageBed -d -abam hoge.bam -b Pou5f1.bed &amp;gt; Pou5f1.TruRNA-Seq01.coverage.bed&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;

&lt;h3 class="relative group"&gt;RSeQCで計算する方法 (bam を wig に変換する)
 &lt;div id="rseqcで計算する方法-bam-を-wig-に変換する" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#rseqc%e3%81%a7%e8%a8%88%e7%ae%97%e3%81%99%e3%82%8b%e6%96%b9%e6%b3%95-bam-%e3%82%92-wig-%e3%81%ab%e5%a4%89%e6%8f%9b%e3%81%99%e3%82%8b" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;p&gt;wig file はカバレッジのデータを保存するためによく使われるファイル形式である。ここでは、bam から wig を計算する方法を述べる。RNA-seqデータのQuality checkのツール集&lt;a href="http://rseqc.sourceforge.net/" target="_blank" rel="noreferrer"&gt;RSeQC&lt;/a&gt;に
含まれる、&lt;code&gt;bam2wig.py&lt;/code&gt;を利用する。&lt;/p&gt;</description></item><item><title>シーケンスクオリティが低いのリードを除く</title><link>https://catway-jp.pages.dev/bioinformatics/qc/qualityscore.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/qc/qualityscore.html</guid><description>&lt;p&gt;シーケンスクオリティが低いリードを事前に除いておくことによって、リファレンスゲノムマッピングやアセンブルの精度や計算コストを軽減することができる。またそれらの解析の精度を純粋に評価するためにも、シーケンスクオリティの問題を分けるのが重要なことである。&lt;/p&gt;
&lt;p&gt;ここでは、FASTAX toolbox の fastq_quality_filtter を利用して、fastq file からクオリティが低いリードを除く。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ fastq_quality_filter -Q 33 -q 30 -p 75 -i input.fastq -o output.fastq&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;このコマンドでは、quality value が 30 以下の quality value がリード全長の 75% を下回ったときにそのリードを除く。-Q 33 は CASAVA 1.8 で作られた fastq file を扱うためのオプションである。&lt;/p&gt;
&lt;p&gt;Quality score については以下を参照せよ。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a href="http://en.wikipedia.org/wiki/FASTQ_format" target="_blank" rel="noreferrer"&gt;FASTQ format - Wikipedia&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;</description></item><item><title>ピーク内に頻出するDNAモチーフ配列を発見する</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/chipmotif.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/chipmotif.html</guid><description>&lt;p&gt;タンパク質がDNAに結合するときには、ある特定のDNA配列に結合することが知られている。ChIP-seq のピーク内には、ほとんどの場合、DNAとタンパク質が結合しているはずである。その領域のなかに、ほかの領域では見られないような、特徴的なDNA配列が発見できれば、それがDNA結合配列の候補となる。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; library(“rGADEM”)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; library(&amp;#34;BSgenome.Mmusculus.UCSC.mm9&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.seqs &amp;lt;- read.DNAStringSet(“results/oct4.peaksWithSeqs.fa”, &amp;#34;fasta&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.motif &amp;lt;- GADEM(oct4.seqs, verbose=1, genome=Mmulculs)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; nMotifs(oct4.motif)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;[1] 4
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; consensus(oct4.motif)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;[1] &amp;#34;ywTTswnATGCAAAT&amp;#34; &amp;#34;nyyyyyyyyCwsyyn&amp;#34; &amp;#34;sCwGswGrnrG&amp;#34; &amp;#34;sCCCCrCCCCm&amp;#34; 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.motif.pwms &amp;lt;- getPWM(oct4.motif)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.motif.pwms[[1]]&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;</description></item><item><title>ピーク内のゲノム配列をFASTA形式で得る</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/peakseq.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/peakseq.html</guid><description>&lt;p&gt;ピーク内のDNA配列を得ることができれば、ChIP-qPCRのような確認実験用の PCR primer を設計したり、配列に頻出するDNA motifを計算機で発見することに利用できる。ここでは、ChIPpeakAnno を利用した方法を述べる。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; library(“ChIPpeakAnno”)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; library(&amp;#34;BSgenome.Mmusculus.UCSC.mm9&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; oct4.peaksWithSeqs &amp;lt;- getAllPeakSequence(oct4.gr, upstream = 20, downstream = 20, genome = Mmusculus)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; write2FASTA(oct4.peaksWithSeqs, file=&amp;#34;resutls/oct4.peaksWithSeqs.fa&amp;#34;)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;ローカルディレクトリに oct4.peaksWithSeqs.fa が保存されている。&lt;/p&gt;</description></item><item><title>ピーク内の配列のなかから既知のDNAモチーフ配列を発見する</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/pwmsearch.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/pwmsearch.html</guid><description>&lt;p&gt;発見されたモチーフ配列をDNA配列に対して検索する方法を述べる。これを行うモチベーションはいくつか考えられるが、主な理由は、発見したモチーフがどのピークに含まれているか、いくつ含まれているかを知る、ということである。これによって、発見したモチーフ配列とピーク/遺伝子との関係を理解することができる。この方法は、既知のモチーフ配列を収集したデータベースの PWM をゲノム配列に検索する方法と全く同じである。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; hit.fwd &amp;lt;- matchPWM(oct4.motif.pwms$m1, oct4.seqs[[4]])
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; hit.rev &amp;lt;- matchPWM(reverseComplement(oct4.motif.pwms$m1), oct4.seqs[[4]])
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;## スコアを計算する
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; PWMscoreStartingAt(oct4.motif.pwms$m1, subject(hit.fwd), start(hit.fwd))
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt; PWMscoreStartingAt(oct4.motif.pwms$m1, subject(hit.rev), start(hit.rev))&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;matchPWM はフォワード鎖のみ検索することに注意。配列を reverseComplement() で逆相補鎖に変換する必要がある。hit.rev はヒットがないので、PWMscoreStartingAt() の戻り値は numeric(0) になる。&lt;/p&gt;
&lt;p&gt;複数のピーク内DNA配列に対して、まとめて検索するには以下のようにする&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;oct4.motif.search.fwd &amp;lt;- lapply( 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; oct4.seqs, 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; function(x) { 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; matchPWM(oct4.motif.pwms$m1, x) 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; } 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;) 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;oct4.motif.search.fwd.score &amp;lt;- lapply(
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; oct4.motif.search.fwd,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; function(hits) {
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; PWMscoreStartingAt(
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; oct4.motif.pwms$m1,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; subject(hits),
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; start(hits)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; )
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; }
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;</description></item><item><title>ゲノムのリピート領域にマッピングされたリードを除く</title><link>https://catway-jp.pages.dev/bioinformatics/qc/rmrepeat.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/qc/rmrepeat.html</guid><description>&lt;p&gt;ゲノムには大量のリピート配列が含まれておりヒト、マウスのゲノムはその約半分がリピートに関連した領域である。シーケンスされたリードをこのような領域にはマッピングすることは、その位置を一意に決めることができないので、困難である。一般的には、複数箇所にマップされるリードを、重複領域にランダムに配置する方法(リード数に応じて確率的に配置する方法が良いとされている)と、データからリピート領域を除いて解析を進める方法の2通りがある。転写因子の ChIP-seq ではリピート領域にかなり高いピークが形成され、正規化などのノイズになるため、リピート領域を最初から解析に含めない方法が取られることがある。この場合は、マッピング後、peak calling の前にこのような処理を行うことになる。&lt;/p&gt;
&lt;p&gt;方法は、RNA-seq データから rRNA を除く方法と同じである。&lt;/p&gt;</description></item><item><title>ジョブスケジューラによる分散計算</title><link>https://catway-jp.pages.dev/bioinformatics/etc/gridengine.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/etc/gridengine.html</guid><description>&lt;p&gt;共用計算機を利用して大量の計算を分散計算する方法や考えかた、マナーなどを述べる。ここではSun Grid Engine系のスケジューラを想定している。&lt;/p&gt;

&lt;h3 class="relative group"&gt;プライオリティの考えかた
 &lt;div id="プライオリティの考えかた" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%83%97%e3%83%a9%e3%82%a4%e3%82%aa%e3%83%aa%e3%83%86%e3%82%a3%e3%81%ae%e8%80%83%e3%81%88%e3%81%8b%e3%81%9f" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;ol start="0"&gt;
&lt;li&gt;共有リソースであるスパコンを、自分と他人がともに最大限実行できるよう配慮する&lt;/li&gt;
&lt;li&gt;速く計算が終わる人を優先する (1時間で終わる計算を数週間待たされるのは理不尽)&lt;/li&gt;
&lt;li&gt;計算時間が長いジョブはプライオリティを下げる (数週間かかる計算をさらに1時間待つことは可能)&lt;/li&gt;
&lt;/ol&gt;

&lt;h3 class="relative group"&gt;タブー
 &lt;div id="タブー" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%82%bf%e3%83%96%e3%83%bc" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;ul&gt;
&lt;li&gt;ジョブスケジューラを使わずに、計算ノードで計算する (リソース管理されなくなるので公平に計算機を利用できない)&lt;/li&gt;
&lt;li&gt;ジョブスケジューラを使わずに、ヘッド、ログインノードで計算しようとする (ログインに支障がでる)&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 class="relative group"&gt;ジョブの操作
 &lt;div id="ジョブの操作" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%82%b8%e3%83%a7%e3%83%96%e3%81%ae%e6%93%8d%e4%bd%9c" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;

&lt;h4 class="relative group"&gt;インタラクティブなプログラムを利用したい
 &lt;div id="インタラクティブなプログラムを利用したい" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%82%a4%e3%83%b3%e3%82%bf%e3%83%a9%e3%82%af%e3%83%86%e3%82%a3%e3%83%96%e3%81%aa%e3%83%97%e3%83%ad%e3%82%b0%e3%83%a9%e3%83%a0%e3%82%92%e5%88%a9%e7%94%a8%e3%81%97%e3%81%9f%e3%81%84" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h4&gt;
&lt;p&gt;以下のコマンドで計算ノードにログインする。この場合は、ちゃんとスケジューリングされる。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;qlogin -q [キュー名]&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;

&lt;h4 class="relative group"&gt;ジョブの投入
 &lt;div id="ジョブの投入" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%82%b8%e3%83%a7%e3%83%96%e3%81%ae%e6%8a%95%e5%85%a5" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h4&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;qsub -q [キュー名] -p [プライオリティ] -l [メモリ量] [シェルスクリプト名]&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;プライオリティは-1023から1024であり小さいほうがプライオリティが低い。0がデフォルト。
rootでない限りプラオリティが下げることしかできない。&lt;/p&gt;</description></item><item><title>なぜアダプタやプライマー配列を除く必要があるのか</title><link>https://catway-jp.pages.dev/bioinformatics/qc/rmprimer_adopter.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/qc/rmprimer_adopter.html</guid><description>&lt;p&gt;シーケンスの際に、読みたいインサートを突き抜けてアダプタ/プライマ配列が現われることがある。特にイルミナ社のシーケンスはエラー少ないものの、そのなかでもよくあるエラーがこのアダプタ/プライマ配列の混入である。インサート長が短い場合や、インサートがみあたらず、アダプターダイマーのような配列に由来すると考えられる。&lt;/p&gt;
&lt;p&gt;このような配列は mapping の前に除いておいたほうが良いとされている。しかし mapping すると、その配列はゲノムに正しくマップされないため、マッピングスコアなどにより、実質的にはその後の解析に含まれないようにするすることも可能である。マッピングの計算コストがそれほどかからなくなってきた現在、先にこのような配列をフィルタする必要があるのだろうか。&lt;/p&gt;
&lt;p&gt;答えとしては、それでも除いたほうが良い、である。なぜなら、マッピングされなかった配列がどのような理由でマッピングできなかったのかを知ることは、ライブラリの質を評価することに繋がるためである。最初にこれらの配列をフィルタすることで、それがどのぐらい含まれているのかを知り、それを実験者にフィードバックすることが重要である。仮にアダプタ配列ばかりが読まれると、リードがアダプタDNA断片に奪われてしまうため、期待されるリード読まれる機会が減る。これによりシグナルノイズ比が悪くなる。これは後の解析の成否にかかわることである。このような場合は、読むべきDNA断片とアダプタ量の比率を実験的に調整したり、アダプタダイマーを除くサイズセレクションの精度を上げたり、などの実験的に工夫が必要になる。このような理由に、自分のシーケンス実験のヘルスチェックのために、フィルタリングを行い、その統計情報を持つべきなのである。&lt;/p&gt;</description></item><item><title>バイオインフォマティクス解析のためのSQLite入門</title><link>https://catway-jp.pages.dev/bioinformatics/etc/sqlite.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/etc/sqlite.html</guid><description>&lt;p&gt;SQLite3 はリレーショナルデータベース管理システムのひとつ。サーバクライアントモデルではなく、データベースがファイルになっています。ライセンスがパブリックドメインであることもあり、組み込みDBとしてよく使われます。iPhone の位置情報などのデータを格納しているのも SQLite3 です。ウェブアプリケーションのフレームワークである、Ruby on Rails では標準の組み込みDBとして使われています。また中規模のデータベースならMySQLなどと比較しても遜色ない速度で利用できます。&lt;/p&gt;
&lt;p&gt;バイオ業界でも、マイクロアレイやNGSデータを格納する際によく利用されており、Bioconductor の annotation package に含まれるデータも SQLite3 のデータベースになっています。&lt;/p&gt;

&lt;h3 class="relative group"&gt;インストール
 &lt;div id="インストール" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e3%82%a4%e3%83%b3%e3%82%b9%e3%83%88%e3%83%bc%e3%83%ab" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;p&gt;Mac OS X には標準でインストールされており、設定なしでターミナルから利用できます。Linuxでもほとんどのディストリビューションでパッケージマネジメントシステムでインストール可能です。Windows は知りません。&lt;/p&gt;

&lt;h3 class="relative group"&gt;使いかた
 &lt;div id="使いかた" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e4%bd%bf%e3%81%84%e3%81%8b%e3%81%9f" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;p&gt;SQLite3 が正常にインストールされていれば、以下のようにして対話型のクライアントを起動することができます。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-sh" data-lang="sh"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sqlite3&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;データベースを作成するには (ここでは expressions.sqlite という名前のデータベースを作成する)&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-sh" data-lang="sh"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sqlite3 expressions.sqlite&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;とする。&lt;/p&gt;
&lt;p&gt;テーブルを作りスキーマを確認する。スキーマとはテーブルの定義のこと。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-sql" data-lang="sql"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sqlite&lt;span style="color:#719e07"&gt;&amp;gt;&lt;/span&gt; &lt;span style="color:#719e07"&gt;create&lt;/span&gt; &lt;span style="color:#719e07"&gt;table&lt;/span&gt; transcripts(id &lt;span style="color:#b58900"&gt;varchar&lt;/span&gt;(&lt;span style="color:#2aa198"&gt;10&lt;/span&gt;), sample &lt;span style="color:#b58900"&gt;varchar&lt;/span&gt;(&lt;span style="color:#2aa198"&gt;10&lt;/span&gt;), fpkm &lt;span style="color:#b58900"&gt;real&lt;/span&gt;);
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sqlite&lt;span style="color:#719e07"&gt;&amp;gt;&lt;/span&gt; .&lt;span style="color:#719e07"&gt;schema&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#719e07"&gt;CREATE&lt;/span&gt; &lt;span style="color:#719e07"&gt;TABLE&lt;/span&gt; transcripts(id &lt;span style="color:#b58900"&gt;varchar&lt;/span&gt;(&lt;span style="color:#2aa198"&gt;10&lt;/span&gt;), sample &lt;span style="color:#b58900"&gt;varchar&lt;/span&gt;(&lt;span style="color:#2aa198"&gt;10&lt;/span&gt;), fpkm &lt;span style="color:#b58900"&gt;real&lt;/span&gt;);
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sqlite&lt;span style="color:#719e07"&gt;&amp;gt;&lt;/span&gt; &lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;データを格納する。&lt;/p&gt;</description></item><item><title>モチーフ間距離分布を描く</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/motifdist.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/motifdist.html</guid><description>&lt;p&gt;2つのDNAモチーフ間の距離の分布をプロットする。この距離が近い場合、分布が単峰性になる。ここから2つの転写因子がヘテロダイマーなどのように近くで働いているという分子メカニムズが想像できる。距離が離れている場合は二峰性の分布になる。これは、一次配列としての距離は遠くとも、ゲノムDNAが折り曲がることにより、クロマチン構造上、近くに存在する場合や、ほかのコファクターとなるタンパク質を介して、タンパク質間相互作用がある場合などがが考えられる。&lt;/p&gt;
&lt;p&gt;まず2つの転写因子の結合サイトを計算する。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;library(&amp;#34;ChIPpeakAnno&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;library(&amp;#34;MotIV&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;load(&amp;#34;results/3rd/03motifdbSearch.rdat&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;oct4.sox2.overlappingPeaks.seq &amp;lt;- read.DNAStringSet(&amp;#34;results/3rd/oct4.sox2.overlappingPeaksWithSeqs.fa&amp;#34;, &amp;#34;fasta&amp;#34;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;oct4.motif.pwms &amp;lt;- getPWM(oct4.motif)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;oct4.motif.search.fwd &amp;lt;- lapply(
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; oct4.sox2.overlappingPeaks.seq,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; function(x) {
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; matchPWM(oct4.motif.pwms$m1, x)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; }
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;oct4.motif.search.rev &amp;lt;- lapply(
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; oct4.sox2.overlappingPeaks.seq,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; function(x) {
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; matchPWM(reverseComplement(oct4.motif.pwms$m1), x)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; }
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sox2.motif.pwms &amp;lt;- getPWM(sox2.motif)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sox2.motif.search.fwd &amp;lt;- lapply(
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; oct4.sox2.overlappingPeaks.seq,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; function(x) {
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; matchPWM(sox2.motif.pwms$m1, x)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; }
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sox2.motif.search.rev &amp;lt;- lapply(
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; oct4.sox2.overlappingPeaks.seq,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; function(x) {
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; matchPWM(reverseComplement(sox2.motif.pwms$m1), x)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; }
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;save(list = ls(), file = &amp;#34;results/3rd/04motifsearchInOverlappingPeakseq.rdat&amp;#34;)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;この2つの転写因子の距離の関係をプロットする。&lt;/p&gt;</description></item><item><title>ランダムにリードを取り出す</title><link>https://catway-jp.pages.dev/bioinformatics/qc/randomsampling.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/qc/randomsampling.html</guid><description>&lt;p&gt;リード数に応じてシーケンスの深さ (depth) が決まる。この depth は RNA-seq, ChIP-seq などのタグシーケンシングではその精度に関わる。具体的には、depth が深いほど、検出できる遺伝子の数やRNAの発現量やタンパク質-DNA結合量ダイナミックレンジが向上する。自分のサンプルや生物がどのぐらいのリード数が必要であるかを知ることは、正確でかつ、無駄なコストをかけずに実験するには重要なことである。そこで、リードをランダムに除いた系列、例えば、0.1, 1, 10, 100M リードなどを用意して解析することで、検出遺伝子やダイナミックレンジの評価を行うことが重要である。ランダムに配列を除くことを、ダウンサンプリング、あるいは、ランダムサンプリングと呼び、取り出されたリード群を、ダウンサンプル、サブサンプルなどと呼ぶ。&lt;/p&gt;

&lt;h3 class="relative group"&gt;BAM file から一定の確率でランダムにリードを取り出す
 &lt;div id="bam-file-から一定の確率でランダムにリードを取り出す" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#bam-file-%e3%81%8b%e3%82%89%e4%b8%80%e5%ae%9a%e3%81%ae%e7%a2%ba%e7%8e%87%e3%81%a7%e3%83%a9%e3%83%b3%e3%83%80%e3%83%a0%e3%81%ab%e3%83%aa%e3%83%bc%e3%83%89%e3%82%92%e5%8f%96%e3%82%8a%e5%87%ba%e3%81%99" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;p&gt;ここでは、Picard (&lt;a href="http://picard.sourceforge.net/" target="_blank" rel="noreferrer"&gt;http://picard.sourceforge.net/&lt;/a&gt;) の DownsampleSam.jar を使って、bam file からランダムに配列を除く方法を述べる。すでにマッピング済みの配列からファイルを除くにはことを想定する。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ java -jar /opt/picard-tools/DownsampleSam.jar INPUT=input.bam OUTPUT=output.bam PROBABILITY=0.2&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;ここでは、全体のリードのうち 20% をランダムに取り出している。注意したいのは、tophat2, bowtie2 などで、ひとつのリードを複数の箇所にマッピングされた(いわゆる multi hits)ような bam file を利用する場合は、割合ではなくリードの絶対数を指定しなければならない。それについては次の項を参照すること。&lt;/p&gt;

&lt;h3 class="relative group"&gt;BAM file から一定の数のリードをランダムに取り出す
 &lt;div id="bam-file-から一定の数のリードをランダムに取り出す" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#bam-file-%e3%81%8b%e3%82%89%e4%b8%80%e5%ae%9a%e3%81%ae%e6%95%b0%e3%81%ae%e3%83%aa%e3%83%bc%e3%83%89%e3%82%92%e3%83%a9%e3%83%b3%e3%83%80%e3%83%a0%e3%81%ab%e5%8f%96%e3%82%8a%e5%87%ba%e3%81%99" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;p&gt;DwonsampleSam.jar はリードを取り出す確率を指定することはできるが、取り出したい数を直接指定することはできない。そこで、bamtools を使って数を直接指定してリードを取り出す。&lt;/p&gt;</description></item><item><title>異なるバージョンのゲノム座標を変換する: liftover</title><link>https://catway-jp.pages.dev/bioinformatics/qc/liftover.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/qc/liftover.html</guid><description>&lt;p&gt;古い論文のデータと比較しなければならない場合などの、ゲノムのバージョンが古い座標系を使っている場合がある。そこで liftover を使い、より新しいバージョンのゲノムの座標系に変換する。&lt;/p&gt;
&lt;p&gt;インストール
ここでは、マウスゲノムの mm8 から mm9 へ座標変換する。Linux が前提ですが、ほかでもかわりないです。変換されるファイルの形式は bed が基本だが、オプションでほかのファイルにも対応できる。bed ファイルでも browse 行や track 行があるとエラーになるので除いておく。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ curl -O http://hgdownload.cse.ucsc.edu/goldenpath/mm8/liftOver/mm8ToMm9.over.chain.gz
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;gzip -d mm8ToMm9.over.chain.gz&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;ほかのゲノム間を比較したい場合は、golden path のダウンロードサイトの下に liftOver というディレクトリがあって、そこに変換テーブル (*.chain) があります。&lt;/p&gt;
&lt;p&gt;変換プログラムをダウンロードしてインストールします。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ curl -O http://hgwdev.cse.ucsc.edu/~kent/exe/linux/liftOver.gz
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ chmod +x ./liftOver 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ sudo cp ./liftOver /usr/local/bin/&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;使い方
では変換してみましょう。mm8.bed が変換したい mm8 なゲノム座標のファイルで、mm9 な座標に変換後 mm9.bed に保存されます。unmapped.txt は座標変換が失敗したエントリが保存されます。 start と end が同じ座標のエントリは変換が失敗するのであらかじめ、どちらかの座標に +1 しておくこと。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ liftOver mm8.bed mm8ToMm9.over.chain mm9.bed unmapped.txt&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;</description></item><item><title>異なる生物間のゲノム座標を変換する: liftover</title><link>https://catway-jp.pages.dev/bioinformatics/qc/liftover_org.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/qc/liftover_org.html</guid><description>&lt;p&gt;liftOver はもともとゲノムバージョン間の座標を変換するプログラムであったが、オプションを駆使することで種間の座標を変換することも可能である。&lt;/p&gt;
&lt;p&gt;ポイントとなるオプションは複数箇所にヒットを許す -multiple、最小チェインサイズを指定する -minSizeT, -minSizeQ の2つである。また -minMatch のデフォルトが 0.95 であるが、種間比較で利用するときは 0.01 など低い値を指定する。例えば、ヒトゲノムのENCODE領域 (0.5-1.8MB)では、-minSizeT=4000 とし、 哺乳類では -minSizeQ=20000、鳥類や魚類ゲノムでは -minSizeQ=1000 にすると良いとされている。&lt;/p&gt;</description></item><item><title>遺伝子発現量(FPKM)を計算する</title><link>https://catway-jp.pages.dev/bioinformatics/RNA-Seq/cuffdiff.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/RNA-Seq/cuffdiff.html</guid><description>&lt;p&gt;大量のリード配列から、遺伝子ごとにRNAの発現量を見積る必要がある。これには大別して方法が2つある。ひとつは既知の遺伝子領域に含まれたリード数を数え挙げる方法である。もうひとつは、既知の遺伝子領域の情報を使わず、リードを組み立てて(de novo assembl)、転写されたRNAの構造を予測した後、その発現量を定量する方法である。リファレンスゲノムの精度が高く、完全長cDNAやEST (Expressed Sequence Tag)のシーケンスプロジェクトが進んでいる生物種では、前者の方法が簡単である。後者の方法を取るのは、新規の遺伝子構造(アイソフォーム)や融合遺伝子の発見が目的である場合や、リファレンスとなるゲノムやトランスクリプトームが明らかではない場合である。&lt;/p&gt;
&lt;p&gt;マッピングデータから遺伝子発現量を定量する&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ cuffdiff -p 24 ensembl_gene.gtf
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; -L sample01,sample02,sample03,control01,control02,control03
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; -o results 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; sample01.bam, sample02.bam, sample03.bam 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; control01.bam, control02.bam, control03.bam&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;重複した実験をコンマで区切る
リファレンストランスクリプトームの GTF が正しいこと
-L ではサンプルごとのラベルを指定する。これをちゃんと入れないと cummeRbund で困る&lt;/p&gt;
&lt;p&gt;現在のバージョンでは cuffdiff は使わないので注意&lt;/p&gt;</description></item><item><title>既知のモチーフ配列/PWMのデータを得る: JASPAR</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/pwm_jaspar.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/pwm_jaspar.html</guid><description>&lt;p&gt;既知のモチーフ配列/PWMを整理したデータベースJASPARの情報は、rGADEM に付属している。以下の例では、名前に Pou5f1 (Oct3/4) の文字列が含まれている PWM を検索し取り出している。&lt;/p&gt;
&lt;blockquote&gt;&lt;p&gt;jaspar.path &amp;lt;- system.file(&amp;ldquo;extdata/jaspar2009.txt&amp;rdquo;,package=&amp;ldquo;rGADEM&amp;rdquo;)
seeded.pwm &amp;lt;- readPWMfile(jaspar.path)
oct4.jaspar.id &amp;lt;- grep(&amp;ldquo;Pou5f1&amp;rdquo;, names(seeded. pwd)&lt;/p&gt;
&lt;/blockquote&gt;&lt;p&gt;これを配列に対して検索するには「ピーク内の配列のなかから既知のDNAモチーフ配列を発見する」を参照せよ。&lt;/p&gt;</description></item><item><title>結合サイトの予測 GPS</title><link>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/gps.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/ChIP-Seq/gps.html</guid><description>&lt;p&gt;GPS (Genome Positioning System) はChIP-seqのデータからタンパク質-DNA結合サイトを1塩基解像度で予測するプログラムである。シーケンスリードの分布を混合確率分布と考えて、分布のパラメータ予測を行うことで、結合サイトの位置を予測する。バックグラウンドには実験データのほか、ポアソン分布を仮定したローカルなバックグラウンドを利用した予測も可能である。&lt;/p&gt;
&lt;p&gt;使い方&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;$ java -Xmx80G -jar gps.jar --d Read_Distribution_default.txt 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; --s 240000000
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; --exptCTCF-GM12878 GM12878_chr1_ip.bed
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; --exptCTCF-HUVEC HUVEC_chr1_ip.bed
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; --ctrlCTCF-GM12878 GM12878_chr1_ctrl.bed
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; --ctrlCTCF-HUVEC HUVEC_chr1_ctrl.bed
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; --f BED --g hg18_chr1.info --out HumanCTCF &lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;-Xmx でメモリを指定する。mulit-condition mode では大量のメモリと計算時間を必要とする。&amp;ndash;d には初期条件に利用する read distribution を指定する。read distribution は予測された結合サイト周辺に存在するシーケンスリードの分布に関するデータが含まれている。&amp;ndash;s にはマッピングされるリファレンスゲノム領域のサイズを指定する。大抵はゲノムサイズ * 0.8 を指定する。&amp;mdash;exptXXX, &amp;ndash;ctrlXXX でそれぞれ実験データ、コントロールデータ (例えば IgGやKO, input genome のデータなど)を指定する。&amp;ndash;f は入力ファイル形式を指定し、&amp;ndash;out には出力ファイル名を指定する。&lt;/p&gt;
&lt;p&gt;Guo Y, Papachristoudis G, Altshuler RC, Gerber GK, Jaakkola TS, Gifford DK, Mahony S. Discovering homotypic binding events at high spatial resolution. Bioinformatics. 2010 Dec 15;26(24):3028-34. Epub 2010 Oct 21. PubMed PMID: 20966006; PubMed Central PMCID: PMC2995123.&lt;/p&gt;</description></item><item><title>執筆環境について</title><link>https://catway-jp.pages.dev/bioinformatics/etc/writingenv.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/etc/writingenv.html</guid><description>&lt;p&gt;環境は次のとおり&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;MacOS X&lt;/li&gt;
&lt;li&gt;homebrew&lt;/li&gt;
&lt;li&gt;npm&lt;/li&gt;
&lt;li&gt;&lt;a href="https://github.com/GitbookIO/gitbook" target="_blank" rel="noreferrer"&gt;gitbook&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 class="relative group"&gt;環境のセットアップ
 &lt;div id="環境のセットアップ" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e7%92%b0%e5%a2%83%e3%81%ae%e3%82%bb%e3%83%83%e3%83%88%e3%82%a2%e3%83%83%e3%83%97" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;cd [DIR]
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;brew install npm
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;npm install gitbook -g&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;&lt;a href="http://calibre-ebook.com/" target="_blank" rel="noreferrer"&gt;Calibre&lt;/a&gt;をダウンロードしてインストールする。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;sudo ln -s /Applications/calibre.app/Contents/console.app/Contents/MacOS/ebook-convert /usr/bin/ebook-convert&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;

&lt;h3 class="relative group"&gt;執筆
 &lt;div id="執筆" class="anchor"&gt;&lt;/div&gt;
 
 &lt;span
 class="absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none"&gt;
 &lt;a class="text-primary-300 dark:text-neutral-700 !no-underline" href="#%e5%9f%b7%e7%ad%86" aria-label="アンカー"&gt;#&lt;/a&gt;
 &lt;/span&gt;
 
&lt;/h3&gt;
&lt;p&gt;最初だけ。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;mkdir [dir]
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;gitbook init&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;gitbook を起動する。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;gitbook serve [dir]&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;http://localhost:4000/ へアクセス。エディタを起動する。&lt;/p&gt;
&lt;div class="highlight-wrapper"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#93a1a1;background-color:#002b36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;subl [dir]&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
&lt;p&gt;&lt;code&gt;dir&lt;/code&gt; 以下に md を作っていく。
ファイルを保存するとブラウザ側でコンテンツが自動的にリロードされる。&lt;/p&gt;
&lt;p&gt;コンテンツを編集したら、___SUMMARY.md を編集___して、新規追加したコンテンツを
追加する。これをやらないと、buildしたときにHTMLへ変換されないので注意!&lt;/p&gt;</description></item><item><title>大量の計算を高速化するには</title><link>https://catway-jp.pages.dev/bioinformatics/etc/hpc.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/etc/hpc.html</guid><description>&lt;p&gt;シーケンスデータの計算で、最もボトルネックになるのはハードディスクやSSDなどの記憶装置にアクセスする部分、disk I/Oの部分である。最近のコンピュータはたくさんのCPUコアを持つため、たくさんの計算を同時にこなすことができる。しかしたくさんの計算を同時にすると、巨大なファイルの入力や出力に時間がかかる。一定の量は、メモリに蓄えられるが、メモリが足りなくなると、OSは Swap 領域というストレージ装置を利用しはじめる。メモリへのアクセスに対して、ストレージ装置へのアクセスは遅いので、計算スピードも下がる。計算を投入したら、top コマンドを利用して、Swap の空き容量を確認しながら、無理のない量の計算をすることが重要である。&lt;/p&gt;
&lt;p&gt;図. Swap の値をチェックする&lt;/p&gt;
&lt;p&gt;Swap を使わないようにするには、物理的にメモリを大きいものにする方法が根本的な解決ではある。また、なるべくディスクに書き込む回数を減らすのも重要である。そのためには、大量のデータをファイルに出力するときはなるべく圧縮しながら出力する、という方法がある。CPUが比較的空いているのであれば、圧縮にCPUをメモリを使いながら、ストレージ装置に書き込まれる量を減らすことで、速度を稼ぐという考えである。例えば、、、
する場合は、シェルのパイプ機能を使えば、ファイルを圧縮してから、ストレージに書き込むことができるため、ストレージ装置へのアクセスを減らすことが可能である。&lt;/p&gt;</description></item><item><title>発現が有意に異なる遺伝子を探す</title><link>https://catway-jp.pages.dev/bioinformatics/RNA-Seq/cummeRbund.html</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://catway-jp.pages.dev/bioinformatics/RNA-Seq/cummeRbund.html</guid><description>&lt;p&gt;cummeRbund つかってかんばれ的なこと書く。&lt;/p&gt;</description></item></channel></rss>