この話題は前にも触れましたがBioRxvに出ていましたので紹介します。
Highly Multiplexed Single-Cell Full-Length cDNA Sequencing of human immune cells with 10X Genomics and R2C2
|
このタイトルにあるR2D2、じゃなかった、R2C2とはなんのこっちゃ? 最初私もハテ?と思っていたのですがこれはThe Rolling Circle Amplification to Concatemeric Consensus
とのことだそうです。同じ著者のこちらの文献に詳しく書いています。
ONTのデータです。PacBioのCCS、HiFiとはちょっと違いますが目的は同じ。同じ場所を何回か読んで精度を高めるというものです。
この論文、目的は
- 免疫細胞の遺伝子発現をシングルセルレベルで検出し、
- その遺伝子(mRNA)を完全長で捉え、
- それによりアイソフォーム配列も区別し、
- T細胞レセプター・B細胞レセプターのもっとも変異の多い部位の配列をペアで決定する(免疫レパトア解析)
というもの。
完全長で捉えるというところがキーです。ショートリードで行うと1と4はできる。でも2と3は難しい。
彼らはPBMCを使っていて、およそ3000細胞からデータを得ています。
3’発現キットを使ってメッセンジャーをキャプチャーしています。<ー個人的にはここがちょっとびっくりした。10xのノーマルのプロトコルだと、免疫細胞のTCR・BCRレパトア解析をする場合、5’発現キットを使います。というのもTCR・BCRの変異領域は遺伝子の5’側に寄っているので、5’側を読まないといけないから。
とはいえ、良く考えたら、ショートリードで読むことを想定しているから3’側と5’側のライブラリ作製キットを使い分けているのですよ。
どちらも一度は完全長のcDNAを作り、その後ショートリード用にライブラリをカットしているので、もし完全長cDNAを全部読めるのであれば3’のキットでメッセンジャーをキャプチャーしても問題無い。
(この辺、解りづらかったらお知らせください)
シングルセル3’キットでメッセンジャーをキャプチャーして、一旦cDNAを作り(この辺のPCR伸長時間に工夫があるみたいです)一方はショートリード用、もう一方はR2C2用にしてライブラリを作製、シークエンスしています。
PBMCなのでT細胞、B細胞、単球が綺麗にクラスターに分かれています。
Volden et al., DOI 10.1101/2020.01.10.902361v1 より |
この後のアイソフォーム解析は、ロングリードならでは。
B細胞、T細胞、単球に発現している遺伝子が、それぞれ異なるアイソフォームを持っていたことを彼らは論文中で示しています。
さらにレパトア解析、TCR・BCRの遺伝子のペア解析もロングリードで行なっています。
(これは正直、ショートリードでやってもできるよ、と言いたいけれど言いません)
こういう論文を読んでいると、PacBioのIso-Seqを思い出します。完全長cDNAのアイソフォーム解析です。これがシングルセルのレベルでできるようになったのか〜。感慨深い
0 件のコメント:
コメントを投稿