2020年1月27日月曜日

「Visium Spatial : 空間的遺伝子発現の疑問にお答えします」のブログの紹介

今年は暖冬で雪が少ないそうですね。暖冬の年は花粉が飛ぶ時期も早まるらしく、そうなると夏はどうなるんだろう?猛暑?水不足?


さて、前もここに書いたSpatialです。製品名はVisium Spatial(ビジィウム・スペーシャルと発音します)Gene Expressionです。マーケティング的にはVisium 空間的遺伝子発現と訳しています。
その新しい製品ですが今年、あちこちで話題になることは間違いない!と思っています。2020年の流行語大賞バイオ編というのがあればVisiumがノミネートされるかな。

10xのブログにて、そのVisiumのFAQが出ています。ブログはこちら


せっかくなので一部日本語に訳してみました。

イントロダクション


10x Genomicsでは、複雑な組織生物学に潜む空間的なダイナミクス、正常組織の発生や疾患病理学に影響する微小環境の細胞の働きを捉えることを可能にしています。10x GenomicsのVisium空間的遺伝子発現ソリューションを使用すれば、ターゲット遺伝子だけでなく全体のmRNAをインタクトな組織切片から得て、遺伝子発現情報を高解像度なH&E染色画像上に重ね合わせることができます。

このソリューションは組織切片作成、H&E染色、顕微鏡画像検出といったこれまでの病理学的な方法に、次世代シーケンス技術を統合して行います。そのため、10x Genomicsでは、scRNA-seqまたは組織解析の専門家のどちらにも有用な、トレーニングウェビナーを準備していますました。

Getting Started with the Visium Spatial Gene Expression Solution. Watch on-demand


Exploring New Frontiers - Analyzing and Visualizing Visium Gene Expression Data. Watch on-demand

ちなみに製品に関するウェブサイトは日本語でも用意しているので、こちらのほうが初心者はわかりやすいかもしれません。

組織準備に関するよくある質問

Visium Spatial Gene Expressionスライドに、異なる組織サンプルを同時にのせることはできますか?
はい、1つのスライドには4つのキャプチャーエリアがあり、4種類の異なるサンプルはそれぞれのエリアに乗せて測定することができます。但し、最適な透過処理時間をTissue Optimization(TO)スライドを使い、組織ごとにあらかじめ測っておく必要があります。


フォルマリン固定(FFPE)の組織は使用できますか?
OCTの新鮮な冷凍組織のみ確実にテストされています。10x GenomicsのR&DではFFPEでの方法を積極的に研究しています。


IHC染色した組織は使えますか?
現在、Visium空間的遺伝子発現のワークフローはH&E染色に最適化されています。 IHC染色からの方法も10xでは研究中です。


組織切片の厚さの最大値はありますか?
最適な切片の厚さは組織に依存します。例えば脂肪が多い組織の場合はより厚い切片が必要です。クオリティを保ちつつ組織に合った最小の厚さで切ることが大切です。 社内では5〜35μmでテストしたことがありますが、ほとんどの場合10 µmで切ります。

組織ごとの推奨する切片の厚さについてはこちら
凍結切片の詳細はこちら


Visium Spatial Gene Expressionスライド

4つのキャプチャーエリアには、約5000個のバーコードスポットがあり、各スポットには数百万本ものバーコード付きオリゴ配列が並んでいます。組織内のmRNAは、酵素による透過処理行なった後に放出され、バーコードオリゴに結合し、遺伝子発現情報として測定できるようになります。


1つのスポットが複数の細胞タイプをキャプチャーすることはありますか?
はい。組織の種類や組織内の細胞の大小密度によります。スポットの直径は50μm、隣り合うスポットの中心間の距離は100μmです。スポットあたり平均して1〜10個の細胞が捉えられると想定してください。ですからこれらの細胞は同じ細胞タイプで無い可能性もあります。私たちは、数個の「ミニバルク」細胞の平均遺伝子発現値を見ることになります。10xではこのスポットサイズをより小さくできないか研究を続けています。


同じスライドまたは異なるスライドの切片測定値に差はありますか?
難しい質問です。各組織は独特で元々差があるからです。同じスライド内または異なるスライド間で遺伝子発現データを一定に保つ最も有用なポイントは、組織のクオリティコントロールです。これは熟練した組織と切片準備の技術を伴います。

テクニカルリプリケートを作るのも良いでしょう。R&Dではマウス脳の4つの連続する切片を同じスライドにのせた実験を、違うスライドを使って6週間続けました。遺伝子発現のテクニカルリプリケート間でのR相関係数は0.99で、これは相関が高いことを示します。一般的にテクニカルリプリケートは実験結果の信頼性を高めます。


使わない箇所がある場合スライドは再利用できますか?

いいえ。使わないキャプチャーエリアがあったとしても、スライド使用は一度限りです。これはワークフローの中に、染色、リンス、乾燥のステップが他の使わないエリアのオリゴ配列にも影響し結果として全体的な感度を落としてしまうからです。


イメージングテストスライドの目的は何ですか?
Visiumアクセサリーキットに含まれるイメージングテストスライドには、2つの目的があります。ひとつはユーザーのイメージングシステムがVisiumに適合しているかを調べる目的、もうひとつは後の実験のためにイメージングプログラムをセットアップすることです。 詳細はこちら《 Imaging Guidelines Technical Note


データ解析について

データ解析のためにプログラミングやバイオインフォマティクスの経験は必要ですか?
最低限のバイオインフォマティクススキルがあればSpace Rangerを動かすことができます。Space RangerはLinuxマシンの上で動くので、Linuxの基本操作コマンドを知っておくことは必要です。しかしSpace Rangerのほとんどのコマンドは自動で動きます。Space Rangerで必要な設定ファイルやアルゴリズムはソフトウェア内に同梱されているので、2つのインプットファイルさえ指定すれば解析は実行できます。

Loupe BrowserはGUIで動くためプログラミングのスキルは必要ありません。しかし解析を進めるうちにある箇所の遺伝子発現データを選択して再解析したい場合もあるでしょう。そういった場合はRや他のスクリプトを覚えて実行することが必要かもしれません。


SeuratのようなRで動く他の解析ツールはありますか?
はい、あります。SeuratのほかにはSpanielGiottoというツールがあります。Space Rangerから出力されるマトリクスファイルは、Cell Ranger のFeature Barcodeマトリクスと同じフォーマットです。これはそのままSeuratに読みこませることが可能です。

これ以外にも10x Genomicsでは複数遺伝子やUMI、サンプル、クラスター等を同時に可視化するためのR resourcesも作っています。興味のある方はぜひお試しください。

こちらのブログもVisiumの空間的遺伝子発現解析について紹介しています。ご参照ください。



最後になりましたが、今年の3月5日木曜日、Visiumセミナーを東京で行います! ユーザーの先生のご発表と10xの製品担当、AGBTでの最新情報などなど、この技術の最新に触れたい人には見逃せないイベント。場所等正式に決まりましたらまたいろんなチャンネルでお知らせ致しますのでお楽しみに!
 

2020年1月14日火曜日

ヒト免疫細胞のシングルセル 完全長 cDNA シークエンス

免疫細胞のcDNAを完全長で、シングルセルで読んだ、と言う論文。
この話題は前にも触れましたがBioRxvに出ていましたので紹介します。

Highly Multiplexed Single-Cell Full-Length cDNA Sequencing of human immune cells with 10X Genomics and R2C2
リンクはこちら
このタイトルにあるR2D2、じゃなかった、R2C2とはなんのこっちゃ? 最初私もハテ?と思っていたのですがこれはThe Rolling Circle Amplification to Concatemeric Consensus
とのことだそうです。同じ著者のこちらの文献に詳しく書いています。
ONTのデータです。PacBioのCCS、HiFiとはちょっと違いますが目的は同じ。同じ場所を何回か読んで精度を高めるというものです。

この論文、目的は

  1. 免疫細胞の遺伝子発現をシングルセルレベルで検出し、
  2. その遺伝子(mRNA)を完全長で捉え、
  3. それによりアイソフォーム配列も区別し、
  4. T細胞レセプター・B細胞レセプターのもっとも変異の多い部位の配列をペアで決定する(免疫レパトア解析)
というもの。
完全長で捉えるというところがキーです。ショートリードで行うと1と4はできる。でも2と3は難しい。

彼らはPBMCを使っていて、およそ3000細胞からデータを得ています。
3’発現キットを使ってメッセンジャーをキャプチャーしています。<ー個人的にはここがちょっとびっくりした。10xのノーマルのプロトコルだと、免疫細胞のTCR・BCRレパトア解析をする場合、5’発現キットを使います。というのもTCR・BCRの変異領域は遺伝子の5’側に寄っているので、5’側を読まないといけないから。
とはいえ、良く考えたら、ショートリードで読むことを想定しているから3’側と5’側のライブラリ作製キットを使い分けているのですよ。
どちらも一度は完全長のcDNAを作り、その後ショートリード用にライブラリをカットしているので、もし完全長cDNAを全部読めるのであれば3’のキットでメッセンジャーをキャプチャーしても問題無い。
(この辺、解りづらかったらお知らせください)

シングルセル3’キットでメッセンジャーをキャプチャーして、一旦cDNAを作り(この辺のPCR伸長時間に工夫があるみたいです)一方はショートリード用、もう一方はR2C2用にしてライブラリを作製、シークエンスしています。

PBMCなのでT細胞、B細胞、単球が綺麗にクラスターに分かれています。

Volden et al., DOI 10.1101/2020.01.10.902361v1 より
この後のアイソフォーム解析は、ロングリードならでは。
B細胞、T細胞、単球に発現している遺伝子が、それぞれ異なるアイソフォームを持っていたことを彼らは論文中で示しています。

さらにレパトア解析、TCR・BCRの遺伝子のペア解析もロングリードで行なっています。
(これは正直、ショートリードでやってもできるよ、と言いたいけれど言いません)

こういう論文を読んでいると、PacBioのIso-Seqを思い出します。完全長cDNAのアイソフォーム解析です。これがシングルセルのレベルでできるようになったのか〜。感慨深い