ノート/ノート
訪問者数 2747 最終更新 2011-08-18 (木) 09:27:10
シーケンサ出力(ABIFファイル)解読サイトの使い方 †
基本手順は、
- サイト画面を出す
- シーケンサ出力ファイル(ABIFファイル、拡張子がab1またはABIのファイル)をサイト内の作業フォルダにアップロードする
- 処理する
- 結果を(必要に応じて)ダウンロードする
シーケンサ出力(ABIF)ファイルのアップロード †
作業フォルダへファイルをアップロードするには、サイト画面上の「アップロード」の枠内にある、「参照」ボタンをクリックする。
- 「参照」ボタンをクリックすると、ファイル選択ウィンドウが開くので、1つのファイルだけの場合は左クリックで選択できる。
- (ブラウザによって)複数のファイルを選択することもできる。Ctrlキーを押しながら左クリックすると、追加のファイルを(1つずつ)選択できる。また、Shiftキーを押しながら左クリックすると、前回選択した場所から今選択した場所まで連続して複数のファイルを選択できる。いずれも、色の反転したファイル(選択されたファイル)がまとめてアップロードされる。
- 「追加」ボタンをクリックすると、選択したファイルがアップロードされる。
「追加」ボタンを押す前の、選択ウィンドウが閉じた段階では、ファイル名(複数の場合は代表)が枠内に表示されるが、まだアップロードされていない。
- ファイルが大きい場合は、アップロードの転送に時間がかかることがある。
アップロードが終わると、作業フォルダにあるファイルが右側の枠内に表示される。
- 右図は、3つのファイルを1回にアップロードした例を示している。
- 右側の枠内に、作業フォルダ内にあるファイルが表示される。
- 直前のアップロード作業の結果が、左側のアップロード枠の下方に表示される。
- ファイルアップロードや削除を繰り返して、作業フォルダの内容を変更することができる。たとえば、不足しているファイルがあれば、再度アップロードすることができるし、不要なファイルがあれば、後述のように削除することができる。
作業フォルダ内のファイルは、右側の「ファイル消去」の枠内を操作して、消去することができる。
- 作業フォルダ内から消去したいファイルを選択する。具体的には、右側の「ファイル消去」の枠内において、表示されているファイル名の先頭にある □ をクリックし、チェックマークを入れる。
- 「チェックしたファイルを消去」ボタンをクリックする。これによって、ファイルが消去される。
- 右図は、アップロードしたファイルから、mreB520do.ab1 を消去した例である。
- 消去作業の結果が、右側の消去枠の下方に表示される。
- 右側の枠内で、以前の状況から比較して、ファイル mreB520do.ab1 が消去されていることがわかる。
- 複数のファイルにチェックマークを付けて消去することが可能である。
- 「生成したファイルをすべて消去」ボタンをクリックすると、拡張子 .ab1 以外のファイルをすべて消去する。作業フォルダ内を完全に空にするには、この「生成したファイルをすべて消去」の後に、ab1ファイルをそれぞれチェックして消去する。
アップロードしたシーケンサ出力(ABIF)ファイルの計算処理 †
作業フォルダにアップロードして準備したABIFファイル(拡張子 .ab1 か .abi のファイル)に対して、各塩基のピーク読み取り値を抽出し、CSVファイルとして生成する。
- 左側下段枠内の「計算処理開始」ボタンをクリックすることによって、右側枠内に表示されている、作業フォルダ内にあるすべてのABIFファイル(拡張子 .ab1 か .abi のファイル)に対して、解読処理を行う。
- 右図は、作業フォルダ内に mreB520do.ab1 ファイルのみが置かれていた時に、「計算処理開始」ボタンをクリックして処理を行った結果である。
- 現状(2011/08/17現在)で下記のファイルを生成している。いずれのファイルも、右側枠内からダウンロードすることができる。
- PKVAL.csvファイル これが、各塩基の読み取りピーク値を含むデータファイルである。Excel等で読めるCSV形式で、ファイル名(この例ではmreB520do_PKVAL.csv)を手元のPCにダウンロードすれば(通常は右クリックして、「名前を付けて保存」を選ぶ)、手元でExcelで開くことができる。
- 形式は、右図のように、5つの欄からなり、左の欄が塩基位置の通し番号、その右側の4つの欄が、A/G/C/Tの4種類の読み取り値(シーケンサー内で解析済みの値)である。
たとえば、ピーク位置27番の読み取り値は、
27 398 238 41 0
であるから、第1色と第2色が398と238であって、どちらか区別しがたい(混合している?)と読むことができる。
FinchTVにて表示した様子を、本稿末尾に付けておく。
- RAW.csvファイル シーケンサの読み取った生データ。各色ごとにデータの列が測定の順に並び、それが4色分置かれている。
- ANAL.csvファイル シーケンサ内で解析処理をした値。RAWと同様に4色分置かれている。
- LOC.csvファイル ピーク波形のための、ピーク位置(ANAL.csvファイル上での何番目のデータがピーク位置にあたるのか)を列挙したデータ。この位置情報をもとにPKVAL.csvデータが作られる。ピーク位置は4色に共通のため、位置データは1列しかない。
- QVAL.csvファイル ピーク波形の塩基同定の品質値情報(Quality Values)。タグPCONで書かれた値。左欄は塩基位置、右欄は品質値。スケール(最大値)はタグphQLに書かれているが、ここには書き出していない。(最大値の例は63)
- .datファイル 波形表示画面作成用のデータファイル。きれいな形にするために、PKVALデータを加工している。
- .pltファイル 波形表示画面作成用のコマンドファイル
- .pngファイル 波形表示の画像データ。手元のPCにダウンロードして、画像表示アプリケーションで開くと、波形表示をみることができる。横幅が非常に大きい画像であるため、表示ソフト上で大きさを上手に調節してやる必要があるだろう。
- 処理が終了したら、作業フォルダ内のファイルは消去し、空にしておくのが望ましい。
FinchTVで出力した波形表示