DOC_ID : T15-0002
QC_rnaBamQC module :
DOC_ID : M49-3000
Editor : Mira
Review : Angela
Function :
Picard-CollectRnaSeqMetrics為一個java工具程式,可以計算RNA seq 的bam檔裡reads分佈的情形,包括RIBOSOMAL_BASES, CODING_BASES, UTR_BASES, INTRONIC_BASES, INTERGENIC_BASES以及5PRIME_TO_3PRIME_BIAS等等。這些計算需要提供基因位置以及rRNA位置的訊息,分別是ref_flat file以及 ribosomal intervals file,相關檔案建立方式可參考HowTo。
To perform RNA-seq QC analysis use the following command :
java -jar picard.jar CollectRnaSeqMetrics \ I=input.bam \ O=output.RNA_Metrics \ REF_FLAT=ref_flat.txt \ STRAND=SECOND_READ_TRANSCRIPTION_STRAND \ RIBOSOMAL_INTERVALS=ribosomal.interval_list
Installation :
All software are included in GA environment.
Note :
►執行分析前請先利用CreateProject.sh創建一個專案資料夾,請參閱Project standard folder structure文件。
►執行模組需確認所屬計算節點(–partition) : 一般節點的使用者建議使用ct56 ; 生醫節點的使用者建議使用ngs48G註1。
►欲了解模組使用的方式,請執行模組的 -h 指令
#註1 : 欲確認使用者身分,請登入國網中心iService後,選取會員中心/計畫管理/我的計畫,若計畫名稱為”國家生醫數位資料與分析運算雲端服務平台III”即為生醫節點使用者
Description :
Tested environment | GApp0.0.0.2 |
software version | picard=2.23.4 |
Usage(Slurm) | Command in Slurmsbatch -A $projectID --mail-user=$email --export='projDir='$(pwd)'/,sampleName=Sample1,gtfName=refs/Homo_sapiens/GRCh38en104Star2.7.5a/Homo_sapiens.GRCh38.104.gtf,refs=refs/Homo_sapiens/GRCh38en104Star2.7.5a/Homo_sapiens.GRCh38.dna.primary_assembly.fa' modules/QC_rnaBamQC.sh |
Usage(Linux console) | Command in linux consolebash modules/QC_rnaBamQC.sh -p $(pwd) -s Sample1 -g refs/Homo_sapiens/GRCh38en104Star2.7.5a/Homo_sapiens.GRCh38.104.gtf -r refs/Homo_sapiens/GRCh38en104Star2.7.5a/Homo_sapiens.GRCh38.dna.primary_assembly.fa |
#For Slurm operation , please refer to “Basic operation of Taiwania III“ |
Usage :
The following explains the usage of module parameters :
Parameter | Description | Remark |
QC_rnaBamQC.sh | Module of Bam file QC | 分析的模組需存放在[modules]資料夾中 |
projDir | 分析專案的資料夾路徑(專案資料夾結構說明) | Script 需在分析專案的資料夾執行, $(pwd) 會傳回使用者現在所在的路徑 |
refs | 欲進行比對的reference fasta檔案名稱 :資料格式 : *.fa 資料路徑 : refs/ | 例如:refs/Homo_sapiens/GRCh38en104Star2.7.5a/Homo_sapiens.GRCh38.fa 會在 refs/Homo_sapiens/GRCh38en104Star2.7.5a/ 讀取 Homo_sapiens.GRCh38.fa |
sampleName | 欲執行分析的檔案名稱 :資料格式 : *Aligned.sortedByCoord.out.bam 資料路徑 : processed/ 輸出資料路徑 : QC/ | 例如: sampleName = Sample1會在 processed/ 讀取 Sample1Aligned.sortedByCoord.out.bam會在 QC/生成Sample1.rnabamqc |
gtfName | 欲進行比對的gtf.refflat和gtf.rRNA.refflat檔案名稱 :資料格式 : *.gtf 資料路徑 : refs/ | 例如: gtfName = refs/Homo_sapiens/GRCh38en104Star2.7.5a/Homo_sapiens.GRCh38.104.gtf 會在 refs/Homo_sapiens/GRCh38en104Star2.7.5a/ 讀取 Homo_sapiens.GRCh38.104.gtf.refflat/Homo_sapiens.GRCh38.104.gtf.refflat Homo_sapiens.GRCh38.104.gtf.refflat/Homo_sapiens.GRCh38.104.gtf.rRNA.refflat |