Module-QIIME2_DPP_PE



DOC_ID : T15-0002
 

QIIME2_DPP_PE module : 

DOC_ID : M19-3000
Editor : Anita
Reviewer :Angela

Function :

QIIME2_DPP perform Data import, denoise, dereplicate, and filters chimeras of paired-end sequences :

  1. Data import : Import our data. (fastq to qza format) according to manifest fileUsing the qiime demux summarize command to split sequences and measure the quality, depth of each sample. The visualized output files (qza to qzv format) are save by specifying the output path with –o-visualization parameter. 
  2. Sequence clean-up :denoise, dereplicate, and filters chimeras by DADA2, output 3 files :
    • paired-end-demux.qza ⇒ table_dada2.qza ⇒ table.qzv
    • paired-end-demux.qza ⇒ rep-seqs_dada2.qza ⇒ rep-seqs_dada2.qzv
    • paired-end-demux.qza ⇒ stats_dada2.qza ⇒ stats_dada2.qzv
     

Ref : https://docs.qiime2.org/2021.8/tutorials/overview/

Installation :

All software are included in GA environment

Note :

►執行分析前請先利用CreateProject.sh創建一個專案資料夾,請參閱Project standard folder structure文件。

►執行模組需確認所屬計算節點(–partition) : 一般節點的使用者建議使用ct56 ; 生醫節點的使用者建議使用ngs48G註1

►欲了解模組使用的方式,請執行模組的 -h 指令
 

#註1 : 欲確認使用者身分,請登入國網中心iService後,選取會員中心/計畫管理/我的計畫,若計畫名稱為”國家生醫數位資料與分析運算雲端服務平台III”即為生醫節點使用者

Description :

Tested environmentGAQM20.0.0.2
Software versionqiime2=2021.8.0=py38h5479fe0_0
Usage(Slurm)Command in Slurm (Taiwania III)Quick start
sbatch -A $projectID --mail-user=$email --export='projDir='$(pwd)'/,sampleName=manifest_PE.txt, metaData=metadata.tsv' modules/QIIME2_DPP_PE.sh
Adjust denoise parameters
sbatch -A $projectID --mail-user=$email --export='projDir='$(pwd)'/,sampleName=manifest_PE.txt, metaData=metadata.tsv,denoise=200:200:0:0:2.0:2.0:2:pooled' modules/QIIME2_DPP_PE.sh
Usage(Linux console)Command in linux consoleQuick start
bash modules/QIIME2_DPP_PE.sh -p $(pwd) -s manifest_PE.txt -m metadata.tsv
 Adjust denoise parameters
bash modules/QIIME2_DPP_PE.sh -p $(pwd) -s manifest_PE.txt -m metadata.tsv -d 200:200:0:0:2.0:2.0:2:pooled
#For Slurm operation, please refer to “Basic operation of Taiwania III

Usage :

The following explains the usage of module parameters :

Parameter DescriptionRemark
QIIME2_DPP_PE.shModule of genome mapping分析的模組需存放在[modules]資料夾中
projDir分析專案的資料夾路徑(專案資料夾結構說明Script需在分析專案的資料夾執行,$(pwd) 會傳回使用者現在所在的路徑
sampleName欲執行分析的Pair-end menifest file, 相關格式要求可參考文件官網 資料格式 : *.txt資料路徑 : 分析專案的資料夾例如:sampleName=manifest_PE.txt 是讀取存放在projDir裡的manifest_PE.txt檔案
metaData欲執行分析的樣品元數據檔案, 相關格式要求可參考文件官網資料格式 : *.tsv資料路徑 : 分析專案的資料夾►此檔案在建置時要注意每個欄位不可以有單獨sample為一個組別的情形例如:metaData=metadata.tsv是讀取存放在projDir裡的metadata.tsv檔案
denoise調整denoise的參數. 相關參數的設定可參考官網.►此參數為選擇性參數, 若無設定此參數, 模組會自動調用預設值 240:240:0:0:2.0:2.0:2:pooled例如:denoise=200:200:0:0:2.0:2.0:2:pooled 程式會依其設定的denoise參數進行處理

Leave a comment