विषय पर बढ़ें

परिचय

AI-सहायता प्राप्त अनुवाद - अधिक जानें और सुधार सुझाएं

प्रशिक्षण वातावरण में इस प्रशिक्षण कोर्स को पूरा करने के लिए आवश्यक सभी सॉफ़्टवेयर, कोड और डेटा शामिल हैं, इसलिए आपको स्वयं कुछ भी इंस्टॉल करने की आवश्यकता नहीं है। हालांकि, लॉग इन करने के लिए आपको एक (मुफ़्त) खाता चाहिए, और आपको इंटरफ़ेस से परिचित होने के लिए कुछ मिनट लेने चाहिए।

यदि आपने अभी तक ऐसा नहीं किया है, तो कृपया आगे बढ़ने से पहले वातावरण सेटअप मिनी-कोर्स देखें।

उपलब्ध सामग्री

इस प्रशिक्षण कोर्स के दौरान, हम nf4-science/rnaseq/ डायरेक्टरी में काम करेंगे, जिसमें आपको प्रशिक्षण workspace खोलने पर जाना होगा। इस डायरेक्टरी में सभी कोड फ़ाइलें, टेस्ट डेटा और सहायक फ़ाइलें शामिल हैं जिनकी आपको आवश्यकता होगी।

इस डायरेक्टरी की सामग्री को एक्सप्लोर करने के लिए स्वतंत्र महसूस करें; ऐसा करने का सबसे आसान तरीका VSCode इंटरफ़ेस में प्रशिक्षण workspace के बाईं ओर फ़ाइल एक्सप्लोरर का उपयोग करना है। वैकल्पिक रूप से, आप tree कमांड का उपयोग कर सकते हैं। पूरे कोर्स में, हम डायरेक्टरी संरचना और सामग्री को पठनीय रूप में प्रस्तुत करने के लिए tree के आउटपुट का उपयोग करते हैं, कभी-कभी स्पष्टता के लिए मामूली संशोधनों के साथ।

यहां हम दूसरे स्तर तक सामग्री की तालिका बनाते हैं:

tree . -L 3
डायरेक्टरी सामग्री
rnaseq
├── data
│   ├── genome.fa
│   ├── paired-end.csv
│   ├── reads
│   │   ├── ENCSR000COQ1_1.fastq.gz
│   │   ├── ENCSR000COQ1_2.fastq.gz
│   │   ├── ENCSR000COQ2_1.fastq.gz
│   │   ├── ENCSR000COQ2_2.fastq.gz
│   │   ├── ENCSR000COR1_1.fastq.gz
│   │   ├── ENCSR000COR1_2.fastq.gz
│   │   ├── ENCSR000COR2_1.fastq.gz
│   │   ├── ENCSR000COR2_2.fastq.gz
│   │   ├── ENCSR000CPO1_1.fastq.gz
│   │   ├── ENCSR000CPO1_2.fastq.gz
│   │   ├── ENCSR000CPO2_1.fastq.gz
│   │   └── ENCSR000CPO2_2.fastq.gz
│   └── single-end.csv
├── nextflow.config
├── rnaseq.nf
└── solutions
    ├── modules
    │   ├── fastqc.nf
    │   ├── fastqc_pe.nf
    │   ├── hisat2_align.nf
    │   ├── hisat2_align_pe.nf
    │   ├── multiqc.nf
    │   ├── trim_galore.nf
    │   └── trim_galore_pe.nf
    ├── rnaseq-2.1.nf
    ├── rnaseq-2.2.nf
    ├── rnaseq-2.3.nf
    ├── rnaseq-3.1.nf
    ├── rnaseq-3.2.nf
    └── rnaseq_pe-3.3.nf

Note

चिंता न करें अगर यह बहुत कुछ लगता है; हम कोर्स के प्रत्येक चरण में प्रासंगिक हिस्सों को देखेंगे। यह केवल आपको एक सामान्य अवलोकन देने के लिए है।

शुरुआत करने के लिए आपको यह जानना चाहिए:

  • rnaseq.nf फ़ाइल workflow स्क्रिप्ट की रूपरेखा है जिसे हम विकसित करने के लिए काम करेंगे।

  • फ़ाइल nextflow.config एक कॉन्फ़िगरेशन फ़ाइल है जो न्यूनतम वातावरण गुण सेट करती है। आप इसे अभी के लिए अनदेखा कर सकते हैं।

  • data डायरेक्टरी में इनपुट डेटा और संबंधित संसाधन शामिल हैं:

  • एक संदर्भ जीनोम जिसे genome.fa कहा जाता है, जिसमें मानव क्रोमोसोम 20 (hg19/b37 से) का एक छोटा क्षेत्र शामिल है।

  • RNAseq डेटा जिसे फ़ाइल आकार कम रखने के लिए एक छोटे क्षेत्र में विभाजित किया गया है, reads/ डायरेक्टरी में।
  • CSV फ़ाइलें जो बैच प्रोसेसिंग के लिए उदाहरण डेटा फ़ाइलों की ID और पथ को सूचीबद्ध करती हैं।

  • solutions डायरेक्टरी में कोर्स के प्रत्येक चरण से प्राप्त पूर्ण workflow स्क्रिप्ट और modules शामिल हैं। वे आपके काम की जांच करने और किसी भी समस्या का निवारण करने के लिए संदर्भ के रूप में उपयोग किए जाने के लिए हैं। फ़ाइल नाम में संख्या कोर्स के संबंधित भाग के चरण से मेल खाती है।

Tip

यदि किसी कारण से आप इस डायरेक्टरी से बाहर चले जाते हैं, तो आप इसमें वापस लौटने के लिए हमेशा यह कमांड चला सकते हैं:

cd /workspaces/training/nf4-science/rnaseq

अब, कोर्स शुरू करने के लिए, इस पृष्ठ के निचले दाएं कोने में तीर पर क्लिक करें।