Teil 2: Hello für nf-core umschreiben¶

KI-gestützte Übersetzung - mehr erfahren & Verbesserungen vorschlagen

In diesem zweiten Teil des Hello nf-core Trainingskurses zeigen wir dir, wie du eine nf-core-kompatible Version der Pipeline erstellst, die im Hello Nextflow Einsteigerkurs entwickelt wurde.

Dir ist im ersten Abschnitt des Trainings aufgefallen, dass nf-core-Pipelines einer ziemlich aufwendigen Struktur mit vielen zusätzlichen Dateien folgen. All das von Grund auf zu erstellen wäre sehr mühsam, deshalb hat die nf-core-Community Werkzeuge entwickelt, um dies stattdessen aus einer Vorlage zu erstellen und den Prozess zu beschleunigen.

Wir zeigen dir, wie du diese Werkzeuge verwendest, um ein Pipeline-Gerüst zu erstellen, und dann bestehenden 'normalen' Pipeline-Code auf das nf-core-Gerüst anzupassen.

Falls du mit der Hello-Pipeline nicht vertraut bist oder eine Auffrischung brauchst, schau dir diese Infoseite an.

1. Ein neues Pipeline-Projekt erstellen¶

Zuerst erstellen wir das Gerüst für die neue Pipeline.

Hinweis

Stelle sicher, dass du dich im Terminal im Verzeichnis hello-nf-core befindest.

1.1. Das vorlagenbasierte Pipeline-Erstellungswerkzeug ausführen¶

Lass uns damit beginnen, eine neue Pipeline mit dem Befehl nf-core pipelines create zu erstellen. Dieser erstellt ein neues Pipeline-Gerüst unter Verwendung der nf-core-Basisvorlage, angepasst mit einem Pipeline-Namen, einer Beschreibung und einem Autor.

nf-core pipelines create

Das Ausführen dieses Befehls öffnet eine Text User Interface (TUI) zur Pipeline-Erstellung:

Diese TUI fordert dich auf, grundlegende Informationen über deine Pipeline anzugeben und bietet dir die Auswahl an Funktionen, die du in dein Pipeline-Gerüst einbeziehen oder ausschließen möchtest.

Klicke auf dem Willkommensbildschirm auf Let's go!.
Auf dem Bildschirm Choose pipeline type klicke auf Custom.
Gib deine Pipeline-Details wie folgt ein (ersetze < DEIN NAME > durch deinen eigenen Namen) und klicke dann auf Next.

[ ] GitHub organisation: core
[ ] Workflow name: hello
[ ] A short description of your pipeline: A basic nf-core style version of Hello Nextflow
[ ] Name of the main author(s): < DEIN NAME >

Auf dem Template features Bildschirm stelle Toggle all features auf off, dann aktiviere selektiv die folgenden Optionen. Überprüfe deine Auswahl und klicke auf Continue.

[ ] Add testing profiles
[ ] Use nf-core components
[ ] Use nf-schema
[ ] Add configuration files
[ ] Add documentation

Auf dem Bildschirm Final details klicke auf Finish. Warte, bis die Pipeline erstellt wurde, dann klicke auf Continue.
Auf dem Bildschirm Create GitHub repository klicke auf Finish without creating a repo. Dies zeigt Anweisungen zum späteren Erstellen eines GitHub-Repositories an. Ignoriere diese und klicke auf Close.

Sobald die TUI sich schließt, solltest du die folgende Konsolenausgabe sehen.

Befehlsausgabe

                                          ,--./,-.
          ___     __   __   __   ___     /,-._.--~\
    |\ | |__  __ /  ` /  \ |__) |__         }  {
    | \| |       \__, \__/ |  \ |___     \`-._,-`-,
                                          `._,._,'

    nf-core/tools version 3.4.1 - https://nf-co.re


INFO     Launching interactive nf-core pipeline creation tool.

Es gibt keine explizite Bestätigung in der Konsolenausgabe, dass die Pipeline-Erstellung funktioniert hat, aber du solltest ein neues Verzeichnis namens core-hello sehen.

Sieh dir den Inhalt des neuen Verzeichnisses an, um zu sehen, wie viel Arbeit du dir durch die Verwendung der Vorlage erspart hast.

tree core-hello

Verzeichnisinhalt

core-hello/
├── assets
│   ├── samplesheet.csv
│   └── schema_input.json
├── conf
│   ├── base.config
│   ├── modules.config
│   ├── test.config
│   └── test_full.config
├── docs
│   ├── output.md
│   ├── README.md
│   └── usage.md
├── main.nf
├── modules.json
├── nextflow.config
├── nextflow_schema.json
├── README.md
├── subworkflows
│   ├── local
│   │   └── utils_nfcore_hello_pipeline
│   │       └── main.nf
│   └── nf-core
│       ├── utils_nextflow_pipeline
│       │   ├── main.nf
│       │   ├── meta.yml
│       │   └── tests
│       │       ├── main.function.nf.test
│       │       ├── main.function.nf.test.snap
│       │       ├── main.workflow.nf.test
│       │       └── nextflow.config
│       ├── utils_nfcore_pipeline
│       │   ├── main.nf
│       │   ├── meta.yml
│       │   └── tests
│       │       ├── main.function.nf.test
│       │       ├── main.function.nf.test.snap
│       │       ├── main.workflow.nf.test
│       │       ├── main.workflow.nf.test.snap
│       │       └── nextflow.config
│       └── utils_nfschema_plugin
│           ├── main.nf
│           ├── meta.yml
│           └── tests
│               ├── main.nf.test
│               ├── nextflow.config
│               └── nextflow_schema.json
└── workflows
    └── hello.nf

14 directories, 34 files

Das sind eine Menge Dateien!

Hoffentlich erkennst du viele davon als dieselben, die wir bei der Untersuchung der nf-core/demo-Pipeline-Struktur kennengelernt haben. Aber keine Sorge, wenn du dich noch etwas verloren fühlst; wir werden im Verlauf dieses Trainings gemeinsam die wichtigen Teile durchgehen.

Hinweis

Ein wichtiger Unterschied im Vergleich zur nf-core/demo-Pipeline, die wir im ersten Teil dieses Trainings untersucht haben, ist, dass es kein modules-Verzeichnis gibt. Das liegt daran, dass wir uns nicht dafür entschieden haben, eines der Standard-nf-core-Module einzubeziehen.

1.2. Testen, dass das Gerüst funktionsfähig ist¶

Glaub es oder nicht, auch wenn du noch keine Module hinzugefügt hast, um echte Arbeit zu leisten, kann das Pipeline-Gerüst tatsächlich mit dem Testprofil ausgeführt werden, auf die gleiche Weise wie wir die nf-core/demo-Pipeline ausgeführt haben.

nextflow run ./core-hello -profile docker,test --outdir core-hello-results

Befehlsausgabe

N E X T F L O W   ~  version 25.04.3

Launching `./core-hello/main.nf` [scruffy_marconi] DSL2 - revision: b9e9b3b8de

Downloading plugin nf-schema@2.5.1
Input/output options
  input                     : https://raw.githubusercontent.com/nf-core/test-datasets/viralrecon/samplesheet/samplesheet_test_illumina_amplicon.csv
  outdir                    : core-hello-results

Institutional config options
  config_profile_name       : Test profile
  config_profile_description: Minimal test dataset to check pipeline function

Generic options
  trace_report_suffix       : 2025-11-21_04-47-18

Core Nextflow options
  runName                   : scruffy_marconi
  containerEngine           : docker
  launchDir                 : /workspaces/training/hello-nf-core
  workDir                   : /workspaces/training/hello-nf-core/work
  projectDir                : /workspaces/training/hello-nf-core/core-hello
  userName                  : root
  profile                   : docker,test
  configFiles               : /workspaces/training/hello-nf-core/core-hello/nextflow.config

!! Only displaying parameters that differ from the pipeline defaults !!
------------------------------------------------------
-[core/hello] Pipeline completed successfully-

Dies zeigt dir, dass die gesamte grundlegende Verkabelung vorhanden ist. Wo sind also die Ausgaben? Gibt es welche?

Tatsächlich wurde ein neues Ergebnisverzeichnis namens core-hello-results erstellt, das die standardmäßigen Ausführungsberichte enthält:

tree core-hello-results

Verzeichnisinhalt

core-hello-results
└── pipeline_info
    ├── execution_report_2025-11-21_04-47-18.html
    ├── execution_timeline_2025-11-21_04-47-18.html
    ├── execution_trace_2025-11-21_04-47-18.txt
    ├── hello_software_versions.yml
    ├── params_2025-11-21_04-47-18.json
    └── pipeline_dag_2025-11-21_04-47-18.html

1 directory, 6 files

Du kannst einen Blick in die Berichte werfen, um zu sehen, was ausgeführt wurde, und die Antwort ist: überhaupt nichts!

leerer Execution-Timeline-Bericht

Schauen wir uns an, was tatsächlich im Code steht.

1.3. Den Platzhalter-Workflow untersuchen¶

Wenn du in die Datei main.nf schaust, siehst du, dass sie einen Workflow namens HELLO aus workflows/hello importiert.

Dies entspricht dem workflows/demo.nf-Workflow, dem wir in Teil 1 begegnet sind, und dient als Platzhalter-Workflow für unseren Workflow von Interesse, mit bereits vorhandener nf-core-Funktionalität.

core-hello/workflows/hello.nf
/*
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
    IMPORT MODULES / SUBWORKFLOWS / FUNCTIONS
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
*/
include { paramsSummaryMap       } from 'plugin/nf-schema'
include { softwareVersionsToYAML } from '../subworkflows/nf-core/utils_nfcore_pipeline'

/*
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
    RUN MAIN WORKFLOW
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
*/

workflow HELLO {

    take:
    ch_samplesheet // Channel: Samplesheet eingelesen von --input
    main:

    ch_versions = channel.empty()

    //
    // Software-Versionen sammeln und speichern
    //
    softwareVersionsToYAML(ch_versions)
        .collectFile(
            storeDir: "${params.outdir}/pipeline_info",
            name:  'hello_software_'  + 'versions.yml',
            sort: true,
            newLine: true
        ).set { ch_collated_versions }


    emit:
    versions       = ch_versions                 // Channel: [ path(versions.yml) ]

}

/*
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
    THE END
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
*/

Im Vergleich zu einem grundlegenden Nextflow-Workflow wie dem, der in Hello Nextflow entwickelt wurde, wirst du hier ein paar Dinge bemerken, die neu sind (hervorgehobene Zeilen oben):

Der Workflow-Block hat einen Namen
Workflow-Eingaben werden mit dem Schlüsselwort take: deklariert und die Kanal-Konstruktion wird in den übergeordneten Workflow verschoben
Workflow-Inhalt wird in einem main:-Block platziert
Ausgaben werden mit dem Schlüsselwort emit: deklariert

Dies sind optionale Funktionen von Nextflow, die den Workflow komponierbar machen, was bedeutet, dass er aus einem anderen Workflow heraus aufgerufen werden kann.

Komponierbare Workflows im Detail

Der Workflows of Workflows Side Quest untersucht die Workflow-Komposition viel ausführlicher, einschließlich wie man mehrere Workflows zusammensetzt und komplexe Datenflüsse zwischen ihnen verwaltet. Wir führen die Komponierbarkeit hier ein, weil sie eine grundlegende Anforderung der nf-core-Template-Architektur ist, die verschachtelte Workflows verwendet, um Pipeline-Initialisierung, den Hauptanalyse-Workflow und Abschlussaufgaben in separate, wiederverwendbare Komponenten zu organisieren.

Wir müssen die relevante Logik aus unserem Workflow von Interesse in diese Struktur einbinden. Der erste Schritt dafür ist, unseren ursprünglichen Workflow komponierbar zu machen.

Zusammenfassung¶

Du weißt jetzt, wie man ein Pipeline-Gerüst mit nf-core-Tools erstellt.

Was kommt als Nächstes?¶

Lerne, wie man einen einfachen Workflow komponierbar macht als Vorbereitung darauf, ihn nf-core-kompatibel zu machen.

2. Den ursprünglichen Hello Nextflow-Workflow komponierbar machen¶

Jetzt ist es Zeit, mit der Integration unseres Workflows in das nf-core-Gerüst zu beginnen. Zur Erinnerung: Wir arbeiten mit dem Workflow aus unserem Hello Nextflow Trainingskurs.

Tipp

Falls du mit dieser Pipeline nicht vertraut bist oder eine Auffrischung brauchst, siehe Die Hello-Pipeline.

Wir stellen dir eine saubere, voll funktionsfähige Kopie des abgeschlossenen Hello Nextflow-Workflows im Verzeichnis original-hello zusammen mit seinen Modulen und der Standard-CSV-Datei zur Verfügung, die sie als Eingabe erwartet.

tree original-hello/

Verzeichnisinhalt

original-hello/
├── hello.nf
├── modules
│   ├── collectGreetings.nf
│   ├── convertToUpper.nf
│   ├── cowpy.nf
│   └── sayHello.nf
└── nextflow.config

1 directory, 6 files

Führe sie gerne aus, um dich selbst zu überzeugen, dass sie funktioniert:

nextflow run original-hello/hello.nf

Befehlsausgabe

N E X T F L O W   ~  version 25.04.3

Launching `original-hello/hello.nf` [goofy_babbage] DSL2 - revision: e9e72441e9

executor >  local (8)
[a4/081cec] sayHello (1)       | 3 of 3 ✔
[e7/7e9058] convertToUpper (3) | 3 of 3 ✔
[0c/17263b] collectGreetings   | 1 of 1 ✔
[94/542280] cowpy              | 1 of 1 ✔

Lass uns die Workflow-Datei hello.nf öffnen, um den Code zu inspizieren, der unten vollständig gezeigt wird (die Prozesse nicht mitgezählt, die in Modulen sind):

original-hello/hello.nf
#!/usr/bin/env nextflow

/*
* Pipeline-Parameter
*/
params.greeting = 'greetings.csv'
params.batch = 'test-batch'
params.character = 'turkey'

// Module einbinden
include { sayHello } from './modules/sayHello.nf'
include { convertToUpper } from './modules/convertToUpper.nf'
include { collectGreetings } from './modules/collectGreetings.nf'
include { cowpy } from './modules/cowpy.nf'

workflow {

  // Einen Channel für Eingaben aus einer CSV-Datei erstellen
  greeting_ch = channel.fromPath(params.greeting)
                      .splitCsv()
                      .map { line -> line[0] }

  // Eine Begrüßung ausgeben
  sayHello(greeting_ch)

  // Die Begrüßung in Großbuchstaben umwandeln
  convertToUpper(sayHello.out)

  // Alle Begrüßungen in einer Datei sammeln
  collectGreetings(convertToUpper.out.collect(), params.batch)

  // ASCII-Kunst der Begrüßungen mit cowpy generieren
  cowpy(collectGreetings.out.outfile, params.character)
}

Wie du sehen kannst, wurde dieser Workflow als einfacher unbenannter Workflow geschrieben, der eigenständig ausgeführt werden kann. Um ihn aus einem übergeordneten Workflow heraus ausführbar zu machen, wie es die nf-core-Vorlage erfordert, müssen wir ihn komponierbar machen.

Gehen wir die notwendigen Änderungen Schritt für Schritt durch.

2.1. Den Workflow benennen¶

Zuerst geben wir dem Workflow einen Namen, damit wir ihn aus einem übergeordneten Workflow referenzieren können.

NachherVorher

original-hello/hello.nf
workflow HELLO {

original-hello/hello.nf
workflow {

Für Workflow-Namen gelten die gleichen Konventionen wie für Modulnamen.

2.2. Kanal-Konstruktion durch `take` ersetzen¶

Ersetze nun die Kanal-Konstruktion durch eine einfache take-Anweisung, die erwartete Eingaben deklariert.

NachherVorher

original-hello/hello.nf
    take:
    // Channel für Begrüßungen
    greeting_ch

original-hello/hello.nf
    // Einen Channel für Eingaben aus einer CSV-Datei erstellen
    greeting_ch = channel.fromPath(params.greeting)
                        .splitCsv()
                        .map { line -> line[0] }

Dies überlässt die Details, wie die Eingaben bereitgestellt werden, dem übergeordneten Workflow.

Während wir dabei sind, können wir auch die Zeile params.greeting = 'greetings.csv' auskommentieren

NachherVorher

original-hello/hello.nf
    /*
    * Pipeline parameters
    */
    //params.greeting = 'greetings.csv'
    params.batch = 'test-batch'
    params.character = 'turkey'

original-hello/hello.nf
    /*
    * Pipeline parameters
    */
    params.greeting = 'greetings.csv'
    params.batch = 'test-batch'
    params.character = 'turkey'

Hinweis

Falls du die Nextflow Language Server Extension installiert hast, wird der Syntax-Checker deinen Code mit roten Wellenlinien markieren. Das liegt daran, dass du, wenn du eine take:-Anweisung einfügst, auch ein main: haben musst.

Das fügen wir im nächsten Schritt hinzu.

2.3. Workflow-Operationen mit `main`-Anweisung einleiten¶

Als Nächstes füge eine main-Anweisung vor den restlichen Operationen hinzu, die im Körper des Workflows aufgerufen werden.

NachherVorher

original-hello/hello.nf
    main:

    // Eine Begrüßung ausgeben
    sayHello(greeting_ch)

    // Die Begrüßung in Großbuchstaben umwandeln
    convertToUpper(sayHello.out)

    // Alle Begrüßungen in einer Datei sammeln
    collectGreetings(convertToUpper.out.collect(), params.batch)

    // ASCII-Kunst der Begrüßungen mit cowpy generieren
    cowpy(collectGreetings.out.outfile, params.character)

original-hello/hello.nf
    // Eine Begrüßung ausgeben
    sayHello(greeting_ch)

    // Die Begrüßung in Großbuchstaben umwandeln
    convertToUpper(sayHello.out)

    // Alle Begrüßungen in einer Datei sammeln
    collectGreetings(convertToUpper.out.collect(), params.batch)

    // ASCII-Kunst der Begrüßungen mit cowpy generieren
    cowpy(collectGreetings.out.outfile, params.character)

Dies sagt im Grunde 'das ist es, was dieser Workflow macht'.

2.4. `emit`-Anweisung hinzufügen¶

Füge schließlich eine emit-Anweisung hinzu, die deklariert, was die finalen Ausgaben des Workflows sind.

original-hello/hello.nf
    emit:
    cowpy_hellos = cowpy.out

Dies ist eine neue Ergänzung zum Code im Vergleich zum ursprünglichen Workflow.

2.5. Zusammenfassung der abgeschlossenen Änderungen¶

Wenn du alle Änderungen wie beschrieben vorgenommen hast, sollte dein Workflow jetzt so aussehen:

original-hello/hello.nf
#!/usr/bin/env nextflow

/*
* Pipeline parameters
*/
// params.greeting = 'greetings.csv' (auskommentiert)
params.batch = 'test-batch'
params.character = 'turkey'

// Module einbinden
include { sayHello } from './modules/sayHello.nf'
include { convertToUpper } from './modules/convertToUpper.nf'
include { collectGreetings } from './modules/collectGreetings.nf'
include { cowpy } from './modules/cowpy.nf'

workflow HELLO {

    take:
    // Channel für Begrüßungen
    greeting_ch

    main:

    // Eine Begrüßung ausgeben
    sayHello(greeting_ch)

    // Die Begrüßung in Großbuchstaben umwandeln
    convertToUpper(sayHello.out)

    // Alle Begrüßungen in einer Datei sammeln
    collectGreetings(convertToUpper.out.collect(), params.batch)

    // ASCII-Kunst der Begrüßungen mit cowpy generieren
    cowpy(collectGreetings.out.outfile, params.character)

    emit:
    cowpy_hellos = cowpy.out
}

Dies beschreibt alles, was Nextflow braucht, AUSSER was in den Eingabekanal eingespeist werden soll. Das wird im übergeordneten Workflow definiert, auch Einstiegspunkt-Workflow genannt.

2.6. Einen Dummy-Einstiegspunkt-Workflow erstellen¶

Bevor wir unseren komponierbaren Workflow in das komplexe nf-core-Gerüst integrieren, überprüfen wir, ob er korrekt funktioniert. Wir können einen einfachen Dummy-Einstiegspunkt-Workflow erstellen, um den komponierbaren Workflow isoliert zu testen.

Erstelle eine leere Datei namens main.nf im selben original-hello-Verzeichnis.

touch original-hello/main.nf

Kopiere den folgenden Code in die Datei main.nf.

original-hello/main.nf
#!/usr/bin/env nextflow

// Den Workflow-Code aus der hello.nf-Datei importieren
include { HELLO } from './hello.nf'

// Eingabeparameter deklarieren
params.greeting = 'greetings.csv'

workflow {
  // Einen Channel für Eingaben aus einer CSV-Datei erstellen
  greeting_ch = channel.fromPath(params.greeting)
                      .splitCsv()
                      .map { line -> line[0] }

  // Den importierten Workflow mit dem Channel der Begrüßungen aufrufen
  HELLO(greeting_ch)

  // Die vom Workflow ausgegebenen Ergebnisse anzeigen
  HELLO.out.view { output -> "Output: $output" }
}

Hier gibt es zwei wichtige Beobachtungen:

Die Syntax zum Aufrufen des importierten Workflows ist im Wesentlichen dieselbe wie die Syntax zum Aufrufen von Modulen.
Alles, was mit dem Einbringen der Eingaben in den Workflow zu tun hat (Eingabeparameter und Kanal-Konstruktion), wird jetzt in diesem übergeordneten Workflow deklariert.

Hinweis

Die Benennung der Einstiegspunkt-Workflow-Datei main.nf ist eine Konvention, keine Anforderung.

Wenn du dieser Konvention folgst, kannst du die Angabe des Workflow-Dateinamens in deinem nextflow run-Befehl weglassen. Nextflow sucht automatisch nach einer Datei namens main.nf im Ausführungsverzeichnis.

Du kannst die Einstiegspunkt-Workflow-Datei jedoch auch anders benennen, wenn du möchtest. In diesem Fall stelle sicher, dass du den Workflow-Dateinamen in deinem nextflow run-Befehl angibst.

2.7. Testen, dass der Workflow läuft¶

Wir haben endlich alle Teile, die wir brauchen, um zu überprüfen, dass der komponierbare Workflow funktioniert. Lass uns ihn ausführen!

nextflow run ./original-hello

Hier siehst du den Vorteil der Verwendung der main.nf-Namenskonvention. Hätten wir den Einstiegspunkt-Workflow something_else.nf genannt, hätten wir nextflow run original-hello/something_else.nf ausführen müssen.

Wenn du alle Änderungen korrekt vorgenommen hast, sollte dies bis zum Abschluss laufen.

Befehlsausgabe

N E X T F L O W   ~  version 25.04.3

Launching `original-hello/main.nf` [friendly_wright] DSL2 - revision: 1ecd2d9c0a

executor >  local (8)
[24/c6c0d8] HELLO:sayHello (3)       | 3 of 3 ✔
[dc/721042] HELLO:convertToUpper (3) | 3 of 3 ✔
[48/5ab2df] HELLO:collectGreetings   | 1 of 1 ✔
[e3/693b7e] HELLO:cowpy              | 1 of 1 ✔
Output: /workspaces/training/hello-nf-core/work/e3/693b7e48dc119d0c54543e0634c2e7/cowpy-COLLECTED-test-batch-output.txt

Das bedeutet, wir haben unseren HELLO-Workflow erfolgreich auf komponierbar aktualisiert.

Zusammenfassung¶

Du weißt, wie man einen Workflow komponierbar macht, indem man ihm einen Namen gibt und take-, main- und emit-Anweisungen hinzufügt, und wie man ihn aus einem Einstiegspunkt-Workflow aufruft.

Was kommt als Nächstes?¶

Lerne, wie man einen einfachen komponierbaren Workflow auf das nf-core-Gerüst aufpfropft.

3. Die aktualisierte Workflow-Logik in den Platzhalter-Workflow einpassen¶

Nachdem wir überprüft haben, dass unser komponierbarer Workflow korrekt funktioniert, kehren wir zum nf-core-Pipeline-Gerüst zurück, das wir in Abschnitt 1 erstellt haben. Wir wollen den komponierbaren Workflow, den wir gerade entwickelt haben, in die nf-core-Template-Struktur integrieren, sodass das Endergebnis ungefähr so aussehen sollte.

Wie machen wir das? Werfen wir einen Blick auf den aktuellen Inhalt des HELLO-Workflows in core-hello/workflows/hello.nf (das nf-core-Gerüst).

core-hello/workflows/hello.nf
/*
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
    IMPORT MODULES / SUBWORKFLOWS / FUNCTIONS
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
*/
include { paramsSummaryMap       } from 'plugin/nf-schema'
include { softwareVersionsToYAML } from '../subworkflows/nf-core/utils_nfcore_pipeline'

/*
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
    RUN MAIN WORKFLOW
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
*/

workflow HELLO {

    take:
    ch_samplesheet // Channel: Samplesheet eingelesen von --input
    main:

    ch_versions = channel.empty()

    //
    // Software-Versionen sammeln und speichern
    //
    softwareVersionsToYAML(ch_versions)
        .collectFile(
            storeDir: "${params.outdir}/pipeline_info",
            name:  'hello_software_'  + 'versions.yml',
            sort: true,
            newLine: true
        ).set { ch_collated_versions }


    emit:
    versions       = ch_versions                 // Channel: [ path(versions.yml) ]

}

/*
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
    THE END
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
*/

Insgesamt macht dieser Code nur sehr wenig abgesehen von einiger Buchhaltung, die damit zu tun hat, die Version aller Softwaretools zu erfassen, die in der Pipeline ausgeführt werden.

Wir müssen den relevanten Code aus der komponierbaren Version des ursprünglichen Workflows hinzufügen, den wir in Abschnitt 2 entwickelt haben.

Wir werden dies in den folgenden Phasen angehen:

Module kopieren und Modul-Importe einrichten
Die take-Deklaration so lassen wie sie ist
Die Workflow-Logik zum main-Block hinzufügen
Den emit-Block aktualisieren

Hinweis

Wir werden die Versionserfassung bei diesem ersten Durchgang ignorieren und in einem späteren Teil dieses Trainings zeigen, wie man das verdrahtet.

3.1. Module kopieren und Modul-Importe einrichten¶

Die vier Prozesse aus unserem Hello Nextflow-Workflow sind als Module in original-hello/modules/ gespeichert. Wir müssen diese Module in die nf-core-Projektstruktur (unter core-hello/modules/local/) kopieren und Import-Anweisungen zur nf-core-Workflow-Datei hinzufügen.

Lass uns zuerst die Moduldateien von original-hello/ nach core-hello/ kopieren:

mkdir -p core-hello/modules/local/
cp original-hello/modules/* core-hello/modules/local/.

Du solltest jetzt das Verzeichnis der Module unter core-hello/ aufgelistet sehen.

tree core-hello/modules

Verzeichnisinhalt

core-hello/modules
└── local
    ├── collectGreetings.nf
    ├── convertToUpper.nf
    ├── cowpy.nf
    └── sayHello.nf

1 directory, 4 files

Jetzt richten wir die Modul-Import-Anweisungen ein.

Das waren die Import-Anweisungen im original-hello/hello.nf-Workflow:

original-hello/hello.nf
// Module einbinden
include { sayHello } from './modules/sayHello.nf'
include { convertToUpper } from './modules/convertToUpper.nf'
include { collectGreetings } from './modules/collectGreetings.nf'
include { cowpy } from './modules/cowpy.nf'

Öffne die Datei core-hello/workflows/hello.nf und übertrage diese Import-Anweisungen hinein, wie unten gezeigt.

NachherVorher

core-hello/workflows/hello.nf
/*
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
    IMPORT MODULES / SUBWORKFLOWS / FUNCTIONS
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
*/
include { paramsSummaryMap       } from 'plugin/nf-schema'
include { softwareVersionsToYAML } from '../subworkflows/nf-core/utils_nfcore_pipeline'
include { sayHello               } from '../modules/local/sayHello.nf'
include { convertToUpper         } from '../modules/local/convertToUpper.nf'
include { collectGreetings       } from '../modules/local/collectGreetings.nf'
include { cowpy                  } from '../modules/local/cowpy.nf'

core-hello/workflows/hello.nf
/*
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
    IMPORT MODULES / SUBWORKFLOWS / FUNCTIONS
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
*/
include { paramsSummaryMap       } from 'plugin/nf-schema'
include { softwareVersionsToYAML } from '../subworkflows/nf-core/utils_nfcore_pipeline'

Zwei weitere interessante Beobachtungen hier:

Wir haben die Formatierung der Import-Anweisungen angepasst, um der nf-core-Stilkonvention zu folgen.
Wir haben die relativen Pfade zu den Modulen aktualisiert, um widerzuspiegeln, dass sie jetzt auf einer anderen Verschachtelungsebene gespeichert sind.

3.2. Die `take`-Deklaration so lassen wie sie ist¶

Das nf-core-Projekt hat viel vorgebaute Funktionalität rund um das Konzept des Samplesheets, das typischerweise eine CSV-Datei mit spaltenförmigen Daten ist. Da dies im Wesentlichen das ist, was unsere greetings.csv-Datei ist, behalten wir die aktuelle take-Deklaration bei und aktualisieren einfach den Namen des Eingabekanals im nächsten Schritt.

core-hello/workflows/hello.nf
    take:
    ch_samplesheet // Channel: Samplesheet eingelesen von --input

Die Eingabebehandlung wird oberhalb dieses Workflows erfolgen (nicht in dieser Codedatei).

3.3. Die Workflow-Logik zum `main`-Block hinzufügen¶

Jetzt, da unsere Module dem Workflow zur Verfügung stehen, können wir die Workflow-Logik in den main-Block einfügen.

Zur Erinnerung: Dies ist der relevante Code im ursprünglichen Workflow, der sich nicht viel geändert hat, als wir ihn komponierbar gemacht haben (wir haben nur die Zeile main: hinzugefügt):

original-hello/hello.nf
    main:

    // Eine Begrüßung ausgeben
    sayHello(greeting_ch)

    // Die Begrüßung in Großbuchstaben umwandeln
    convertToUpper(sayHello.out)

    // Alle Begrüßungen in einer Datei sammeln
    collectGreetings(convertToUpper.out.collect(), params.batch)

    // ASCII-Kunst der Begrüßungen mit cowpy generieren
    cowpy(collectGreetings.out.outfile, params.character)

Wir müssen den Code, der nach main: kommt, in die neue Version des Workflows kopieren.

Es gibt bereits etwas Code dort, der damit zu tun hat, die Versionen der Tools zu erfassen, die vom Workflow ausgeführt werden. Das lassen wir vorerst in Ruhe (wir werden uns später mit den Tool-Versionen befassen). Wir behalten die Initialisierung ch_versions = channel.empty() oben bei, fügen dann unsere Workflow-Logik ein und behalten den Versionskollationscode am Ende. Diese Reihenfolge macht Sinn, weil in einer echten Pipeline die Prozesse Versionsinformationen ausgeben würden, die dem ch_versions-Kanal hinzugefügt würden, während der Workflow läuft.

NachherVorher

core-hello/workflows/hello.nf
workflow HELLO {

    take:
    ch_samplesheet // Channel: Samplesheet eingelesen von --input

    main:

    ch_versions = Channel.empty()

    // Eine Begrüßung ausgeben
    sayHello(greeting_ch)

    // Die Begrüßung in Großbuchstaben umwandeln
    convertToUpper(sayHello.out)

    // Alle Begrüßungen in einer Datei sammeln
    collectGreetings(convertToUpper.out.collect(), params.batch)

    // ASCII-Kunst der Begrüßungen mit cowpy generieren
    cowpy(collectGreetings.out.outfile, params.character)

    //
    // Software-Versionen sammeln und speichern
    //
    softwareVersionsToYAML(ch_versions)
        .collectFile(
            storeDir: "${params.outdir}/pipeline_info",
            name:  'hello_software_'  + 'versions.yml',
            sort: true,
            newLine: true
        ).set { ch_collated_versions }


    emit:
    versions       = ch_versions                 // Channel: [ path(versions.yml) ]

}

core-hello/workflows/hello.nf
workflow HELLO {

    take:
    ch_samplesheet // Channel: Samplesheet eingelesen von --input
    main:

    ch_versions = Channel.empty()

    //
    // Software-Versionen sammeln und speichern
    //
    softwareVersionsToYAML(ch_versions)
        .collectFile(
            storeDir: "${params.outdir}/pipeline_info",
            name:  'hello_software_'  + 'versions.yml',
            sort: true,
            newLine: true
        ).set { ch_collated_versions }


    emit:
    versions       = ch_versions                 // Channel: [ path(versions.yml) ]

}

Du wirst bemerken, dass wir auch eine Leerzeile vor main: hinzugefügt haben, um den Code lesbarer zu machen.

Das sieht großartig aus, aber wir müssen noch den Namen des Kanals aktualisieren, den wir an den sayHello()-Prozess übergeben, von greeting_ch zu ch_samplesheet, wie unten gezeigt, damit er mit dem übereinstimmt, was unter dem take:-Schlüsselwort geschrieben steht.

NachherVorher

core-hello/workflows/hello.nf
    // Eine Begrüßung ausgeben (aktualisiert für die nf-core-Konvention für Samplesheets)
    sayHello(ch_samplesheet)

core-hello/workflows/hello.nf
    // Eine Begrüßung ausgeben
    sayHello(greeting_ch)

Jetzt ist die Workflow-Logik korrekt verdrahtet.

3.4. Den `emit`-Block aktualisieren¶

Schließlich müssen wir den emit-Block aktualisieren, um die Deklaration der finalen Ausgaben des Workflows einzubeziehen.

NachherVorher

core-hello/workflows/hello.nf
    emit:
    cowpy_hellos   = cowpy.out
    versions       = ch_versions                 // Channel: [ path(versions.yml) ]

core-hello/workflows/hello.nf
    emit:
    versions       = ch_versions                 // Channel: [ path(versions.yml) ]

Damit sind die Änderungen abgeschlossen, die wir am HELLO-Workflow selbst vornehmen müssen. An diesem Punkt haben wir die Gesamt-Code-Struktur erreicht, die wir umsetzen wollten.

Zusammenfassung¶

Du weißt, wie man die Kernstücke eines komponierbaren Workflows in einen nf-core-Platzhalter-Workflow einfügt.

Was kommt als Nächstes?¶

Lerne, wie man die Handhabung der Eingaben im nf-core-Pipeline-Gerüst anpasst.

4. Die Eingabebehandlung anpassen¶

Nachdem wir unsere Workflow-Logik erfolgreich in das nf-core-Gerüst integriert haben, müssen wir uns noch einem kritischen Teil widmen: sicherstellen, dass unsere Eingabedaten korrekt verarbeitet werden. Die nf-core-Vorlage kommt mit ausgeklügelter Eingabebehandlung, die für komplexe Genomik-Datensätze entwickelt wurde, also müssen wir sie anpassen, damit sie mit unserer einfacheren greetings.csv-Datei funktioniert.

4.1. Identifizieren, wo Eingaben behandelt werden¶

Der erste Schritt ist herauszufinden, wo die Eingabebehandlung durchgeführt wird.

Du erinnerst dich vielleicht, dass wir, als wir den Hello Nextflow-Workflow umgeschrieben haben, um ihn komponierbar zu machen, die Eingabeparameter-Deklaration eine Ebene höher verschoben haben, in den main.nf-Einstiegspunkt-Workflow. Also schauen wir uns den obersten main.nf-Einstiegspunkt-Workflow an, der als Teil des Pipeline-Gerüsts erstellt wurde:

core-hello/main.nf
#!/usr/bin/env nextflow
/*
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
    core/hello
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
    Github : https://github.com/core/hello
----------------------------------------------------------------------------------------
*/

/*
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
    IMPORT FUNCTIONS / MODULES / SUBWORKFLOWS / WORKFLOWS
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
*/

include { HELLO  } from './workflows/hello'
include { PIPELINE_INITIALISATION } from './subworkflows/local/utils_nfcore_hello_pipeline'
include { PIPELINE_COMPLETION     } from './subworkflows/local/utils_nfcore_hello_pipeline'
/*
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
    NAMED WORKFLOWS FOR PIPELINE
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
*/

//
// WORKFLOW: Haupt-Analyse-Pipeline abhängig vom Eingabetyp ausführen
//
workflow CORE_HELLO {

    take:
    samplesheet // Channel: Samplesheet eingelesen von --input

    main:

    //
    // WORKFLOW: Pipeline ausführen
    //
    HELLO (
        samplesheet
    )
}
/*
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
    RUN MAIN WORKFLOW
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
*/

workflow {

    main:
    //
    // SUBWORKFLOW: Initialisierungsaufgaben ausführen
    //
    PIPELINE_INITIALISATION (
        params.version,
        params.validate_params,
        params.monochrome_logs,
        args,
        params.outdir,
        params.input
    )

    //
    // WORKFLOW: Haupt-Workflow ausführen
    //
    CORE_HELLO (
        PIPELINE_INITIALISATION.out.samplesheet
    )
    //
    // SUBWORKFLOW: Abschlussaufgaben ausführen
    //
    PIPELINE_COMPLETION (
        params.outdir,
        params.monochrome_logs,
    )
}

/*
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
    THE END
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
*/

Das nf-core-Projekt macht starken Gebrauch von verschachtelten Subworkflows, daher kann dieser Teil bei der ersten Annäherung etwas verwirrend sein.

Was hier wichtig ist, ist, dass zwei Workflows definiert sind:

CORE_HELLO ist ein dünner Wrapper zum Ausführen des HELLO-Workflows, den wir gerade in core-hello/workflows/hello.nf angepasst haben.
Ein unbenannter Workflow, der CORE_HELLO sowie zwei andere Subworkflows aufruft, PIPELINE_INITIALISATION und PIPELINE_COMPLETION.

Hier ist ein Diagramm, wie sie zueinander in Beziehung stehen:

Wichtig ist, dass wir auf dieser Ebene keinen Code finden können, der einen Eingabekanal konstruiert, nur Verweise auf ein Samplesheet, das über den Parameter --input bereitgestellt wird.

Etwas Herumstöbern offenbart, dass die Eingabebehandlung vom Subworkflow PIPELINE_INITIALISATION durchgeführt wird, passenderweise, der aus core-hello/subworkflows/local/utils_nfcore_hello_pipeline/main.nf importiert wird.

Wenn wir diese Datei öffnen und nach unten scrollen, kommen wir zu diesem Codeblock:

core-hello/subworkflows/local/utils_nfcore_hello_pipeline/main.nf
    //
    // Channel aus der Eingabedatei erstellen, die über params.input bereitgestellt wird
    //

    channel
        .fromList(samplesheetToList(params.input, "${projectDir}/assets/schema_input.json"))
        .map {
            meta, fastq_1, fastq_2 ->
                if (!fastq_2) {
                    return [ meta.id, meta + [ single_end:true ], [ fastq_1 ] ]
                } else {
                    return [ meta.id, meta + [ single_end:false ], [ fastq_1, fastq_2 ] ]
                }
        }
        .groupTuple()
        .map { samplesheet ->
            validateInputSamplesheet(samplesheet)
        }
        .map {
            meta, fastqs ->
                return [ meta, fastqs.flatten() ]
        }
        .set { ch_samplesheet }

    emit:
    samplesheet = ch_samplesheet
    versions    = ch_versions

Dies ist die Kanal-Factory, die das Samplesheet parst und es in einer Form weitergibt, die bereit ist, vom HELLO-Workflow konsumiert zu werden.

Hinweis

Die Syntax oben unterscheidet sich etwas von dem, was wir bisher verwendet haben, aber grundsätzlich ist dies:

channel.<...>.set { ch_samplesheet }

äquivalent zu diesem:

ch_samplesheet = channel.<...>

Dieser Code umfasst einige Parse- und Validierungsschritte, die sehr spezifisch für das Beispiel-Samplesheet sind, das mit der nf-core-Pipeline-Vorlage enthalten ist, das zum Zeitpunkt des Schreibens sehr domänenspezifisch und für unser einfaches Pipeline-Projekt nicht geeignet ist.

4.2. Den vorlagenbasierten Eingabekanalcode ersetzen¶

Die gute Nachricht ist, dass die Bedürfnisse unserer Pipeline viel einfacher sind, sodass wir all das durch den Kanalkonstruktionscode ersetzen können, den wir im ursprünglichen Hello Nextflow-Workflow entwickelt haben.

Zur Erinnerung: So sah die Kanal-Konstruktion aus (wie im Solutions-Verzeichnis zu sehen):

solutions/composable-hello/main.nf
    // Einen Channel für Eingaben aus einer CSV-Datei erstellen
    greeting_ch = channel.fromPath(params.greeting)
        .splitCsv()
        .map { line -> line[0] }

Also müssen wir das nur in den Initialisierungs-Workflow einfügen, mit kleinen Änderungen: Wir aktualisieren den Kanalnamen von greeting_ch zu ch_samplesheet und den Parameternamen von params.greeting zu params.input (siehe hervorgehobene Zeile).

NachherVorher

core-hello/subworkflows/local/utils_nfcore_hello_pipeline/main.nf
    //
    // Channel aus der Eingabedatei erstellen, die über params.input bereitgestellt wird
    //

    ch_samplesheet = channel.fromPath(params.input)
        .splitCsv()
        .map { line -> line[0] }

    emit:
    samplesheet = ch_samplesheet
    versions    = ch_versions

core-hello/subworkflows/local/utils_nfcore_hello_pipeline/main.nf
    //
    // Channel aus der Eingabedatei erstellen, die über params.input bereitgestellt wird
    //

    channel
        .fromList(samplesheetToList(params.input, "${projectDir}/assets/schema_input.json"))
        .map {
            meta, fastq_1, fastq_2 ->
                if (!fastq_2) {
                    return [ meta.id, meta + [ single_end:true ], [ fastq_1 ] ]
                } else {
                    return [ meta.id, meta + [ single_end:false ], [ fastq_1, fastq_2 ] ]
                }
        }
        .groupTuple()
        .map { samplesheet ->
            validateInputSamplesheet(samplesheet)
        }
        .map {
            meta, fastqs ->
                return [ meta, fastqs.flatten() ]
        }
        .set { ch_samplesheet }

    emit:
    samplesheet = ch_samplesheet
    versions    = ch_versions

Damit sind die Änderungen abgeschlossen, die wir vornehmen müssen, um die Eingabeverarbeitung zum Laufen zu bringen.

In seiner aktuellen Form ermöglicht uns dies nicht, die integrierten Fähigkeiten von nf-core zur Schema-Validierung zu nutzen, aber das können wir später hinzufügen. Vorerst konzentrieren wir uns darauf, es so einfach wie möglich zu halten, um etwas zu erreichen, das wir erfolgreich mit Testdaten ausführen können.

4.3. Das Testprofil aktualisieren¶

Apropos Testdaten und Parameter, lass uns das Testprofil für diese Pipeline aktualisieren, um das greetings.csv-Mini-Samplesheet anstelle des in der Vorlage bereitgestellten Beispiel-Samplesheets zu verwenden.

Unter core-hello/conf finden wir zwei vorlagenbasierte Testprofile: test.config und test_full.config, die dazu gedacht sind, eine kleine Datenprobe und eine in voller Größe zu testen. Angesichts des Zwecks unserer Pipeline gibt es nicht wirklich einen Sinn, ein Full-Size-Testprofil einzurichten, also kannst du test_full.config gerne ignorieren oder löschen. Wir konzentrieren uns darauf, test.config so einzurichten, dass es mit unserer greetings.csv-Datei mit ein paar Standardparametern läuft.

4.3.1. Die `greetings.csv`-Datei kopieren¶

Zuerst müssen wir die greetings.csv-Datei an einen geeigneten Platz in unserem Pipeline-Projekt kopieren. Typischerweise werden kleine Testdateien im assets-Verzeichnis gespeichert, also kopieren wir die Datei aus unserem Arbeitsverzeichnis.

cp greetings.csv core-hello/assets/.

Jetzt ist die greetings.csv-Datei bereit, als Testeingabe verwendet zu werden.

4.3.2. Die `test.config`-Datei aktualisieren¶

Jetzt können wir die test.config-Datei wie folgt aktualisieren:

NachherVorher

core-hello/conf/test.config
params {
    config_profile_name        = 'Test profile'
    config_profile_description = 'Minimal test dataset to check pipeline function'

    // Eingabedaten
    input  = "${projectDir}/assets/greetings.csv"

    // Weitere Parameter
    batch     = 'test'
    character = 'tux'
}

core-hello/conf/test.config
params {
    config_profile_name        = 'Test profile'
    config_profile_description = 'Minimal test dataset to check pipeline function'

    // Eingabedaten
    // TODO nf-core: Pfade zu deinen Testdaten auf nf-core/test-datasets angeben
    // TODO nf-core: Erforderliche Parameter für den Test angeben, damit keine Kommandozeilen-Flags benötigt werden
    input  = params.pipelines_testdata_base_path + 'viralrecon/samplesheet/samplesheet_test_illumina_amplicon.csv'
}

Wichtige Punkte:

Verwendung von ${projectDir}: Dies ist eine implizite Nextflow-Variable, die auf das Verzeichnis zeigt, in dem sich das Haupt-Workflow-Skript befindet (die Pipeline-Root). Ihre Verwendung stellt sicher, dass der Pfad funktioniert, unabhängig davon, wo die Pipeline ausgeführt wird.
Absolute Pfade: Durch die Verwendung von ${projectDir} erstellen wir einen absoluten Pfad, was wichtig für Testdaten ist, die mit der Pipeline ausgeliefert werden.
Testdaten-Speicherort: nf-core-Pipelines speichern Testdaten typischerweise im assets/-Verzeichnis innerhalb des Pipeline-Repositories für kleine Testdateien oder verweisen auf externe Testdatensätze für größere Dateien.

Und während wir dabei sind, lass uns die Standard-Ressourcenlimits verschärfen, um sicherzustellen, dass dies auf sehr einfachen Maschinen läuft (wie den minimalen VMs in Github Codespaces):

NachherVorher

core-hello/config/test.config
process {
    resourceLimits = [
        cpus: 2,
        memory: '4.GB',
        time: '1.h'
    ]
}

core-hello/config/test.config
process {
    resourceLimits = [
        cpus: 4,
        memory: '15.GB',
        time: '1.h'
    ]
}

Damit sind die Code-Modifikationen abgeschlossen, die wir vornehmen müssen.

4.4. Die Pipeline mit dem Testprofil ausführen¶

Das war eine Menge, aber wir können endlich versuchen, die Pipeline auszuführen! Beachte, dass wir --validate_params false zur Befehlszeile hinzufügen müssen, weil wir die Validierung noch nicht eingerichtet haben (das kommt später).

nextflow run core-hello --outdir core-hello-results -profile test,docker --validate_params false

Wenn du alle Änderungen korrekt vorgenommen hast, sollte dies bis zum Abschluss laufen.

Befehlsausgabe

 N E X T F L O W   ~  version 25.04.3

Launching `core-hello/main.nf` [condescending_allen] DSL2 - revision: b9e9b3b8de

Input/output options
  input                     : /workspaces/training/hello-nf-core/core-hello/assets/greetings.csv
  outdir                    : core-hello-results

Institutional config options
  config_profile_name       : Test profile
  config_profile_description: Minimal test dataset to check pipeline function

Generic options
  validate_params           : false
  trace_report_suffix       : 2025-11-21_07-29-37

Core Nextflow options
  runName                   : condescending_allen
  containerEngine           : docker
  launchDir                 : /workspaces/training/hello-nf-core
  workDir                   : /workspaces/training/hello-nf-core/work
  projectDir                : /workspaces/training/hello-nf-core/core-hello
  userName                  : root
  profile                   : test,docker
  configFiles               : /workspaces/training/hello-nf-core/core-hello/nextflow.config

!! Only displaying parameters that differ from the pipeline defaults !!
------------------------------------------------------
executor >  local (1)
[ed/727b7e] CORE_HELLO:HELLO:sayHello (3)       [100%] 3 of 3 ✔
[45/bb6096] CORE_HELLO:HELLO:convertToUpper (3) [100%] 3 of 3 ✔
[81/7e2e34] CORE_HELLO:HELLO:collectGreetings   [100%] 1 of 1 ✔
[96/9442a1] CORE_HELLO:HELLO:cowpy              [100%] 1 of 1 ✔
-[core/hello] Pipeline completed successfully-

Wie du sehen kannst, hat dies die typische nf-core-Zusammenfassung am Anfang dank des Initialisierungs-Subworkflows produziert, und die Zeilen für jedes Modul zeigen jetzt die vollständigen PIPELINE:WORKFLOW:Modul-Namen.

4.5. Die Pipeline-Ausgaben finden¶

Die Frage ist jetzt: Wo sind die Ausgaben der Pipeline? Und die Antwort ist ziemlich interessant: Es gibt jetzt zwei verschiedene Orte, an denen man nach den Ergebnissen suchen kann.

Wie du dich vielleicht von früher erinnerst, produzierte unsere erste Ausführung des neu erstellten Workflows ein Verzeichnis namens core-hello-results/, das verschiedene Ausführungsberichte und Metadaten enthielt.

tree core-hello-results

Verzeichnisinhalt

```console core-hello-results └── pipeline_info ├── execution_report_2025-11-21_04-47-18.html ├── execution_report_2025-11-21_07-29-37.html ├── execution

Teil 2: Hello für nf-core umschreiben¶

1. Ein neues Pipeline-Projekt erstellen¶

1.1. Das vorlagenbasierte Pipeline-Erstellungswerkzeug ausführen¶

1.2. Testen, dass das Gerüst funktionsfähig ist¶

1.3. Den Platzhalter-Workflow untersuchen¶

Zusammenfassung¶

Was kommt als Nächstes?¶

2. Den ursprünglichen Hello Nextflow-Workflow komponierbar machen¶

2.1. Den Workflow benennen¶

2.2. Kanal-Konstruktion durch take ersetzen¶

2.3. Workflow-Operationen mit main-Anweisung einleiten¶

2.4. emit-Anweisung hinzufügen¶

2.5. Zusammenfassung der abgeschlossenen Änderungen¶

2.6. Einen Dummy-Einstiegspunkt-Workflow erstellen¶

2.7. Testen, dass der Workflow läuft¶

Zusammenfassung¶

Was kommt als Nächstes?¶

3. Die aktualisierte Workflow-Logik in den Platzhalter-Workflow einpassen¶

3.1. Module kopieren und Modul-Importe einrichten¶

3.2. Die take-Deklaration so lassen wie sie ist¶

3.3. Die Workflow-Logik zum main-Block hinzufügen¶

3.4. Den emit-Block aktualisieren¶

Zusammenfassung¶

Was kommt als Nächstes?¶

4. Die Eingabebehandlung anpassen¶

4.1. Identifizieren, wo Eingaben behandelt werden¶

4.2. Den vorlagenbasierten Eingabekanalcode ersetzen¶

4.3. Das Testprofil aktualisieren¶

4.3.1. Die greetings.csv-Datei kopieren¶

4.3.2. Die test.config-Datei aktualisieren¶

4.4. Die Pipeline mit dem Testprofil ausführen¶

4.5. Die Pipeline-Ausgaben finden¶

2.2. Kanal-Konstruktion durch `take` ersetzen¶

2.3. Workflow-Operationen mit `main`-Anweisung einleiten¶

2.4. `emit`-Anweisung hinzufügen¶

3.2. Die `take`-Deklaration so lassen wie sie ist¶

3.3. Die Workflow-Logik zum `main`-Block hinzufügen¶

3.4. Den `emit`-Block aktualisieren¶

4.3.1. Die `greetings.csv`-Datei kopieren¶

4.3.2. Die `test.config`-Datei aktualisieren¶