首页天道酬勤cromwell工具,突然无敌了

cromwell工具,突然无敌了

张世龙 05-13 09:19 26次浏览

WDL是创建工作流的语法,需要运行cromwell 执行引擎,GATK的管道脚本以某种形式并行化

1 WDL (工作流描述语言(该http://www.Sina.com/) wdl是指定数据处理和人可读且可写入的工作流的语法的方式。加快执行速度该语言使常见模式更容易表达,同时也允许不常见或复杂的行为。 而且,不仅在执行平台之间,而且在不同类型的用户之间努力实现可移植性。 无论是分析师、程序员、生产系统操作员还是其他类型的用户,WDL都必须易于访问和理解。

1.1可执行引擎WDL本身可以在工作流描述语言上运行,而不是在可执行文件中运行。 兼容的执行引擎必须支持WDL规范的特定版本的功能。 有关可用的运行选项和支持,请参阅相应的引擎文档。

CromwellMiniwdl 1.2解析器、语言支持基本解析器及其语法定义(基于hermes )位于parsers/每个版本的目录中。 当前支持Java、Python和javascript。 这些解析器被认为可以正常工作,但这些声明没有得到验证。 MiniWDL - MiniWDL为WDL和命令行认证提供python绑定。 重量轻,使用方便。 wdl4s - WDL的Scala绑定。 这已缩小为更广泛的基于WDL使定义复杂的分析任务,在工作流中将它们链接在一起并使其执行并行化变得很简单代码的wom工具。 是用于分析、验证、组织和生成WDL图形的独立工具。 基于WDL-aid-wdl文件中定义的parameter_meta信息生成文档以输入到wdl工作流。 2 Cromwell WDL本身可以在需要执行引擎上运行,而不是在可执行文件中运行。

Cromwell是cromwell

3 GATK4 )基因组分析工具包)需要执行引擎发音为“geeayteeKay”(非“gat-Kay”),表示通用分析工具包。 这是用于分析高通量测量序列数据的命令行工具的集合,主要侧重于变体发现。 这些工具可以单独使用,也可以链接到完整的工作流。 提供针对特定用例定制的端到端工作流,称为GATK最佳做法。

从4.0版开始,GATK包含Picard工具包的副本,因此所有Picard工具都可以从GATK自身获得。

执行引擎:GATK4入门

3.1 GATK4的运行管道(pipeline ) :处理顺序数据和执行变型发现的大部分工作都可以GATK的形式自动化,入门指引。 我们提供了GATK最佳做法工作流的脚本化实现和其他帮助程序/附件脚本,使任何人都可以轻松地执行这些复杂的工作流。

这些工作流是用工作流描述语言(wdl )编写的,旨在在支持wdl运行的所有平台上运行。 选项列在《用户指南》的“管线”部分。 我们的首选选择是Cromwell执行引擎。 这与GATK一样,由Broad的数据科学平台(DSP )开发,可以在我们的云平台Terra (以前称为FireCloud )上用作服务。

如果选择通过Terra运行GATK工作流,则实际上不需要执行上述操作,因为所有内容都是以现成的形式预载的(软件、脚本和一些示例数据)。 此时,Terra是执行工作流的最简单方法,就像我们自己的工作一样。 如上所述,在名为Terra的云平台上,预配置的工作区已配置了所有最佳实践指南,因此您可以在不设置任何内容的情况下进行尝试。 可以将结果与其他管道进行比较,也可以以私人、安全的方式上传自己的数据,以测试管道性能。

, 电荷泵式开关电源的基本电路,电荷泵升压电路