分析测试百科网

搜索

喜欢作者

微信支付微信支付
×

亚马逊推出新业务,不送快递改送组学数据

2022.12.02
头像

TBiotin

whisper of insanity

近日,亚马逊发布了最新的业务模块——亚马逊组学分析平台Amazon Omics

Amazon Omics 是一项亚马逊网络服务 AWS 服务,可帮助生物信息学家、研究人员和科学家等用户存储、查询、分析基因组学和其他生物数据并从中生成见解。 它简化并加速了研究和临床组织存储和分析基因组信息的过程,并加快了科学发现和洞察力的产生。

组学具有三个主要组成部分。 Omics Storage 可帮助您高效地存储和共享数 PB 的基因组学数据,并且每 GB 成本较低。 Omics Analytics 简化了为多组学和多模式分析准备基因组学数据的方式。 Omics Workflows 自动为您的生物信息学计算配置和扩展底层基础设施。

AWS 表示,Amazon Omics 还可以帮助建立基本的生物信息学工作流程并使用现有的 AWS 分析和机器学习服务分析结果,并补充说该服务会随着使用量的增长自动配置底层基础设施。

针对生物信息学优化的数据存储

亚马逊的首席开发倡导者 Channy Yun 在一篇博文中写道,新服务基于三个主要组件——优化存储工作流托管计算面向特定类型分析的数据存储

为了降低成本,Amazon Omics 使用生物信息学感知存储选项来存储原始序列数据。据该公司称,为了优化运行分析的数据,Amazon Omics 将原始数据导入变体存储并将其转换为可作为 Apache Iceberg 表使用的查询就绪模式。

该服务带有两个存储类别——活动和归档。

“自动归档默认开启,这意味着如果数据不定期访问(超过 30 天),Amazon Omics 会自动将数据移动到更便宜的存储类别,类似于 Amazon Simple Storage Service (Amazon S3) Intelligent-Tiering存储类,从而为客户节省成本,”AWS Health AI 总经理 Tehsin Syed 在博客中写道。

Amazon Omics 还支持将原始数据导入注释存储。由文件类型标记或标记的数据称为注释数据。

科学家和其他用户可以开始通过该服务的控制台将数据导入对象存储。

该服务的托管计算组件为科学家提供资源以运行生物信息学工作流,这些工作流包含一系列协调任务的脚本,这些任务旨在从 Amazon Omics 存储或 Amazon S3 中提取大量原始序列数据到少量分析数据,例如该公司表示,作为基因组突变,科学家和其他用户只需指定每项任务所需的计算资源。

“反过来,这消除了与大规模运行和管理这些工作流相关的所有无差别的繁重工作,”赛义德写道,并补充说工作流中的脚本可以用 Nextflow 或工作流描述语言等语言编写。

这项可与 Amazon HealthLake 等其他服务结合使用的新服务现已在美国东部(弗吉尼亚北部)、美国西部(俄勒冈)、亚太地区(新加坡)、欧洲(法兰克福)、欧洲(爱尔兰)推出) 欧洲(伦敦)地区

预计不久将支持更多地区。该服务按消费模型定价。

亚马逊
文章推荐