AWS发布三项全新的数据分析功能

(1)AQUA (Advanced Query Accelerator) for Amazon Redshift,Amazon Redshift 高级查询加速器,提供创新性的硬件加速缓存,能提供比其它任何云数据仓库高达10倍的查询性能;(2)AWS Glue Elastic Views让开发人员可以轻松地构建跨数据存储的物化视图,实现在多个数据存储中自动合并和复制数据;(3)Amazon QuickSight Q 是Amazon QuickSight 的一项基于机器学习的功能,用户可以用自然语言键入有关其业务数据的问题,并在几秒钟内就可以收到高度准确的答案;(4)Capital One、Best Western Hotels & Resorts、NTT DOCOMO、Audible和Panasonic Avionics等客户已经在使用新的数据分析功能。

在亚马逊云服务(AWS)举办的年度盛会 -- AWS re:Invent上,AWS宣布了三项全新的数据分析功能,这些功能可以大幅提升Amazon Redshift数据仓库的性能,使客户在数据存储间的移动和合并数据变得更加容易,并且使终端用户更便捷地利用机器学习从业务数据中获得更多价值。

  • AQUA for Amazon Redshift 通过创新的硬件加速缓存,将计算能力带到存储层中,加速数据查询,提供比其它任何云数据仓库高达10倍的查询性能,该服务将于2021年1月全面上市。
  • AWS Glue Elastic Views 可帮助开发人员构建使用来自多个数据存储的应用。利用物化视图,自动在存储、数据仓库和数据库之间合并和复制数据。
  • Amazon QuickSight Q为Amazon QuickSight提供机器学习驱动的能力,使用户能够使用自然语言表达,在Amazon QuickSight Q搜索栏中提出业务问题,并在几秒钟内收到高度准确的答案。

当前,每小时创造的数据比20年前一整年所创造的数据还要多。事实上,未来三年创造的数据量将超出过去30年创造的数据量。以往的旧工具在当今这个新的数据世界中根本无法发挥作用。AWS客户针对不同的应用场景,推出了多种分析工具,包括用于无服务器式查询的Amazon Athena,用于搜索和可视化日志数据的Amazon Elasticsearch Service,用于处理实时数据流的Amazon Kinesis,用作数据仓库的Amazon Redshift,以及用于运行Apache Spark、Hive、Presto和其它大数据框架的Amazon EMR。这些服务为AWS客户提供了适合他们需求的工具。今天宣布的全新数据分析功能建立在这一基础之上,并为客户的所有数据存储提供更快、更具性价比、更易于访问的数据分析。要了解更多信息,请访问https://aws.amazon.com/big-data/datalakes-and-analytics/ 。

AWS分析业务副总裁Rahul Pathak说:“通过我们今天发布的功能,我们将为Amazon Redshift带来10倍以上的性能提升,提供新的灵活方式、轻松地在数据存储之间移动数据,客户可以在业务仪表盘中用自然语言提出问题,并在几秒钟内收到答案。这些功能将极大地提高客户在任何规模下获取数据价值的速度和易用性。”

Amazon Redshift AQUA(高级查询加速器)将计算能力引入存储层,提供比任何其它云数据仓库快10倍的查询性能。

Amazon Redshift自2012年推出以来,作为首个为云端构建的数据仓库,其成本仅为传统数据仓库的1/10,目前已经成为最受欢迎的云数据仓库之一。今年早些时候,AWS宣布推出Amazon Redshift RA3实例,允许客户分别扩展计算和存储,并提供比其它云数据仓库高3倍的性能。然而,即使有RA3实例提供的优势,快速增长的客户在数据仓库中需要处理的数据依然令客户在性能和成本效益扩展之间难以平衡。数据仓库的主流架构是大量的集中式存储数据需要被转移到等着处理数据的计算节点来进行处理。这种方法面临的挑战是,共享数据和计算节点之间有大量的数据移动。随着数据量持续快速增长,这种数据移动会使可用的网络带宽饱和、性能降低。除了网络瓶颈之外,CPU的发展也无法跟上存储能力的快速增长(SSD存储吞吐量的增长速度6倍于CPU从内存处理数据的能力的增长),这要么造成了其新的CPU瓶颈,要么迫使更多的客户过度配置算力、以便更快地完成工作。

AQUA for Amazon Redshift是Amazon Redshift的分布式、硬件加速缓存,这一创新可以提高新时代数据规模下的分析性能。AQUA将计算能力带到存储层,数据不必在两者之间来回移动。这使得Amazon Redshift的运行速度是其它云数据仓库的十倍。AQUA缓存可在众多节点上并行扩展和处理数据。每个节点都拥有一个由AWS设计的分析处理器组成的硬件模块,可大幅加快数据压缩、加密,以及扫描、聚合和过滤等数据处理任务。AQUA还为客户带来了额外的好处,即能够在原始存储上进行计算,节省了原本需要花费在移动数据上的时间。有了这一新的架构,以及它所带来的10倍以上的性能提高,Redshift的客户可以拥有更新的数据仪表盘,节省开发时间,他们的系统也更容易维护。AQUA的预览版现已向所有客户开放,AQUA将于2021年1月全面上市。AQUA可在Redshift RA3实例上使用,无需额外的费用,客户可以利用AQUA的性能改进,无需更改代码。要开始使用AQUA,请访问https://pages.awscloud.com/AQUA_Preview.html 。

AWS Glue Elastic Views让开发人员可以轻松构建物化视图,在多个数据存储中自动组合和复制数据

大多数公司都在建立或者已经建立了数据湖,他们可以通过正确的安全和访问控制,将来自各种孤岛的所有数据汇总起来,以便更容易进行数据分析和机器学习。但出于延时和运营的原因,大多数公司也可能在数据湖之外的专用数据存储中拥有越来越多的数据。随着这些数据湖和专用数据存储中的数据不断增加,公司需要更简单的方法来移动数据。

AWS Glue Elastic Views为开发人员提供了一种新的能力,可以轻松构建物化视图(也称为虚拟表),在多个数据存储中自动组合和复制数据。AWS Glue是一种无服务器的数据准备服务,可以轻松运行用于数据分析和机器学习的提取、转换和加载(ETL)作业。通过AWS Glue Elastic Views,客户可以使用SQL创建从不同数据存储中组合数据的物化视图,AWS Glue Elastic Views负责从不同数据源来复制数据以创建物化视图。例如,客户可能会创建一个物化视图,从Amazon Aurora中提取餐厅位置信息,并将其与存储在Amazon DynamoDB中的客户评论相结合,然后在Amazon Elasticsearch Service上按位置建立一个餐厅评论搜索引擎。AWS Glue Elastic Views 将数据从每个源数据库复制到目标数据库,自动保障目标数据库中的数据更新。Elastic Views会持续监控源数据库的变化,并在几秒钟内更新目标数据库。如果其中一个源数据库中的数据模型发生了变化,Elastic Views会主动提醒开发人员,这样他们就可以更新他们的物化视图以适应变化。客户还可以使用Elastic Views将运营数据从运营数据库复制到数据湖中,近乎实时地运行数据分析。AWS Glue Elastic Views可以自动扩缩以适应工作负载的增减,确保目标数据库中的物化视图保持最新。AWS Glue Elastic Views 现在可以预览。要了解更多信息,请访问http://aws.amazon.com/glue/features/elastic-views 。

Amazon QuickSight QAmazon QuickSight的机器学习功能,用户可以用自然语言键入有关其业务数据的问题,并在几秒钟内获得高度准确的答案

Amazon QuickSight 是专为云计算而构建的可扩展、无服务器、可嵌入机器学习的商业智能 (BI) 服务。Amazon QuickSight 提供了现代的、交互式、自助服务式 BI 解决方案的所有优势,其功能可以轻松地将仪表盘嵌入到应用程序中,以高性价比的方式扩展,支持成千上万的客户。Amazon QuickSight的“自动叙述”功能为客户提供自动生成的简述,用通俗的语言解释和描述BI仪表盘中数据的含义,使所有用户对数据有共同的理解。客户喜欢这些通俗易懂的叙述,因为这使他们能够快速解读共享仪表板中的数据,并专注于最重要的见解。客户也喜欢用通俗的语言向他们的数据提出业务问题,并得到近乎实时的答案。虽然一些BI工具和供应商已经尝试用自然语言查询(NLQ)来解决这一挑战,但现有的方法要求客户首先要提前花几个月的时间来准备和建立一个模型,即使这样,他们仍然没有办法提出那些原有模型没有预先定义,需要新计算的问题。例如,“我们的同比增长率是多少?”这个问题需要在模型中预先定义“增长率”作为计算。通过今天的BI工具,用户需要与BI团队合作,更新模型并考虑任何新的计算或数据,这可能需要几天或几周的功夫。

Amazon QuickSight Q让用户可以用自然语言对其所有数据提出任何问题,并在几秒钟内收到答复。要提出问题,用户只需在Amazon QuickSight Q搜索栏中输入问题。当用户开始输入问题时,Amazon QuickSight Q会提供带有关键短语和业务术语的自动补全建议,自动执行拼写检查、缩写词与同义词匹配,因此用户不必担心错别字或记不住数据的准确业务术语。Amazon QuickSight Q使用深度学习和机器学习(自然语言处理、模式理解和SQL代码生成的语义解析)来生成数据模型,自动理解业务数据的含义和它们之间的关系,因此用户的业务问题可以得到高度准确的答案,而无需等待几天或几周来建立数据模型。由于Amazon QuickSight Q无需BI团队建立数据模型,因此用户也不限于只提出一组特定的问题。此外,因为查询会应用于所有数据,而不仅仅是预设模型中的数据集,用户可以得到更完整、更准确的答案。Amazon QuickSight Q预先根据来自不同领域和行业的数据进行了训练,如销售、营销、运营、零售、人力资源、医药、保险、能源等,因此它已被优化来理解复杂的商业语言。例如,销售用户可以问“我的销售任务完成得如何?”,或者零售用户可以问“按地区划分的周销量增长最快的产品是什么?”Amazon QuickSight Q 通过从用户互动中学习,随着时间的推移不断提高其准确性。如果Amazon QuickSight Q不理解问题中的某个短语,会提示用户从搜索栏中的建议选项下拉菜单中选择,Amazon QuickSight Q会记住该短语,以便下次交互。要了解有关 Amazon QuickSight Q 的更多信息,请访问 https://aws.amazon.com/quicksight/q 。

总部位于东京的NTT DOCOMO是日本最大的移动服务提供商之一,为8000多万客户提供服务。NTT DOCOMO服务创新部总经理Ken Ohta表示:“自2014年迁移到Amazon Redshift以来,Amazon Redshift一直是我们数据分析环境的核心,使我们能够存储到超过10PB的未压缩数据,性能比之前的线下系统提高了10倍。随着客户对数据和数据量的需求增长,Amazon Redshift的持续创新帮助我们带来了扩展系统所需的灵活性和易用性。我们对AQUA for Amazon Redshift的推出感到兴奋,因为我们将进一步提高和扩大Amazon Redshift数据仓库的性能和规模。”

Intercom是一家快速发展的创业公司,估值13亿美元,融资超过2.4亿美元。“强大的客户关系比以往任何时候都重要,但在线业务的规模和性质,可能会给建立个人联系带来困难。因此我们创建了世界上第一个对话关系平台,帮助企业通过个性化的、基于即时通讯的体验建立更好的客户关系。为了使这一工作顺利进行,并在业务爆发的过程中了解我们的业务,我们依赖于大量的数据 -- 目前有70TB,而且还在不断增加。”Intercom数据工程经理Paul Vickers说,“我们的Amazon Redshift云数据仓库易于扩展并不会超支。我们对Amazon Redshift中新的AQUA功能感到非常兴奋,这将加快我们的查询速度,缩短数据分析师获得洞察力的时间。我们知道,有了AWS,我们就可以专注于我们的业务增长而不用关心背后的技术支持。”

埃森哲是一家全球性的专业服务公司,在数字化、云计算和安全领域具有领先的实力。埃森哲北美数据与AI 部门AWS合作负责人A.K. Radhakrishnan表示:“在埃森哲,我们致力于提供服务和解决方案,帮助全球客户利用数据进行实时决策。然而,数据和对数据洞察力的需求以令人难以置信的速度增长,定义数据、确定优先级和处理数据都面临挑战。AQUA for Amazon Redshift提供了创新的方法处理数据仓库,查询性能最高可提升10倍。这让我们更容易支持数据驱动型企业的目标。”

ZS Associates是一家专业服务公司,与企业并肩作战、帮助开发和交付产品,推动客户价值和公司业绩。“AWS一直走在创新的最前沿,以为客户提供一流的解决方案而享有盛誉。利用AWS的新一代技术和ZS深厚的技术及领域专长,我们已经为客户在Amazon Redshift上部署了多个大型数据和分析平台。”ZS Associates企业架构负责人Nishesh Aggarwal表示,“通过引入Amazon Redshift的RA3实例,我们能够显著提高数据分析工作负载的性能,同时解决数据存储问题。我们非常高兴能尝试AQUA for Amazon Redshift,因为它有望在不付出额外努力的情况下,将我们最复杂的工作负载的性能进一步提高10倍左右。”

Sisense是一个独立的数据分析平台,它使全球2000多家客户能够简化复杂的数据,构建和嵌入数据分析应用。“Sisense和Amazon Redshift之间的强有力协作,为我们众多的联合客户带来了更好的云分析体验。”Sisense首席战略官Guy Levy-Yurista表示,“通过AQUA,我们预计性能将提升10倍,让客户能够优化他们的Redshift数据集群。这些将使我们的客户能够快速将数据转化为洞察力,并在整个业务中注入智能。”

Audible是原创口语娱乐和有声读物的领先制作商和供应商,每天丰富着数百万听众的生活。“在Audible,客户可以搜索和发现多个类别的原创口语娱乐内容和有声读物。为了给这种体验提供动力,我们需要快速分析来自多个数据库的数据,以提供个性化的结果。”Audible首席软件开发工程师Shailesh Vyas说,“我们期待着尝试AWS Glue Elastic Views作为无服务器解决方案,为我们环境中多个不同数据库的数据创建物化视图。有了AWS Glue Elastic Views,我们的开发人员应该能够更快地移动数据,更专注于为客户进行创新,而不是管理复杂的数据集成管道。”

Best Western Hotels & Resorts总部位于亚利桑那州凤凰城,是一家私营酒店品牌,在全球100多个国家和地区拥有约4700家酒店。Best Western提供18个酒店品牌,满足各个市场的开发商和客人的需求。“Amazon QuickSight的按使用付费定价和无服务器架构,使得Best Western的精简分析团队足够敏捷,为业务提供更高的价值,速度更快,而且成本不到我们之前分析架构的一半。”Best Western Hotels & Resorts数据库和企业分析高级经理Joseph Landucci说,“有了Amazon QuickSight Q,我们期待业务合作伙伴能够自助解决问题,减少我们团队应对临时请求的运营开销。它将使我们的合作伙伴只需用简单的语言输入他们的问题,就能快速获得关键业务问题的答案。”

Capital One成立于1994年,是一家领先的信息化技术公司,其使命是让银行业更具独创性、简单性和人性化,帮助银行客户取得成功。“借助Amazon QuickSight,我们已经能够大规模地、快速推出机器学习驱动的BI仪表板,无需任何服务器设置或繁琐的容量规划。” Capital One高级数据工程师Peter Tyson表示,“现在,随着Amazon QuickSight Q的推出,我们期待着让用户能够轻松、快速地获得他们临时业务问题的答案。”

松下航空电子公司是世界领先的机上娱乐和通信系统供应商。“我们基于云计算的解决方案收集了大量的匿名数据,这些数据有助于我们优化航空公司合作伙伴及其乘客的体验。”松下航空电子公司云计算运营总监Anand Desikan说,“我们开始使用Amazon QuickSight来报告机上Wi-Fi性能,凭借其丰富的API、按会话付费的定价以及可扩展的能力,我们迅速将Amazon QuickSight仪表盘推广到数百个用户。该平台的不断进化令人印象深刻:机器学习驱动的异常检测,Amazon SageMaker集成,报表嵌入,提取主题,跨可视化过滤,现在有了Amazon QuickSight Q,我们的用户只需在搜索栏中输入业务问题,Amazon QuickSight Q就能提供消费洞察力,并对业务上下文进行理解,提供同义词,并向他们展示答案,无需复杂的解释。”

Vyaire Medical是一家致力于呼吸护理的全球性公司,它以改善患者的治疗效果和为客户增加价值为目标,坚定不移地实现、改善和延长生命。“在不到两个月的时间里,我们就能将旧的 BI 报告工具转入 Amazon QuickSight。” Vyaire Medical 公司分析与企业数据管理高级总监 Gopal Ramamurthi 说,“我们在管理的便利性方面获得了很多好处,特别是在扩展规模以支持BI用户数量增加时。现在,随着Amazon QuickSight Q的推出,我们期待让我们的高管团队、现场销售用户和制造工厂的主管在仪表盘中无法获得答案时,可以更轻松地用纯英文提出他们的数据问题,提供更快的洞察力,帮助我们提高销售和制造流程的效率。”

最新文章