“lambeq”将句子转换为量子电路,随着量子计算系统的扩大,加速实用QNLP应用的开发
剑桥量子(“CQ”)宣布推出全球首个量子自然语言处理(QNLP)工具包和文库。该工具包被称为lambeq,以已故数学家和语言学家Joachim Lambek的名字命名。
lambeq是全球首个QNLP软件工具包,能够将句子转换为量子电路。其目的是加快开发实用、现实世界的QNLP应用程序,如自动对话、文本挖掘、语言翻译、文字到语音、语言生成和生物信息学。
lambeq在完全开源的基础上推出,以造福全球量子计算界和快速发展的量子计算研究人员、开发人员和用户生态系统。lambeq与CQ全球领先和快速增长的量子软件开发平台TKET无缝衔接,后者也是完全开源的。这使QNLP开发人员能够访问尽可能广泛的量子计算机。
lambeq由首席科学家Bob Coecke领导的CQ位于牛津的量子计算研究团队构思、设计和打造而成,由资深科学家Dimitrios Kartsaklis博士担任平台的首席架构师。lambeq和范围更广的QNLP是一个为期十多年的研究项目的结果。
Coecke表示:“我们的团队一直在参与基础性工作,探索如何利用量子计算机解决人工智能中一些最棘手的问题。这项工作的基础是最初由我本人、现任CQ人工智能主管Steve Clark等人开创的进步结果。NLP是这些调查的核心。几个月前的发布详细介绍了CQ首次在实际量子计算机上实施QNLP的情况,以及我们在2019年12月首次披露了相关基本原则,现在lambeq的推出是自然迈出的下一步。”
Coecke补充道:“在过去一年中发表的各种论文中,我们不仅提供了量子计算机可以如何增强NLP的详细信息,而且还证明了QNLP是“量子原生”,这意味着管理语言的组织结构在数学上与管理量子系统的结构是相同的。这将引领世界最终摈弃目前人工智能所依赖的不透明和近似性的蛮力技术模式。”
lambeq使CQ科学家先前描述的组成分布(DisCo)类型NLP实验的设计和部署得以完成并实现自动化。这意味着从编码文本结构的句法/语法图表到采用TKET实施的(古典)张量网络或量子电路,可针对文本分类等机器学习任务进行优化。lambeq采用模块化设计,用户可以在模型内外交换组件,并在架构设计中具有灵活性。
lambeq消除了专注于人工智能和人机互动的从业人员和研究人员的进入障碍,这可能是量子技术最重要的应用之一。TKET现在已有数十万计的全球用户群。lambedq有望成为寻求与QNLP应用程序互动之量子计算界最重要的工具包,而QNLP应用程序是人工智能最重要的市场之一。最近出现的一个关键点是,QNLP也将适用于在基因组学和蛋白质组学中出现的符号序列分析。
lambeq的推出合作伙伴,同时也是早期采用者的默克集团最近发布了一篇关于QNLP的研究论文,这是其与慕尼黑技术大学的创新计划“量子创业实验室”进行的一个项目的一部分。
来自默克IT医疗创新孵化器,同时也是Quantum Computing Interest Group联合创始人的Thomas Ehmer表示:“利用量子计算的独特功能实现根本性突破,是我们在默克开展的研究的重要组成部分。我们最近披露的与慕尼黑技术大学研究人员合作的QNLP项目证明,使用QNLP技术的句子二元分类任务即使在现阶段也可以取得与现有传统方法相当的结果。显然,围绕量子计算的基础设施需要取得进步才能在商业上采用这些技术。重要的是,我们可以看到在QNLP中采用的这种方法为实现可解释的人工智能开辟了道路,从而也为实现更准确和更可靠的智能开辟了道路,而这在医学上是至关重要的。”
Kartsaklis表示:“QNLP有许多有趣的理论工作,但理论通常与实践有一定距离。通过lambeq,我们为研究人员提供了获得QNLP实验方面实践经验的机会,目前这完全是一块未曾触及的区域。这是朝着实现量子硬件上的实用、现实世界的NLP应用程序成为现实方向迈出的关键一步。”
lambeq已在GitHub上作为传统的Python存储库发布,并可在此处获取:https://github.com/CQCL/lambeq。 迄今为止,lambeq生成的量子电路已在IBM量子计算机和Honeywell Quantum Solutions的H系列设备上执行和实施。
上传到arxiv上的一份技术报告对工具包进行了介绍,该技术报告可在此处获取: https://arxiv.org/abs/2110.04236。在这里可以找到一个更易访问的博客帖子:https://medium.com/cambridge-quantum-computing/quantum-natural-language-processing-ii-6b6a44b319b2。有关技术问题,请联系lambeq-support@cambridgequantum.com。
近年来,从客户服务和消费者技术到医疗和广告,基于NLP的应用已在全球各个行业普及。行业分析师表示,预计到2028年,全球NLP市场价值将达到1272.6亿美元,复合年增长率接近30%[1]。
关于剑桥量子公司
剑桥量子公司(CQ)成立于2014年,由多家世界领先的量子计算公司提供支持,是量子软件和量子算法领域的全球领导者,帮助客户充分利用快速发展的量子计算硬件。CQ在欧洲、美国和日本设有办事处。2021年6月8日,CQ宣布与Honeywell Quantum Solutions合并,预计将于2021年第四季度完成合并。
了解更多信息,请前往http://www.cambridgequantum.com和LinkedIn访问CQ。在GitHub上获取lambeq、TKET、Python捆绑程序和实用程序的源代码。
稿源:美通社