2021-10-13 22:35

剑桥量子发布世界首个量子自然语言处理工具包和库Lambeq

C114讯 10月13日消息(余予)剑桥量子(Cambridge Quantum,CQ)日前宣布发布世界首个量子自然语言处理(QNLP)工具包和库。该工具包被称为Lambeq,以已故数学家和语言学家 Joachim Lambek 的名字命名。

Lambeq是世界上首个能够将句子转换为量子电路的QNLP 软件工具包,旨在加速实际的、真实的QNLP 应用的开发,例如自动对话、文本挖掘、语言翻译、文本到语音、语言生成和生物信息学。

Lambeq在完全开源的基础上发布,以造福世界量子计算社区和快速增长的量子计算研究人员、开发人员和用户生态系统。 Lambeq与CQ 的TKET无缝合作,TKET是世界领先且发展最快的量子软件开发平台,同时也是完全开源。这为QNLP开发人员提供了访问尽可能广泛的量子计算机的权限。

Lambeq由CQ 位于牛津的量子计算研究团队构思、设计和设计,该团队由首席科学家Bob Coecke领导,资深科学家Dimitrios Kartsaklis 博士担任该平台的首席架构师。

据悉,Lambeq和更广泛的QNLP是一个研究项目的结果,这可以追溯到十多年前。

“我们的团队一直在从事基础工作,探索如何使用量子计算机来解决人工智能中一些最棘手的问题,”Coecke表示,“这项工作是基于我、Steve Clark(现任CQ的人工智能负责人)和其他人最先开创的进展。NLP处于这些调查的核心。几个月前我们发布了世界上首个由CQ在实际量子计算机上实现QNLP的细节,并在2019年12月首次披露了基本原理,而Lambeq是继几个月前发布之后自然而然的下一步。”

“在过去一年发表的多篇论文中,”Coecke补充道,“我们不仅提供了有关量子计算机如何增强NLP 的详细信息,而且还证明了QNLP 是‘量子本源’,这意味着控制语言的组成结构在数学上与管理量子系统的结构相同。最终这将使世界摆脱目前依赖于不透明和近似的蛮力技术的人工智能模式。”

Lambeq能够实现CQ 科学家之前描述的成分分布 (DisCo) 型NLP实验的设计和部署并实现自动化。这意味着从对文本结构进行编码的语法/语法图转变为使用TKET实现的(经典)张量网络或量子电路,以便针对文本分类等机器学习任务进行优化。

同时,Lambeq采用模块化设计,用户可以在模型中交换组件,并在架构设计上具有灵活性。

除此之外,Lambeq 消除了专注于人工智能和人机交互的从业者和研究人员的进入壁垒,这可能是量子技术最重要的应用之一。目前,TKET已在全球范围内拥有了数十万用户群。

Lambeq有潜力成为量子计算社区寻求参与QNLP应用程序的最重要工具包,而QNLP 应用是人工智能最重要的市场之一。最近一个很明显的关键点是,QNLP也将适用于基因组学和蛋白质组学中出现的符号序列分析。

作为Lambeq的启动合作伙伴和早期采用者,默克集团最近在QNLP发表了一篇研究论文,作为与慕尼黑技术大学创新计划量子创业实验室项目的一部分。

默克IT 医疗保健创新孵化器和量子计算兴趣小组联合创始人Thomas Ehmer表示,“利用量子计算的独特功能实现根本性突破是默克研究的重要组成部分。我们最近与慕尼黑工业大学的研究人员在QNLP 上公开的项目已经证明,即使在现阶段,使用QNLP 技术对句子进行二元分类任务也可以获得与现有经典方法相当的结果。显然,围绕量子计算的基础设施需要改进,才能将这些技术用于商业。关键的是,我们可以看到在QNLP中采用的方法如何为可解释的AI 开辟道路,从而实现更准确、更可靠的智能——这在医学上至关重要。”

“关于QNLP 有很多有趣的理论工作,但理论通常与实践相距甚远。”Kartsaklis 表示,“通过Lambeq,我们让研究人员有机会获得QNLP 实验方面的实践经验,这是目前完全未开发的领域。这是量子硬件上实用的、真实的NLP应用成为现实的关键一步。

Lambeq已在GitHub上作为常规Python存储库发布。迄今为止,lambeq生成的量子电路已在IBM量子计算机和霍尼韦尔量子解决方案H系列设备上执行和实施。

近年来,基于 NLP 的应用程序在全球范围内无处不在,从客户服务、消费者技术到医疗保健和广告。据行业分析师预测,到2028 年,全球NLP市场的价值预计将达到1272.6 亿美元,复合年增长率(CAGR)近30%。

作者:余予   来源:C114通信网

相关

计算机网络IBM
本评论 更新于:2021-10-16 21:59:07
在C114 APP中与业内人士畅聊通信行业热点话题!