Cohere,为企业提供NLP模型

Cohere,为企业提供NLP模型

🖼️
图片 2 1896 × 1254px

📷 图片包含在完整版文章中,点击文末按钮查看

2022 年底 OpenAI 的产品 ChatGPT 发布后,NLP支出增长加速,成为市场的拐点。当年年底一项调查中,77%的 NLP 相关企业表示,计划在未来 12-18 个月内增加支出,其中 38% 的企业计划将至少增加 11% 的支出。

然而,公司在采用 NLP 方面仍然面临巨大的障碍。 NLP 中使用的大型语言模型的训练成本可能超过 1000 万美元,实际使用成本甚至更高。 NLP 模型本身不仅昂贵,而且聘请专业人士来管理它们也很困难。

Cohere 为企业提供 NLP 模型。它允许公司将 NLP 融入应用程序中,而无需公司内部开发自己的模型。 Cohere 构建通用语言模型并通过 API 来访问。公司可以立即使用这些模型,也可以根据自己的特定需求对其进行微调。随着人工智能不断加速进步,获取最新模型和组件的机会变得越来越重要。

🖼️
图片 3 414 × 121px

📷 图片包含在完整版文章中,点击文末按钮查看

🖼️
图片 4 414 × 147px

📷 图片包含在完整版文章中,点击文末按钮查看

Aidan Gomez(首席执行官)、Nick Frosst 和 Ivan Zhu 于 2019 年创立了 Cohere。三人都在多伦多大学攻读本科。Gomez 随后在牛津大学获得了计算机科学博士学位。Gomez和 Frosst特后来成为多伦多谷歌大脑的人工智能研究人员。在谷歌工作期间,Gomez的朋友 Ivan Zhang 会定期到办公室与他一起研究深度学习,Ivan Zhang 从大学辍学后在初创公司For.ai 担任软件工程师。

🖼️
图片 5 414 × 270px

📷 图片包含在完整版文章中,点击文末按钮查看

2017 年 6 月,20岁的 Gomez 与人合着了一篇名为《Attention Is All You Need》的论文,该论文开创了 Transformer 模型,这是一种彻底改变 NLP 任务的神经网络架构。那时,领导Google Brain的还是因深度学习获得图灵奖的「深度学习三巨头」之一Geoffrey Hinton。

Transformer 使用自注意力(self-attention)来衡量输入不同部分的重要性。与以前的语言模型(如循环神经网络)相比,它们具有更高的并行性,能够在更大的数据集上进行训练。它们是性能最佳的语言模型的基础,包括 Cohere 模型和 GPT-4 等 OpenAI 模型(GPT 代表“生成式预训练变压器”)。Gomes 这样描述公司的起源:

最初,团队并不太清楚他们想要为商业用例构建什么样的产品。然而,公司成立后不久,OpenAI 发布了 GPT-3,这代表了 LLMs 的拐点。正如Gomes 所言:

2023 年初,YouTube 前首席财务官 Martin Kon(总裁兼首席运营官)加入了该团队。

🖼️
图片 6 414 × 211px

📷 图片包含在完整版文章中,点击文末按钮查看

Cohere 为各种阅读和写作任务训练大型语言模型 (LLMs),例如摘要、内容创建和情感分析。其语言模型针对三个主要用例进行了优化:检索文本(retrieving text)、生成文本(generating text)和分类文本(classifying text)。

Cohere 为企业提供 API 端点,以利用其 LLMs 和许多部署选项,使企业能够通过 AWS 等云合作伙伴或 Cohere 的托管云安全地存储数据。为了更高效地帮助其LLMs客户,Cohere 还提供定制模型培训服务。

Cohere 首席执行官 Aidan Gomez 对该产品进行了如下描述:

Cohere 产品中提供了三个主要 API 端点,这些端点专注于检索文本以进行搜索、聚类和推荐。

🖼️
图片 7 414 × 232px

📷 图片包含在完整版文章中,点击文末按钮查看

Source: Cohere

Cohere provides three API endpoints focused on text generation. Designed to generate contextually relevant and human-like text, this product offering consists of: Cohere 提供了三个专注于文本生成的 API 端点。该产品旨在生成上下文相关且类似人类的文本,包括:

🖼️
图片 8 414 × 209px

📷 图片包含在完整版文章中,点击文末按钮查看

Source: Cohere

Cohere 的文本分类端点是 Cohere LLMs 的 API,专注于识别所提供文本的含义和见解。 Classify 端点的示例用例包括产品评论的内容审核和情绪分析。 Classify 端点的其他潜在应用包括聊天机器人体验和客户支持。与 Cohere 的其他 API 端点和 LLM 产品一样,客户可以向 Cohere 提供其数据,以接收针对其数据进行微调的定制模型。

🖼️
图片 9 414 × 201px

📷 图片包含在完整版文章中,点击文末按钮查看

Source: Cohere

正如 Cohere 首席执行官 Aidan Gomez 所描述的那样,Cohere 的目标客户是寻求独立人工智能平台的公司。

“我们知道市场需要一个独立的平台,不与任何超大规模提供商绑定,以使企业能够以数据极其私密和安全的方式采用这项技术。”

除了拥有大量资源的 FAANG 公司和 OpenAI 等竞争对手之外,大多数企业都缺乏训练自己的复杂语言模型的资金或人才。 Cohere 的大多数潜在客户面临的第一个障碍是内部运行这些模型的成本。例如,预计 2022 年发布的 Google PaLM 模型在 AWS 上的一次训练需要花费 2500 万美元。

对于那些可能希望在内部建立这些模型的公司来说,第二个障碍是缺乏获得高素质人才的机会。无论是处于哪个发展阶段的人工智能公司,获取人工智能人才是一项重大挑战。即使在人工智能部署相对成熟的经验丰富的公司中,截至 2020 年,也有近 48% 的公司面临中度、重大或极端的人工智能技能差距。截至 2022 年,麦肯锡对 1,500 家公司进行调查,65% 的公司发现聘请软件工程师担任人工智能相关职位有些困难或极其困难,83% 的受访者表示,回顾过去三年,招聘此类职位要么更加困难,要么同样困难。

🖼️
图片 10 414 × 159px

📷 图片包含在完整版文章中,点击文末按钮查看

截至 2023 年 9 月,Cohere 的客户包括 Oracle、Notion、Jasper、Spotify、HyperWrite 和 Glean。

2022 年 NLP 市场估值为 278 亿美元,预计 2023 年市场规模为 410 亿美元。预计到 2030 年,该市场将达到 4400 亿美元年复合年增长率预计为 40.4%。另一份报告预测,到 2032 年,生成式人工智能的规模将达到 1.3 万亿美元,复合年增长率高达 42%,其增长是由人工智能副驾驶(AI copilot)提高编程速度、专业人工智能助手和新基础设施等产品所推动。

OpenAI的产品ChatGPT发布,推动了生成式AI市场的快速增长。 ChatGPT 于 2022 年底发布后,在两个月内就获得了 1 亿活跃用户,这使其成为历史上增长最快的消费应用程序,并成为生成式 AI 市场的拐点。 2022 年底的一项调查发现,77% 使用 NLP 解决方案的公司计划增加未来���资。

OpenAI:

2015 年成立,是一家领先的人工智能研究实验室,开发了多个 GPT 迭代模型,与 Cohere 的产品类似的LLM。 OpenAI 的 GPT-3 于 2020 年 6 月发布,已广泛应用于从内容生成到客户服务自动化的各种应用。但 OpenAI 迎来“AI 热潮”的分水岭是 2022 年 11 月发布的 ChatGPT,这是一款针对对话优化的LLM。截至 2023 年 2 月,ChatGPT 在推出仅两个月后就达到了 1 亿月活跃用户,使其成为历史上增长最快的消费者应用程序之一。 OpenAI 的声誉、广泛的研究能力及其模型的广泛采用对 Cohere 构成了重大的竞争威胁。 OpenAI 已经获得多轮融资,该公司估值在1000亿美元左右。

Meta:

Meta 的前身是 Facebook,是一家在人工智能研发领域投入巨资的科技集团。其人工智能研究部门 FAIR(基础人工智能研究)开发了各种人工智能模型和工具,其中一些与 Cohere 的产品直接竞争。 2023 年 7 月,Meta 发布了 Llama 2,这是一个在 2 万亿 Tiken 上进行预训练的免费用于研究和商业用途的 LLM。在推理任务中,Llama 2 的发布与 OpenAI 的 GPT-3.5(类似于 ChatGPT)相当,作为开源 LLM 对 Cohere 构成了重大威胁。

谷歌:

2023 年 4 月,谷歌将 DeepMind(一家世界领先的人工智能研究实验室,以其在强化学习和神经网络方面的工作而闻名)与其现有的谷歌大脑团队合并。自 ChatGPT 快速采用以来,Google 在将 LLM 功能集成到其现有产品方面取得了重大进展。 2023 年 3 月,谷歌发布了 Bard,这是一款人工智能聊天机器人,与 Cohere 的命令模型等对话式人工智能产品直接竞争。 Google 作为领先的人工智能研究公司的地位及其丰富的资源和渠道使其成为 Cohere 的重要竞争对手,Google 在其 Workspace 产品等产品中不断增加 LLMs 的使用。

Anthropic:

2021年由OpenAI前高管成立,是一家人工智能研究公司,专注于构建可靠、可解释和可操纵的人工智能模型,旨在让大型语言模型变得更易理解、更可控。 Anthropic 对可解释性和安全性的关注可能会吸引寻求人工智能模型透明度和定制化的客户,从而对 Cohere 构成竞争威胁。 2023 年 5 月,Anthropic 筹集了 4.5 亿美元的 C 轮融资,泄露的融资方案目标估值为 41 亿美元。

Stability AI:

Stability AI是一家开发开源模型的人工智能公司。其 Stable Diffusion 文本到图像模型于 2022 年 8 月发布,取得了巨大成功,截至 2023 年 7 月,在 Github 上获得了超过 27,000 颗星,并激发了超过 3,500 个分叉(forks)。虽然没有达到 Stable Diffusion 的成功水平,但该公司发布了 Stable LM,于 2023 年 4 月开源 LLM。作为 LLM,Stable LM 直接与 Cohere 的产品竞争,其作为开源模型的地位给 Cohere 的产品带来了压力。 Stability AI 筹集了高达 2500 万美元的资金,在 2022 年 10 月种子轮融资后估值为 10 亿美元。2023年年底,Stability AI 考虑被并购,管理层面临着越来越大的财务压力。据报道,潜在买家包括 Cohere和Jasper。

Cohere 承担着构建每个模型的大量前期成本和持续的推理成本。它通过基于使用量的定价来收回成本,并提供三种不同的定价等级:

🖼️
图片 11 414 × 312px

📷 图片包含在完整版文章中,点击文末按钮查看

Source: Cohere

2021 年 11 月 Cohere 推出了 API,在 2021 年 9 月宣布的 A 轮融资和 2022 年 2 月宣布的 B 轮融资之间,使用量增长了 800%。

2021 年 11 月,公司宣布与 Google Cloud 建立合作伙伴关系,以访问构建和部署其产品所需的云计算基础设施。该合作伙伴关系包括谷歌的云张量处理单元(TPU),它是“针对大规模机器学习进行优化的超级计算机”。

2023 年 6 月,Cohere 宣布与 Oracle 建立合作伙伴关系,利用 Oracle 云基础设施 (OCI) 来训练、构建和部署其LLMs。 Cohere 最大的进展出现在企业市场。

2023 年 7 月,Cohere 和麦肯锡于宣布开展战略合作,麦肯锡将为其客户提供 Cohere 的生成式 AI 服务。

截止到2023年7月,Cohere已经从投资者那里筹集了超过4.45亿美元,包括Tiger、Index Ventures、Radical Ventures和Section 32在内。AI领域的知名人士,如被称为“AI教父”的Geoffrey Hinton、斯坦福计算机科学家Fei-Fei Li、伯克利教授/机器视觉的深度学习技术Covariant AI 创始人的Pieter Abbeel、多伦多大学教授/加拿大自动驾驶技术公司创始人Raquel Urtasun也投资了Cohere。

尽管人工智能在 2023 年已得到消费者的快速采用,但LLMs的商业化仍有相当大的增长空间。 Cohere 首席执行官 Aidan Gomez 表示:

如果这样的世界成为现实,对 Cohere 产品的需求将会非常高。 Cohere 已做好充分利用这一不断增长的需求的准备。

Cohere 的最佳场景是其语言模型足够先进,实现人机交互无缝连接。谷歌云首席执行官 Thomas Kurian 表示:“语言是人们与系统交互方式进化的下一个重要阶段。”如果在特定或一般用例中使用生成式人工智能的 AI 代理变得与人类没有区别,那么它将继续推动 LLMs 的采用。

分析师估计,80-90% 的数据是非结构化的。然而,非结构化数据(例如文本、图像、音频文件等)缺乏一致的数据模型,使得分析变得困难。结构化数据通常以易于处理的表格格式存储,对于公司来说相对容易分析和搜索。只有 18% 的组织利用了非结构化数据,比结构化数据少 3 倍。

非结构化数据只会变得更加普遍,年增长率约为 60%,而结构化数据的年增长率为 12%。自然语言处理(NLP)对于释放大量非结构化数据的洞察力是必要的。金融、航运、法律和医疗保健等行业已经使用 NLP 从文本中提取结构。 NLP 还可以提高可搜索性,包括语义搜索(按含义搜索)。

Cohere 的创始人兼首席执行官 Gomez 将包含“语言视觉基础系统”的多模态语言模型描述为“非常有前途”。计算机视觉不仅可以改进 Cohere 的语言模型,还可以为 Cohere 提供额外的独立产品。从 NLP 扩展到计算机视觉将使 Cohere 的潜在市场规模扩大一倍,因为估计计算机视觉市场预计将从 2020 年的 95 亿美元增长到 2030 年的 410 亿美元。

Stable LM 和 Llama 2 等开源大型语言模型的发布给 Cohere 的商业模式带来了重大风险。这些开源模型使高级语言处理功能的访问变得更加大众化,可能会削弱 Cohere 的竞争优势。如果更多的开发人员和组织采用这些免费的替代方案,Cohere 可能会在吸引和留住客户方面面临挑战。

虽然 Cohere 的模型可以提供独特的特性和功能,但考虑到免费、高质量的替代方案的可用性,其价值主张( value proposition)对于某些客户来说可能不够有吸引力。更多地采用开源LLMs,可能影响其盈利能力和可持续性。面对这些挑战,Cohere 需要不断创新并使其产品脱颖而出,以维持其市场地位。

语言模型有时会表现出偏见并产生不恰当的语言,引发道德和法律问题。 2021 年,联邦贸易委员会(FTC)禁止公司使用有偏见的算法做出影响消费者的决策。偏差的产生是因为语言模型反映了其训练数据的特征。像 Cohere 这样的大型语言模型通常是在包含偏见语言的海量互联网数据上进行训练的。尽管 Cohere 正在着力解决其模型的安全问题,但Gomes认为该公司永远无法完全解决这些问题。

通过其 API,Cohere 为客户提供了用于生成文本、对文本进行分类或生成文本的语言模型的访问权限。 NLP 的进步速度不断加快,像 Cohere 这样的公司必须在向客户提供的模型方面保持领先地位。障碍包括竞争对手之间的产品差异化以及应对现有语言模型中持续存在的偏见和弱点。 Cohere 有能力帮助客户避免运行这些模型的高成本以及有效管理技术人才短缺的障碍。