报告
中泰证券:Cohere:着力于B端赛道,OpenAI的强劲对手
admin2023-10-23 17:32
30人已围观
下载完整内容
简介Cohere:2019年成立的初创公司,提供高性价比的NLP方案Cohere成立于2019年,是一家加拿大AI初创企业,因上榜“福布斯AI50强”以及“CNBC
Cohere:2019年成立的初创公司,提供高性价比的NLP方案
Cohere成立于2019年,是一家加拿大AI初创企业,因上榜“福布斯AI50强”以及“CNBC2023年颠覆50强”而受到广泛关注。
Cohere在为开发者和企业提供不需要昂贵的机器学习开发的NLP解决方案,让各类开发人员都可以使用大型神经网络和最先进AI来解决任何语言相关问题,但却不依托于任何公共云,让模型能在私有云或本地部署中运行。
创始人团队:GoogleBrain背景加持,成员技术过硬
Cohere的联合创始人兼CEOAidanGomez是2017年学术著作《AttentionisAllYouNeed》的作者之一,该论文在人工智能研究领域具有里程碑意义,推动了计算机分析和生成文本方式的进步,ChatGPT等现代大型语言模型都由其基础衍生。AidanGomez分别在多伦多大学(本科)和牛津大学(博士)学习,也曾是GoogleBrain的成员之一。
IvanZhang是Cohere的首席科学家兼首席技术官。他创立了FOR.ai(现为CohereForAI),是一个独立的AI研究小组,他也是生物技术和MLOps领域的软件工程师。
NickFrosst也是Cohere的联合创始人,他是多伦多谷歌大脑实验室的第一位员工,也是谷歌大脑团队的前成员,主要从事机器学习领域相关研究。
募资情况:背靠NVIDIA、Oracle,当之无愧的AI独角兽企业
Cohere自创立以来,一共进行过四轮融资。其中最早的是2021年9月7日由IndexVentures领投,投资金额4000万美元,2023年6月,Cohere获得2.7亿美元C轮融资,由InoviaCapital领投,这笔交易对该公司的估值约为22亿美元,使其成为又一家AI超级独角兽企业。
迄今为止,Cohere共募集了4.35亿美元的资金,融资额仅次于OpenAI和Anthropic,一度跻身美国生成式AI行业第三大“吸金”公司。同时其投资者包括NVIDIA、Oracle、SAP等硅谷巨头,专业能力获得专业投资机构认可。核心技术:创新T-Few方法,仅更新0.32%即可完成30亿参数微调
T-Few微调提供了一种有效的方法来微调大型语言模型,解决了训练时间慢和服务资源昂贵的挑战。通过仅更新模型权重的一小部分并启用模型堆叠,T-Few微调可显着减少训练时间,同时保持高质量的微调结果。
他们引入了MoV和MoLORA这种参数高效型混合专家适应方法。在未曾见过的任务上,这种新方法只需更新0.32%的参数,就能实现与完全微调方法相当的性能。其表现也能轻松胜过(IA)3或LORA等基础的参数高效型技术。Cohere的研究团队基于55个数据集,在12个不同任务上,用770M到11B的不同大小T5模型进行了实验,均得到了一致的结果。
核心技术:运用RAG方法增强对话准确性
要完成更复杂和知识密集型的任务,可以基于语言模型构建一个系统,访问外部知识源来做到。这样的实现与事实更加一性,生成的答案更可靠,还有助于缓解“幻觉”问题。这就是检索增强生成(RetrievalAugmentedGeneration,RAG)方法。
通过运用RAG方法,Cohere的对话产品可以更好理解消息背后的意图,记住对话历史记录,并通过多轮对话进行智能响应。将用户的模型与网络搜索和重要数据源连接起来,以提高聊天响应的相关性和准确性。Cohere通过训练Command来优化RAG的准确性,包括从多个数据源确定相关信息。以及通过引用减少幻觉并在生成的响应和用户之间建立信任,以了解响应的来源。
核心产品:着力于B端赛道,提供定制生成式AI服务
Cohere主要面向B端企业客户,致力于为企业定制生成式AI服务。Cohere的垂直应用产品集中在企业运营过程中与文本有关的三个关键领域,分别是文本生成、文本分类和文本检索。
文本生成领域有Summarize、Generate、CommandModel;文本检索领域有EmbedModel、SemanticSearch和Rerank;文本分类领域的主要产品是Classify。
核心产品:模型尺寸丰富,Command在评测中表现优异
Cohere针对各个产品推出不同尺寸的模型供用户选择。Summarize、Rerank、Embed、Base、Command等各种不同功能的系列模型都有不同大小尺寸,其中Command系列模型曾推出标准版Command模型、Command-xlarge-20221108、Command-lightly、Command-nightly等不同类型。
在斯坦福大学的语言模型全面评估(HELM)中,从最大的524亿参数Command模型微调得到的对话模型CommandBeta在总共61个模型中排名第二,准确率90.6%,仅次于属于GPT-3.5系列模型text-davinci-002。
产品定价:价格精细化,总体远低于OpenAI
Cohere在产品定价方面按照不同的模型分别制定了不同的价格,同时定制化模型会收取更高的价格,方便用户根据其实际情况选择符合具体需求的产品。
Cohere系列模型价格整体低于OpenAI的微调系列模型。Cohere产品的价格远远低于OpenAI产品的最低价,且定制化价格多为基础价格的2倍。与其相比,OpenAI产品的使用价格均是其训练价格的4倍。
网站月度访问量百万级别,访问用户25-34岁年龄占比最高
2023年5月以来,网站月访问量呈稳定趋势,在8月回升之后又有所下降。总体看,网站访问量能够维持在百万级别。其中美国、印度、加拿大等国家所占流量份额较高。外链访问来源中,ProgrammingandDeveloperSoftware及ComputersElectronicsandTechnology领域占比较高。
从访问用户年龄来看,25-34岁年龄段用户占比最高。
投资者与合作伙伴
Cohere在业界拥有Salesforce、NVIDIA、Oracle、SAP等投资者和Oracle、MCKinsey、AWS、GoogleCloud等合作伙伴。如通过与Oracle的合作,用户可以使用由经过专门训练的Cohere基础模型,使用基于Oracle云基础设施(OCI)构建的原生生成式AI服务。
向量数据库领域,Cohere拥有Weaviate、Pinecone和drant等合作伙伴。Weaviate的text2vec-cohere模块允许用户直接在Weaviate矢量搜索引擎中使用Cohere嵌入作为矢量化模块;Pinecone支持使用Cohere生成语言嵌入,然后将其存储在Pinecone中并用于语义搜索;Drant与Cohere结合使用,可以提出针对特定文本分析用例的全面解决方案。秉持安全、定制和客户支持的核心观念,强调隐私保护和数据安全
Cohere专门为企业用户提供数据防火墙,解决企业数据在输入大模型中的隐私和安全问题。Cohere强调会保证客户的数据安全,在多个合作伙伴的加持下,能够提供具有数据安全性,并根据不同企业的需求和数据制作的高性能定制化模型,应用于实际业务场景。
未来发展方向:继续深耕ToB赛道,提供服务型AI产品
从模型角度看,Cohere将继续扩充优化模型规模,训练更加强大的基础模型,提升用户体验。Gomez在采访中提到公司每周都会发布一个新的模型版本,并不断对模型进行基准测试和评估以降低用户使用风险,相信未来Cohere将继续提升大模型的AI能力,打造更高性能、更高安全性的大模型。
从产品功能角度,除了继续提升模型性能之外,Cohere在未来会持续在数据保护和客户支持方面加大投入力度。对于很多企业来说,数据安全是首要考虑的问题,而大模型迭代训练需要庞大的数据,如果能够解决数据隐私和安全的问题将会是一次巨大的飞跃;客户服务方面,Cohere可以在更多领域提供定制化的AI服务,以打通市场,提高同行竞争优势。
从产品定位角度看,Cohere专注于打造toB服务型的产品,与业内云、数据库等服务型厂商进行合作,能够保障自身的独特竞争力。Cohere与业界企业达成广泛合作,主攻服务企业客户群的商业应用,直接与开发人员和企业合作,能够针对B端企业的需求提出解决方案,与OpenAI等基础模型厂商形成了一定的差异化,从而进一步扩张市场。
风险提示
AI技术落地不及预期:AI技术更新迅速,如果公司无法跟上技术应用的步伐,可能会被竞争对手超越。同时AI技术的使用会改变用户的工作方式,如果用户不愿意接受这些改变,可能会影响公司的潜在业务增长速度。即使AI技术在实验室环境中表现优秀,但在实际应用中可能遇到许多未预见的问题和挑战。技术落地的过程中可能出现技术难题、系统稳定性、性能等问题。
产品市场竞争加剧:随着竞争的加剧,公司需要不断创新以保持竞争优势。这可能需要大量的研发投入和时间,同时还需要承担创新失败的风险。同行业的竞对公司可能通过降低价格来吸引客户,这可能会迫使公司也降低价格,从而影响营收和利润。AI产品落地过程中,竞争加剧可能会分散市场,导致公司的市场份额下降。
数据更新不及时:AI领域变化较快,报告中引用的部分图表和数据存在一定的时效性,因此可能面临数据更新不及时的风险









微信公众号
下载完整内容
相关文章
文章评论
评论0
站点信息
- 微信公众号:扫描二维码,关注我们

点击排行

标签云
-
php
网页设计
个人博客
JS
个人博客
Html
春节必看: 2020新春红包大战 全攻略
新增详细玩法攻略!
支付宝集五福5亿集分宝招商银行抽现金券抖
抖音 2020 发财中国年 攻略
支付宝集五福5亿集分宝招商银行抽现金券抖
最近购买威尔胜WTB0900复刻版和WT
mysql慢查询和php-fpm慢日志
PSR-2
基础代码规范
Thinkphp
响应式
公司
整站
源码
网络科技网站模板
1024
节日
百度收录
论坛
社区
2020
豆瓣
评分最高
电影
debugger
调试
Python
语法
高德
百度地图
MySQL
追寻
webpack
vue
oracle
服务器搭建
有趣
动物
人体
历史
天文
生活
名人
体育
地理
文化
科学
心理
植物
饮食
自然
图片
JVM
IDEA
Loader
Git
UNIAPP
股票
A股
同花顺
海尔
海天味业
半年报
股市总结
歌尔股份
乐普医疗
涪陵榨菜
餐饮
财报分析
酒店
年报分析
美锦能源
山煤国际
贵州茅台
张坤
腾讯
华鲁恒升
淮北矿业
药明康德
早盘关注
国电电力
北方华创
宝丰能源
TCL中环
兔宝宝
天润乳业
启明星辰
阳光电源
山西汾酒
迈瑞医疗
人福医药
比亚迪
宁德时代
汤臣倍健
伊利股份
通威股份
东鹏饮料
隆基股份
紫金矿业
五粮液
康龙化成
赣锋锂业
爱尔眼科
片仔癀
VR
永新股份
爱美客
美的集团
格力电器
科沃斯
云南白药
同仁堂
洋河股份
白云山
三体
狂飙 原著