2023 年 6 月,硅谷科技媒体 The Information 在盘点最有可能成为 “中国 OpenAI” 的 5 家企业时,「智谱 AI」赫然在列。
但成为 Open AI,并不是智谱 AI 的目标。现如今,市面上最主流的三种模型训练路径都出自西方:GPT 来自 OpenAI,BERT 和 T5 都来自谷歌。
模仿不如超越,为了寻求更好的技术路径,智谱 AI 提出了全新的 GLM (通用语言模型) 架构。若 GPT 的原理可以被比作 “根据上文做完形填空”,那么 GLM 完形填空的依据则从上文扩充到上下文——理论上,GLM 的训练效率会比 GPT 更高,也能理解更复杂的场景。
时至今日,GLM 的探索已经初见成效。 “在硅谷,智谱 AI 的 GLM 应该是最被头部科技企业承认的中国大语言模型。” 一名微软的算法工程师表示。
为了更早推动 AGI(通用人工智能)技术,智谱 AI 没有选择推出行业大模型,而是说服行业客户在通用大模型基座上做微调。
智谱 AI 合作研发的超大规模预训练语言模型 GLM-130B,是 2022 年亚洲唯一入选斯坦福评测的全球主流大模型。这个自研的大语言模型,也直接让智谱 AI 的名字,出现在百度、字节、 360 、有道等企业的合作名单中。
2023 年 10 月 23 日,顺为团队联合智谱 AI 团队,为数十家顺为被投企业 CEO 及 CTO 带来了精彩的线上分享。在第四期「顺为·并不难」CEO 赋能计划课程中,智谱 AI COO 张帆先生针对当下创业者感兴趣的方向与问题作出了详细的阐述与解答。
· 在当下的大模型时代,企业该如何抓住时代机遇,将自己的商业模式与大模型技术结合起来?
· 大模型的商业应用场景有哪些?
· 是如何重构用户新体验,给商业带来新机会的?
……
01
大模型技术的普及与国内代表企业的兴起
在人工智能领域,大模型是指由数百亿甚至数万亿个参数组成的神经网络模型, 这些模型能够通过海量数据进行训练, 从而拥有强大的数据处理能力和精确的预测能力。这些模型可以处理大量数据,并具有强大的泛化能力。然而,在过去,大模型的应用主要集中在互联网大厂,因为它们需要大量的数据和计算资源。但随着神经网络的成熟和计算能力的提高,大模型开始逐渐普及,并在各个领域得到应用。
目前,国内已经有多个大模型开源项目,如智谱 AI 、百度等。这些项目通过提供 API 和模型,为企业和开发者提供了使用大模型的机会。然而,要充分利用大模型的优势,需要找到合适的场景和需求,并进行有效的调优和优化。
02
智谱 AI:
致力于研究大模型技术落地应用与场景
智谱 AI 自 2019 年成立以来,一直致力于将大型神经网络模型应用于实际场景。公司从成立之初就开始着手研究大模型的落地,其中包括参与研究 1.75 万亿参数的超大规模大模型。
在 2021 年 12 月,智谱开始准备机器和算力进行训练,历经 9 个月的时间,直到 2022 年 8 月,成功推出了第一个版本。目前,智谱的大模型已经在文本生成、视频生成等领域取得了一些初步成果,公司也正在寻找一些客户来进行早期的共创。
智谱 AI 在行业中的优势主要体现在以下几个方面:
· 成熟的大型神经网络模型:智谱 AI 拥有成熟的大模型矩阵,能在国内实现比较全面、成熟、选择余地大的 AI 应用。
· 降低 AI 成本:智谱 AI 的大模型能够降低 AI 的生产成本,使得 AI 的应用不再仅限于互联网大厂,而是可以向更多的企业和开发者普及。
· 带来 AI 的普惠:智谱 AI 的大模型让 AI 的使用变得无处不在,让所有的大厂或者是大佬都在纷纷下场,这是一种全新的 AI 使用能力。
· 高效的利用大模型:智谱 AI 可以通过自然语言来生成代码,直接进行编程的开发,或者做一些 NL 出 circle,对于大数据体系的计息的分析等。
· 应用场景丰富:智谱 AI 的大模型可以应用于文本生成、视频生成等领域,并取得了一些初步成果。
03
企业该如何充分利用大模型技术优势?
现如今,企业对于数据安全的要求越来越高。于是智谱 AI 也推出了国内目前唯一一个可以提供千亿模型的私有化方案。形态非常开放,提供了:base 模型、 chat 模型以及训练微调、推理量化等所有功能,都是以源代码的形式提供的。
此外,智谱 AI 鼓励企业在平台上进行二次开发,进一步优化其功能,并为企业提供相应的咨询服务来协助企业更好地使用。
大模型是一次人机交互方式的升级。从最初的键盘输入,到鼠标操作,再到触屏,到今天的自然语言处理,交互方式越来越自然。而每一次交互方式的变革,都会带来新的市场机会。
智谱今年沟通过超过 1000 家的客户,其中和超过 100 家进行了场景共创。那么,企业该如何充分应用大模型技术带来的优势呢?
· 明确需求:在应用大模型之前,我们需要清楚自己的业务场景和需求,以便找到合适的模型和应用方式。
· 借鉴经验:可以参考和学习其他类似项目或产品,借鉴它们的成功经验,以便更好地应用大模型。
· 绘制发展蓝图:明确企业未来发展方向与大模型技术的交汇点,来更好实现以技术提高企业效率的目标。
· 尽快应用:在业务中尽快尝试应用大模型,无论规模大小,以便尽早体验和了解大模型的优势。
· 优化和调优:在实际应用过程中,根据实际情况对大模型进行优化和调参,以提高其在特定场景下的表现。
· 评估价值:评估大模型在业务中的价值,如能否节省成本、提高效率等,以便更好地衡量其应用效果。
· 核心竞争力:在模型时代,要明确自己的核心竞争力,并关注市场上类似产品的动向和发展趋势。
· 合作与共创:与合作伙伴共同探讨和开发大模型的应用,以实现资源共享和共同进步。
04
大模型技术的实际应用举例
在与 100 多家客户的深度合作中,智谱 AI 对大模型的应用能力进行了全面的总结。今天,我想与大家分享这些宝贵的经验,探讨大模型如何在各种业务场景中发挥作用。
1. 文本生成:在大模型的帮助下,文本生成不再受限于模板,而是变得更加富有创意和表现力。例如,广告文案生成企业 Jasper AI 就利用大模型成功地为广告创作出了充满创意的文案,如 “每一双脚都需要一个温暖的拥抱” 。此外,与广告公司的合作也有效提高了广告文案的生成效率。
2. 办公自动化:大模型也正在为办公软件如 Notion AI 和 WPS 增添新功能,从内容生成、文章风格转换到 PPT 生成,都显著提高了工作效率。
3. 新闻与内容创作:专业领域的媒体,如撰写半导体相关的新闻,已经使用 AI 从文章中提取并生成新内容。此外,大模型还为社交平台如抖音、小红书等生成有针对性的文案。
4. 创作领域:大模型在剧本撰写、直播脚本以及小说生成等领域都有所应用。
5. 人力资源:在招聘领域,大模型可以根据公司需求生成详细的职位描述。
6. 数据分析报告:合作伙伴如万德等公司利用大模型将数据分析结果转化为直观的报告,从而为用户提供更有价值的结论。
7. 信息抽取:传统上,从非结构化数据中抽取结构化信息是一项耗时的工作,但大模型显著提高了这一过程的效率和泛化能力。
8. 信息检索:随着数据规模的增长,大模型为信息检索带来了全新的体验,从微软的搜索引擎到视频搜索,为用户提供更精准的答案。
9. 智能客服:现代的智能客服已经能够直接处理文档,根据内容回答问题,为客户提供更高效的服务。
10. 语音助手与车载系统:大模型也正在为语音助手和汽车智能驾驶舱提供更自然的交互体验。
11. 办公场景:在会议记录、数据分析和代码生成等场景中,大模型都发挥了关键作用。
……
当需要数据支持决策时,高效的数据获取和处理非常关键。大模型可以将自然语言查询转化为数据库查询语句,从而快速获取数据。大模型在多个业务场景中的应用,都能为我们的工作带来了巨大的便利,随着其技术的不断进步,我们相信未来还会有更多的应用领域等待我们去探索和发掘。
关于「顺势而为·并不难!」
投后赋能系列活动
「顺势而为,并不难!」是顺为团队为被投企业 CEO 推出的一项内部赋能计划,本系列活动希望可以围绕 CEO 们关心的那些 “看起来很难” 的经营管理课题,通过邀请最具实战方法论的讲师领教,定制一系列科学实用的课程内容,营建一个有教学相长、有认知浓度的学习型场域,为 CEO 们答疑解惑。让 “方法” 真正对准 “难题”,最终实现 “看起来很难,其实并不难” 。
正如顺为自创立之初秉持的使命与梦想:“抬头看路,顺势而为。做创业者的朋友,协助创业者创立受人尊敬的企业,助力推动社会进步” 。漫漫创业征途中,我们将与创业者一齐破解的难题和共享的经验包含但不限于:战略落地、业务增长、组织变革、人才选用、管理优化等各方面。
关于「智谱 AI」
智谱 AI 致力于打造新一代认知智能大模型,专注于做大模型的中国创新。公司于 2020 年底开始研发 GLM 预训练架构,并训练了百亿参数模型 GLM-10B,2021 年利用 MoE 架构成功训练出万亿稀疏模型,于 2022 年合作研发了双语千亿级超大规模预训练模型 GLM-130B,并基于此千亿基座模型打造大模型平台及产品矩阵。
公司践行 Model as a Service(MaaS)的市场理念,推出大模型 MaaS 开放平台(https://open.bigmodel.cn/),基于领先的千亿级多语言、多模态预训练模型,打造高效率、通用化的 “模型即服务”AI 开发新范式,实现服务效率的提升。
2023 年,智谱 AI 推出了千亿基座的对话模型 ChatGLM,并开源单卡版模型 ChatGLM-6B,使得研究者和个人开发者进行微调和部署成为可能。 2023 年 6 月,ChatGLM2 正式发布,千亿基座对话模型全系升级,提供丰富尺寸,适用于多种场景。在细分领域方面,团队打造了 AIGC 模型及产品矩阵,包括生成式 AI 提效助手智谱清言、高效率代码模型 CodeGeeX 等。
通过认知大模型链接物理世界的亿级用户,智谱 AI 基于完整的模型生态和全流程技术支持,为千行百业带来持续创新与变革,加速迈向通用人工智能的时代。官网请见(zhipuai.cn)。