为此,产业家对国内主流AI应用做了一些盘点与梳理。希望在洞察行业前沿趋势的同时,也为把握未来的AI应用格局提供一个重要窗口。
“猛增至91万、涨幅高达264%、34倍”这一数据来自GitHub 上的AI开源项目统计对比。
那么,截止如今,国内的AI应用到底有哪些?分布在哪些方向和领域?以及它们具体的能力到底如何?
统计来看,AI 应用按应用领域可以分为通用软件、工具型应用、行业软件、智能硬件四大类。在通用软件市场,生成式 AI 在办公软件、企业服务、IT 运维、软件开发、网络安全、数据智能等应用已经率先落地,并已经进入商业化的前期,主要赛道上均有标杆产品出现。
而由于 AI智能助理(Coplilot)可以将 AI 的能力深入嵌入具体应用场景中,能够主动理解使用者的意图并提供成型的方案,成为了国内通用生成式 AI 应用最广泛的产品形态。协同办公领域基于其先天优势,AI应用落地较多。
工具型AI应用主要包括聊天机器人、搜索引擎、文本工具、AI 作画以及代码工具等,主要集中在 C 端。
值得注意的是,由于其高度依赖底层大模型。竞争优势的构建,主要来自差异化的产品定位,以及持续训练更强大的底层模型和算法,所以,目前国内工具类AI应用的同质化程度较高。
行业软件涉及金融、医疗、教育、工业、游戏、法律等多个行业,生成式AI 在游戏、法律、教育、电商等 C 端场景有较多的结合,而在医疗、金融、工业等 B 端场景下生成式 AI 产品的成熟度仍然偏低。目前,主要是金融、医疗、教育等头部厂商着重打造垂类大模型推动相关应用落地。
智能硬件包括智能汽车、机器人、智能终端等,目前生产式 AI 与智能硬件的结合主要分为两个方面。
一是语音助手,应用场景包括智能座舱、智能音箱、家用机器人等各类智能终端。另一类则为数字代理 AI Agent,主要应用包括自动驾驶、智能机器人等,具备更加广阔的应用空间。不过,目前 AI Agent 在感知与决策能力上仍存在瓶颈。
据CB Insights数据显示,到2023年第二季度为止,生成式AI领域的总投资额相较去年全年的25亿美元暴增4.6倍,尽管其中大约70%的投资资金集中在包括大型模型在内的底层AI基础设施建设,应用层的融资占比仅为三成。
就当下而言,一个值得思考的问题是,AI应用究竟行至何处?通用型、工具型、行业型、硬件型都有哪些?为此,产业家对国内主流AI应用做了一些盘点与梳理。希望在洞察行业前沿趋势的同时,也为把握未来的AI应用格局提供一个重要窗口。
功能方面,钉钉AI应用提供了内容生成与摘要,能够自动生成长文档、会议记录、聊天摘要等内容概览,显著提高信息处理效率;二是智能助手服务,包括但不限于AI写真、涂鸦作画、法律助手等功能,服务于个人用户及企业的多样化需求;三是工作流程优化。通过AI优化协同办公流程,如智能排程、任务自动化处理等,降低人力成本;四是应用生成与扩展。基于AIPaaS平台,可快速生成新的AI驱动应用或增强现有应用的功能。
接入能力上,钉钉AI应用通过统一接口与各类AI服务紧密结合,实现跨应用的一体化交互。并允许第三方开发者和合作伙伴基于钉钉AI PaaS平台开发适配自家业务的AI应用,形成共生共赢的生态环境。
目前钉钉AI应用已经在多个关键办公环节实现智能化自动化操作,减少人工干预,提升工作效率;能够根据用户行为和偏好进行一定程度的个性化推荐和定务;能够实时响应用户需求,提供决策辅助数据,帮助企业更好地进行管理和决策。
飞书智能助手MyAI能够自动汇总会议纪要,通过自然语言处理技术准确记录并整理会议重点内容,同时还可以创建各类报告,如日报、周报、月报等,大大减轻人工撰写负担。并实现了文档处理、信息管理与提取、业务洞察与流程管理以及组织洞察与赋能的智能化。
例如支持自动续写和生成文档、表格、邮件、思维导图、问卷等多元化的创作需求;具备业务洞察能力和业务流程管理能力,为企业提供决策支持和流程自动化方案等。
接入能力方面,用户可以直接在飞书App中通过对话形式与My AI互动,完成创建日程、查询信息、发起任务等操作。同时,飞书AI可以与其他应用程序和服务无缝集成,例如可通过集简云这样的平台将其AI助手功能接入到飞书机器人中,实现各种自动化工作流。企业还可以根据自身需求选择不同的AI底层模型,赋予飞书智能伙伴更高的定制性和适应性。
目前,飞书AI已成功应用于多个办公场景,包括但不限于会议管理、文档处理、内部信息检索、任务创建与跟踪、流程自动化等,有着较实用的办公辅助能力。
功能方面,腾讯会议AI应用运用先进的音频处理技术,能有效过滤背景噪音,消除回声,确保会议清晰流畅;通过人脸识别技术,实现参会人员身份验证,并能实时统计参会人数,提高会议的安全性和管理效率;会议过程中,AI能够实时将语音转换成文字,生成会议纪要,方便后续回顾和整理。还支持智能翻译、智能推荐等能力。
为了方便企业将其与自有系统或其他第三方软件进行集成,腾讯会议开放了API接口和SDK,实现会议预约、管理、统计等功能的自动化和个性化定制。并实现跨平台兼容,与与腾讯生态融合。
目前,腾讯会议AI应用已经在提高会议效率、简化操作流程、增强会议体验等方面取得显著成果,尤其在疫情期间,成为远程办公、在线教育的重要支撑工具。
WPS AI能够基于用户的输入或对话交互,自动生成各类文档,比如文章、简历、报告、邮件等,用户可以指定文档的样式、内容结构等要素。并且具备、处理文档、归纳总结、汇总整合能力。
除此之外,WPS AI还包含约100多项AI应用,涉及办公场景的各种生产力提升,如智能排版、智能图表制作、智能审阅、智能检索、智能问答等。
接入能力方面,WPS AI已经成功接入到WPS的文字处理、表格、演示文稿(PPT)、PDF阅读器等全线产品中,实现了无缝整合;WPS AI也接入了一站式数字办公平台WPS 365,为企业客户提供智能化办公工具,实现企业文档管理和协同工作的智能化升级。
目前,WPS AI采用了大语言模型技术,能够理解和生成自然语言,模拟人类进行复杂文本创作和编辑任务。且WPS AI已经面向全体用户逐步开放体验,意味着其技术成熟度和稳定性足以应对大规模用户群体的使用需求。
百度如流采用AI技术来改善会议体验,例如提供AI洞察功能,可以实时提炼议题、关键观点和发言摘要;同时,AI会议纪要能自动生成并结构化展示会议内容,支持度筛选和检索,大大提高会议产出的利用率。并在知识管理、沟通协同、智能报销、搜索与推荐方面提供完备的AI能力。
接入能力方面,百度如流提供API接口和SDK,使得企业能够将其与其他内部系统、业务流程甚至第三方应用进行深度集成,实现工作流程自动化和一体化管理;支持多终端接入,无论是在桌面端还是移动端,都能保持一致的高效办公体验;可以与企业邮箱、日程、项目管理等多种企业服务工具进行对接,实现企业级服务的全面覆盖。
目前百度如流AI应用已经实现了从企业沟通、协作、知识管理到行政事务处理等全方位的智能化改造,显著提升了企业工作效率和员工满意度。其AI技术已深入到日常工作场景的各个环节,包括但不限于智能写作、编码辅助、语音识别、噪声抑制等。
功能方面,百度文库AI智能助手可帮助用户根据提供的关键词、问题或者简要提纲,快速生成各类文档、文章、报告等内容,减轻用户的创作负担。同时提供智能编辑、智能总结、智能PPT、文档检索与推荐等能力。
百度文库AI助手并不是一个独立的App,而是集成在百度文库应用程序中,用户可以直接在App内使用AI功能,无需额外下载和配置。
关于是否对外开放API接口,公开信息未明确提到。但考虑到百度在AI领域的布局,可能存在针对企业和开发者开放的部分功能接口,允许第三方接入和集成到其他系统或平台中。
目前,百度文库AI智能助手基于文心一言模型的强大语义理解和生成能力,能够处理复杂的自然语言任务,提供高度连贯且具有一定创造性的文本输出;用户可以实时与AI助手交互,获取即时的文档创作支持和服务;对于大规模文档库的管理和处理能力较强,能够帮助用户更高效地管理、搜索和创建文档资源。
综合上述信息,百度文库AI应用已经具备相当高的智能化水平,尤其在文档创作、编辑和管理方面提供了强大的AI赋能功能。
讯飞听见可以实现实时或非实时的高质量语音转文字服务,准确率高,适用于会议记录、讲座、电话会议、访谈等各种场合的录音转写;能够自动整理会议内容,提炼出关键要点,生成结构化的会议纪要,甚至可以自动生成会议摘要和待办事项;支持多种语言的语音转文字,包括但不限于中英文互译,适用于国际会议或跨国沟通场景。
还可以利用AI算法进行内容分析,提供全文摘要,方便用户快速掌握内容核心;讯飞听见会议提供了AI赋能的云视频会议协作平台,实现高清视频通信的同时,还能够自动记录会议内容并整理成会议纪要。
接入能力方面,讯飞听见支持PC端、移动端等多种设备接入,有相应的网页版、桌面客户端和移动应用版本;开放API接口和SDK,允许第三方开发者将其语音转写功能集成到各类业务系统和应用中;还能够与讯飞自家或合作品牌的智能硬件设备无缝对接,提高语音采集和转写效率。
目前讯飞听见采用先进的AI技术,如基于大模型的语音识别引擎“星火认知大模型”,极大地提升了语音转文字的准确性和智能性。已经广泛应用在企业办公、远程教育、法庭庭审、记者采编、影视后期制作等多个实际场景中,助力工作效率提升。
用户只需输入一段自然语言描述,文心一格即可依据描述内容生成对应的高质量图像,实现了从文本到视觉艺术作品的转换。还可以根据用户需求生成不同风格的画作,包括但不限于国画、油画、水彩画、插画、动漫等多元风格。
文心一格不仅可以描绘具体的实物,还能理解抽象概念和情感色彩,赋予作品一定的艺术想象力和创新性。
接入能力方面,文心一格提供了Web应用程序,用户可以直接访问官方网站使用该服务。具有对外提供API的能力,但具体是否开放API供第三方开发者接入尚待验证。
文心一格采用了百度自主研发的大规模预训练模型,在生成图像的质量和创意上达到了较高水准,能较好地理解和诠释用户的文本描述。由于其便捷性和创新性,文心一格可以广泛应用于艺术创作、设计素材生成、个性化广告制作、教育辅助等多个领域。
文心一格作为一款AI绘画工具,目前已经在基于文本描述的图像生成领域取得了突破性进展,可以满足用户多样化的图像创作需求。
Dreamina能够根据用户输入的文字描述生成对应的创意图片,允许用户只需输入文本即可创造出多样化的图像内容,涉及不同风格、色彩和元素;用户还能对生成的图片进行一系列的编辑和调整,如更改尺寸、比例、模板,甚至细化到对图片元素的增删、颜色变化和位置调整等,大大提高了创作自由度和个性化表达的可能性。
剪映系列产品的特点是通常具有良好的跨平台支持,Dreamina很可能也能够在手机、电脑和iPad等多种设备上使用,方便用户随时随地进行创作。目前并未开放给企业级用户。
目前,Dreamina已经实现了较高的自动化水平,能基于用户的输入生成高质量的艺术作品,减少了传统图像创作所需的手动绘图或素材搜集步骤。Dreamina能够生成富有创意和想象力的作。