Lazy loaded image
🔫关于内部工具平台智能化建设的想法
Words 1012Read Time 3 min
2025-3-7
2025-3-12
type
status
date
slug
summary
tags
category
icon
password
comment
Status
下面的想法和观点都是基于报告生成这个功能点。但是我觉得同样也能够泛化到整个平台。

现在的产品形态适合大模型应用吗?

不适合,现在的产品最主要的问题是用传统的逻辑去生成报告,人工配置的太细,造成只能单个功能点依赖大模型。这在之前模型能力有限的情况下是合理的,因为模型做不了太复杂的问题。只有把一个大任务拆分成一个又一个简单的任务大模型才能胜任,就像之前模型生成的内容太“软”没有办法支撑起一个大的框架,只能拆分成一个又一个很小颗粒度的模具。但是随着模型能力的提升,生成的内容不再那么“软”了,而且未来生成的内容会越来越“硬”。那么现在的平台对于大模型能力就不是加持而是负担了。

什么样的适合大模型应用?

我现在的感觉是,一个适合大模型的应用,应该是让用户能够与大模型更好的交互,在满足用户需求的基础上,尽可能的释放大模型能力,而不是让大模型适应平台的限制。
难道直接采用大模型的输出吗?这当然是我们最终的目标,但是因为模型幻觉的存在,我们只能无限的接近这个目标。幸运的是我们并不需要100%达到这个目标,省去所有人工。我们只要达到60%,就能提高600%的人效。
那平台的功能定位是什么呢?我觉得有两点,第一如何将智能体的执行过程和逻辑直观的展示给用户;第二如何让用户参与到智能体执行,并纠正智能体的执行过程。只有这两点都满足,才能切切实实地保证输出质量,并提高用户体验。

现在的平台应该怎样修改?

现在平台是基于任务的关键词或者标签,我觉得任务看板是一个合适的切入点。比如在任务看板筛选完条件以后,直接带到报告生成。根据最终的es条件进行工具调用完成统计分析,但在这过程中需要将智能体的执行不断展示给用户(甚至可以回查文章列表),并且在关键节点需要用户确认或者接管。最终实现一个用户监督指导报告生成内容的效果,这样不管是日报、月报、还是专报都能适用这套模式。当然报告内容生成以后到提供给客户的文档格式应该是另一个模块的事情。整个过程可能需要5-10分钟。
感觉下面这张图的样式就很适合报告生成:
notion image

未来平台是什么样子的

利用模型的反思和推理能力,不断优化智能体流程,降低模型幻觉产生,减少生成报告时的人工介入。最终能够将智能体生成的报告中需要检查的地方和工具检索到的内容进行对照,一目了然,用户能够用10秒就能确定一篇文章的数据是否符合交付标准。(本质上就是任务看板和报告内容的对照)
 
这只是我个人在我眼界范围内的思考和想法,有些观点可能不符合现在公司的实际情况,仅供参考。
 
2025.03.07
上一篇
过拟合与欠拟合
下一篇
notebook LM