关灯
护眼
字体:大 中 小
上一页
目录
下一章
韩路一自己看了一下 Mercury 3.1就是刚才瑞恩展示的那个,得分是74.8。
办公室安静了三秒钟。
韩路一没有说话。苏念念也没有。
“我跑了三遍验证。”赵文渊说。“第一遍以为评测代码写错了。第二遍换了评测框架,分数不同,但是结果排序一样。第三遍打乱评测集做交叉验证,误差在0.3个点以内。”
他往后翻了一页。屏幕上是具体的案例对比左列是用户输入,中间是各模型的理解结果,右列是标注的真实意图。
赵文渊翻了几页案例对比,没有逐条讲解,但每一页停留的时间特意拉长了一些,像是在确认韩路一和苏念念有没有跟上。
韩路一跟上了。
意图理解,简单来说,就是模型能不能读懂用户真正想要什么。用户打字输入的内容是表面,表面之下是处境、是约束、是没说出口的真实需求。绝大多数模型在做的事情是理解字面意思,然后给出一个正确但泛泛的回答。而PX-7B做到的,是从同样的输入中读出字面背后那个具体的人。
这是一个极其困难的任务。参数量大十倍的模型都未必做得好,因为它考验的不是知识储备,而是对人的理解。
赵文渊合上案例页,回到那张柱状图。
赵文渊郑重说出了这句话。
“韩总,我做这行这么多年了,从来没见过一个7B的东西能在任何单项维度上打赢GPT-4,从来没有。”
“而且这才是第一轮,只跑了几个epoch,超参数都没调到最优。在这个基础上再调试几轮,还有上升的空间。”
苏念念一直没说话,这时候才轻轻开口说了一句:“意图理解……这不就是开物一直想做的事吗?”
韩路一点了点头,心里好像都松了一些。
视哥,给力!
沉思了一下,韩路一问了一个问题。
“如果有十万条这种精度的数据呢?”
赵文渊仰起头,对着天花板想了一会儿。
“十万条这种精度的标注,”他慢慢说,“理论上足够在70B甚至更大的基座上把意图理解能力拉到当前行业天花板,之上。”
『加入书签,方便阅读』
上一页
目录
下一章
天竹小说手机版 - 随时随地畅读精品小说
澜和文学手机站 - 小说阅读更轻便
知暮小说移动端 - 精选免费小说合集
山青小说手机版 - 畅读全网热门小说
月然书院手机版 - 小说迷的移动书架
风缤小说手机端 - 免费追更每一本好书
云初小说手机版 - 精选小说轻松看
寒涟小说手机版 - 小说更新实时推送
明歌小说手机站 - 精彩小说掌上读
清珏小说手机端 - 海量精品小说免费读
澜语小说移动版 - 小说迷的掌中宝
逸华小说手机站 - 热门小说即时更新
天桂小说手机版 - 免费小说随时读
风竹小说手机端 - 精选完本小说推荐
云明小说手机站 - 小说迷必备阅读站
书冉小说手机版 - 精彩小说免费在线
澜山小说移动端 - 精选原创小说合集
寒竹小说手机版 - 免费阅读完本佳作
清蝉小说手机端 - 小说迷的最佳阅读平台
风翎小说手机版 - 精选网络小说在线阅读