返回第113节  首富从AI浪潮开始首页

关灯 护眼     字体:

上一页 目录 下一章

    韩路一自己看了一下 Mercury 3.1就是刚才瑞恩展示的那个,得分是74.8。

    办公室安静了三秒钟。

    韩路一没有说话。苏念念也没有。

    “我跑了三遍验证。”赵文渊说。“第一遍以为评测代码写错了。第二遍换了评测框架,分数不同,但是结果排序一样。第三遍打乱评测集做交叉验证,误差在0.3个点以内。”

    他往后翻了一页。屏幕上是具体的案例对比左列是用户输入,中间是各模型的理解结果,右列是标注的真实意图。

    赵文渊翻了几页案例对比,没有逐条讲解,但每一页停留的时间特意拉长了一些,像是在确认韩路一和苏念念有没有跟上。

    韩路一跟上了。

    意图理解,简单来说,就是模型能不能读懂用户真正想要什么。用户打字输入的内容是表面,表面之下是处境、是约束、是没说出口的真实需求。绝大多数模型在做的事情是理解字面意思,然后给出一个正确但泛泛的回答。而PX-7B做到的,是从同样的输入中读出字面背后那个具体的人。

    这是一个极其困难的任务。参数量大十倍的模型都未必做得好,因为它考验的不是知识储备,而是对人的理解。

    赵文渊合上案例页,回到那张柱状图。

    赵文渊郑重说出了这句话。

    “韩总,我做这行这么多年了,从来没见过一个7B的东西能在任何单项维度上打赢GPT-4,从来没有。”

    “而且这才是第一轮,只跑了几个epoch,超参数都没调到最优。在这个基础上再调试几轮,还有上升的空间。”

    苏念念一直没说话,这时候才轻轻开口说了一句:“意图理解……这不就是开物一直想做的事吗?”

    韩路一点了点头,心里好像都松了一些。

    视哥,给力!

    沉思了一下,韩路一问了一个问题。

    “如果有十万条这种精度的数据呢?”

    赵文渊仰起头,对着天花板想了一会儿。

    “十万条这种精度的标注,”他慢慢说,“理论上足够在70B甚至更大的基座上把意图理解能力拉到当前行业天花板,之上。”

    

『加入书签,方便阅读』

上一页 目录 下一章

天竹小说手机版 - 随时随地畅读精品小说 澜和文学手机站 - 小说阅读更轻便 知暮小说移动端 - 精选免费小说合集 山青小说手机版 - 畅读全网热门小说 月然书院手机版 - 小说迷的移动书架 风缤小说手机端 - 免费追更每一本好书 云初小说手机版 - 精选小说轻松看 寒涟小说手机版 - 小说更新实时推送 明歌小说手机站 - 精彩小说掌上读 清珏小说手机端 - 海量精品小说免费读 澜语小说移动版 - 小说迷的掌中宝 逸华小说手机站 - 热门小说即时更新 天桂小说手机版 - 免费小说随时读 风竹小说手机端 - 精选完本小说推荐 云明小说手机站 - 小说迷必备阅读站 书冉小说手机版 - 精彩小说免费在线 澜山小说移动端 - 精选原创小说合集 寒竹小说手机版 - 免费阅读完本佳作 清蝉小说手机端 - 小说迷的最佳阅读平台 风翎小说手机版 - 精选网络小说在线阅读