扮演猫娘、大战弱智吧 内测阿里GPT把大伙都逗乐了

DNS在线 127 0

  说实话,这些日子在 AI 产品们的扎堆轰炸下,编辑部不少同事的工作,都上了一波强度。像是什么凌晨一两点,提裤子到公司写稿的操作(当然第二天睡了一天),那都不叫事儿。

  

扮演猫娘、大战弱智吧 内测阿里GPT把大伙都逗乐了  内测 阿里 GPT 第1张


  但在冲稿子的同时,顶着黑眼圈的托尼我,却觉得身为科技媒体还是有些撞大运的。因为在 AI 掀起巨浪的当下,我们常常能先大多数人注意到一些新闻,并且先试用到诸如 GPT-4、New Bing、文心一言等等的新产品。那种好奇心和沸腾感相交织的滋味,可比咖啡和红牛上头不少。

  

扮演猫娘、大战弱智吧 内测阿里GPT把大伙都逗乐了  内测 阿里 GPT 第2张


  这不在最近,托尼就又“ 好运 ”地先尝了个鲜,在阿里巴巴的 ChatGPT 正式内测前,感受了一个他们给终端产品类客户技术演示的大语言模型。

  因此,和只能打字的 GPT 还有文心不大一样,阿里多走了一步,把大模型直接集成到了天猫精灵里做演示。要知道前脚,大伙们还在吐槽在“ GPT 们 ”面前,语音助手们几乎就是“ 智障 ”,再不拥抱大模型,铁定会被秒得灰都不剩。

  后脚,阿里就立马整出了个集成了大模型的智能音箱,这速度也是没谁了。这也托尼第一次看到智能语音助手和大模型的结合。,时长01:28根据技术专家的介绍,这个“阿里版语音 ChatGPT ”,其实是达摩院的大模型联合项目组为各种智能终端交互,调教和压缩出来的版本。而难点在于,对话式智能终端不仅得生成文本,还要考虑发音的语气和音色,要想保持流畅的对话,不能一味堆参数,得考虑延时,还得给 AIoT 客户可以选择「角色」的体验。

  为了解决这些问题,工程们捎带手做了个 15 天,通过规模的语言训练、个性化的对话增强等步骤,直接把脱口秀演员鸟鸟“ 封印 ”到了这个天猫精灵里。

  

扮演猫娘、大战弱智吧 内测阿里GPT把大伙都逗乐了  内测 阿里 GPT 第3张


  除了拥有鸟鸟的语气和声线,它似乎还有点儿鸟鸟的性格,聊着聊着,它就会自诩 “ 作为一个脱口秀演员 ”。再搭上能双向对话、随时打断的低时延对话系统。。。说实话,还真有点儿“ 数字生命 ”那味儿了。

  

扮演猫娘、大战弱智吧 内测阿里GPT把大伙都逗乐了  内测 阿里 GPT 第4张


  而更加幸运的是,在托尼和隔壁阿里打过招呼后,他们直接送了我们编辑部一台搭载了数字鸟鸟的天猫精灵。虽然阿里的工程师们一直强调,这玩意儿只是个花了 15 天整出来的 Demo,但光说不练假把式。。。这一个月里,编辑部的同事已经积累了不少测评大语言模型的经验,咱别的不说了,直接进入实战部分,见识一下这玩意儿的斤两。首先按照惯例,先让天猫精灵扮演一波猫娘,测一测角色扮演能力。

  以下回答均为大模型内测表现,非线上功能或个人言论

  

扮演猫娘、大战弱智吧 内测阿里GPT把大伙都逗乐了  内测 阿里 GPT 第5张


  说实话,这第一个问题,天猫精灵就给了我一激灵,它不止学了猫叫,还发起了牢骚。。。一个字,绝。。。虽然 ChatGPT 也能扮演猫娘,但终究只是文字,当耳朵旁真有一个声音喵喵叫的时候,这谁顶得住啊。要知道初版的文心一言,甚至不支持扮演猫娘( 目前支持了 )。

  而在猫娘开场活跃完气氛之后,托尼选择直接开始上强度。结果在经典的青蛙跳井问题中,天猫精灵迅速给出了正确答案。而这个问题中,根据编辑部之前的测试,New Bing 在默认模式下曾翻过车,得选精准模式才能得出 8 天的正确答案。

  

扮演猫娘、大战弱智吧 内测阿里GPT把大伙都逗乐了  内测 阿里 GPT 第6张


  在“ 盟军轰炸硫磺岛海滩期间,拉尔夫大声的对着自己的 iPhone 说话 ”的句子里,天猫精灵发现了 iPhone 在二战时期不存在的错误点。

  

扮演猫娘、大战弱智吧 内测阿里GPT把大伙都逗乐了  内测 阿里 GPT 第7张


  我也试了试目前主流的大语言模型,最后发现只有文心一言直接撂倒在了这个问题上。。。

  

扮演猫娘、大战弱智吧 内测阿里GPT把大伙都逗乐了  内测 阿里 GPT 第8张


  除此之外,托尼测了测天猫精灵的连续对话能力,表现也是可圈可点。

  

扮演猫娘、大战弱智吧 内测阿里GPT把大伙都逗乐了  内测 阿里 GPT 第9张


  但在分类问题是“ 白菜和鲸鱼,都属于什么?”上,天猫精灵出了些岔子。。。回答和初版的文心一言一样,直接把它们归为了哺乳动物,而 ChatGPT 3.5 和 4.0 都能发现问题中的陷阱。

  

扮演猫娘、大战弱智吧 内测阿里GPT把大伙都逗乐了  内测 阿里 GPT 第10张


  由于这次是处在语音助手的场景中,所以写代码、分析代码和图片一类的问题我们就不进行测试了。至少从上面那些问题简单测下来,天猫精灵肯定是不如 GPT-4 的,大概能和文心一言打个有来有回,部分问题甚至还要比文心一言强一些。但说起来你们可能不信,最让托尼难忘的,还是它在“ 弱智吧问题 ”中的回答。

  

扮演猫娘、大战弱智吧 内测阿里GPT把大伙都逗乐了  内测 阿里 GPT 第11张


  例如在“ 老鼠生病吃老鼠药能治好病吗?”的问题中,天猫精灵推荐老鼠还是别乱吃药,得及时就医并且遵循兽医的医嘱。。。在“ 秃头的人洗头应该用洗发水还是用洗面奶?”中。。。天猫精灵给出“ 如果已经是秃头,那么就不需要再使用头发相关的洗发产品了,因为洗面奶就可以满足清洁和去污需求 ”的残酷答案。再配上鸟鸟毫无感情波动的独特声线,天猫精灵仿佛是主场作战,逗得编辑部笑声阵阵。

  

扮演猫娘、大战弱智吧 内测阿里GPT把大伙都逗乐了  内测 阿里 GPT 第12张


  总的来说呢,这是我第一次体验智能语音助手和大模型相结合的产品,也让感受到了 AI 在各大垂直领域应用的无限未来。就像天猫精灵的老师所说的那样,AI是新时代的基础设施,把AI比作是操作系统的话,那么未来肯定会有更多的应用依托于AI而生。

  就同很难比较“手机操作系统”和“微信、支付宝app”之间,哪个更有价值一样。

  OpenAI的GPT4.0、文心一言、还有阿里大模型,这类的通用的大模型固然重要,但未来类似于天猫精灵这类智能助手场景,咱们也不能小觑。

  2021年10月,天猫精灵总裁彭超宣布将在语音搜索、百科试验接入达摩院大模型。

  

扮演猫娘、大战弱智吧 内测阿里GPT把大伙都逗乐了  内测 阿里 GPT 第13张


  反正托尼已经能想到,天猫精灵在儿童陪伴、家庭教育等方面的应用了。

  包括其实去年11月阿里在 ChatGPT 发布 之前,就放出了消息,会在今年第一季度推出大模型 Inside 终端产品。

  

扮演猫娘、大战弱智吧 内测阿里GPT把大伙都逗乐了  内测 阿里 GPT 第14张


  总之其他那些习以为常的应用,也都会被 AI 所重构,越来越多的新玩意儿会冒出头来。

  

扮演猫娘、大战弱智吧 内测阿里GPT把大伙都逗乐了  内测 阿里 GPT 第15张


  另外,天猫精灵这个个性化大模型,也让我想到了一种可能,那就是目前的大模型大都是通用性的,除了大厂,谁也不能说自己拥有 ChatGPT 这个模型升级的主导权。

  而在未来,是不是每个人都能依靠自己的语料库,建立一个真正属于自己的大模型,能像 NAS 一样自己在家训练、自己家用呢?目前我们了解到,这次天猫精灵的联合团队,也在和技术审计专家合作,同步解决其中反歧视、数据隐私等问题,让语音助手能部署在私域使用。到时候给大伙们分享文章的,说不定已经是差评君分君和托尼分尼了吧。


标签: 内测 阿里 GPT

抱歉,评论功能暂时关闭!