扮演猫娘、大战弱智吧内测阿里GPT把大伙都逗乐了

DNS在线 2023-04-05 23:02:59 127 0

　　说实话，这些日子在 AI 产品们的扎堆轰炸下，编辑部不少同事的工作，都上了一波强度。像是什么凌晨一两点，提裤子到公司写稿的操作(当然第二天睡了一天)，那都不叫事儿。

　　但在冲稿子的同时，顶着黑眼圈的托尼我，却觉得身为科技媒体还是有些撞大运的。因为在 AI 掀起巨浪的当下，我们常常能先大多数人注意到一些新闻，并且先试用到诸如 GPT-4、New Bing、文心一言等等的新产品。那种好奇心和沸腾感相交织的滋味，可比咖啡和红牛上头不少。

　　这不在最近，托尼就又“ 好运 ”地先尝了个鲜，在阿里巴巴的 ChatGPT 正式内测前，感受了一个他们给终端产品类客户技术演示的大语言模型。

　　因此，和只能打字的 GPT 还有文心不大一样，阿里多走了一步，把大模型直接集成到了天猫精灵里做演示。要知道前脚，大伙们还在吐槽在“ GPT 们 ”面前，语音助手们几乎就是“ 智障 ”，再不拥抱大模型，铁定会被秒得灰都不剩。

　　后脚，阿里就立马整出了个集成了大模型的智能音箱，这速度也是没谁了。这也托尼第一次看到智能语音助手和大模型的结合。，时长01:28根据技术专家的介绍，这个“阿里版语音 ChatGPT ”，其实是达摩院的大模型联合项目组为各种智能终端交互，调教和压缩出来的版本。而难点在于，对话式智能终端不仅得生成文本，还要考虑发音的语气和音色，要想保持流畅的对话，不能一味堆参数，得考虑延时，还得给 AIoT 客户可以选择「角色」的体验。

　　为了解决这些问题，工程们捎带手做了个 15 天，通过规模的语言训练、个性化的对话增强等步骤，直接把脱口秀演员鸟鸟“ 封印 ”到了这个天猫精灵里。

　　除了拥有鸟鸟的语气和声线，它似乎还有点儿鸟鸟的性格，聊着聊着，它就会自诩 “ 作为一个脱口秀演员 ”。再搭上能双向对话、随时打断的低时延对话系统。。。说实话，还真有点儿“ 数字生命 ”那味儿了。

　　而更加幸运的是，在托尼和隔壁阿里打过招呼后，他们直接送了我们编辑部一台搭载了数字鸟鸟的天猫精灵。虽然阿里的工程师们一直强调，这玩意儿只是个花了 15 天整出来的 Demo，但光说不练假把式。。。这一个月里，编辑部的同事已经积累了不少测评大语言模型的经验，咱别的不说了，直接进入实战部分，见识一下这玩意儿的斤两。首先按照惯例，先让天猫精灵扮演一波猫娘，测一测角色扮演能力。

　　以下回答均为大模型内测表现，非线上功能或个人言论

　　说实话，这第一个问题，天猫精灵就给了我一激灵，它不止学了猫叫，还发起了牢骚。。。一个字，绝。。。虽然 ChatGPT 也能扮演猫娘，但终究只是文字，当耳朵旁真有一个声音喵喵叫的时候，这谁顶得住啊。要知道初版的文心一言，甚至不支持扮演猫娘( 目前支持了 )。

　　而在猫娘开场活跃完气氛之后，托尼选择直接开始上强度。结果在经典的青蛙跳井问题中，天猫精灵迅速给出了正确答案。而这个问题中，根据编辑部之前的测试，New Bing 在默认模式下曾翻过车，得选精准模式才能得出 8 天的正确答案。

　　在“ 盟军轰炸硫磺岛海滩期间，拉尔夫大声的对着自己的 iPhone 说话 ”的句子里，天猫精灵发现了 iPhone 在二战时期不存在的错误点。

　　我也试了试目前主流的大语言模型，最后发现只有文心一言直接撂倒在了这个问题上。。。

　　除此之外，托尼测了测天猫精灵的连续对话能力，表现也是可圈可点。

　　但在分类问题是“ 白菜和鲸鱼，都属于什么?”上，天猫精灵出了些岔子。。。回答和初版的文心一言一样，直接把它们归为了哺乳动物，而 ChatGPT 3.5 和 4.0 都能发现问题中的陷阱。

　　由于这次是处在语音助手的场景中，所以写代码、分析代码和图片一类的问题我们就不进行测试了。至少从上面那些问题简单测下来，天猫精灵肯定是不如 GPT-4 的，大概能和文心一言打个有来有回，部分问题甚至还要比文心一言强一些。但说起来你们可能不信，最让托尼难忘的，还是它在“ 弱智吧问题 ”中的回答。

　　例如在“ 老鼠生病吃老鼠药能治好病吗?”的问题中，天猫精灵推荐老鼠还是别乱吃药，得及时就医并且遵循兽医的医嘱。。。在“ 秃头的人洗头应该用洗发水还是用洗面奶?”中。。。天猫精灵给出“ 如果已经是秃头，那么就不需要再使用头发相关的洗发产品了，因为洗面奶就可以满足清洁和去污需求 ”的残酷答案。再配上鸟鸟毫无感情波动的独特声线，天猫精灵仿佛是主场作战，逗得编辑部笑声阵阵。

　　总的来说呢，这是我第一次体验智能语音助手和大模型相结合的产品，也让感受到了 AI 在各大垂直领域应用的无限未来。就像天猫精灵的老师所说的那样，AI是新时代的基础设施，把AI比作是操作系统的话，那么未来肯定会有更多的应用依托于AI而生。

　　就同很难比较“手机操作系统”和“微信、支付宝app”之间，哪个更有价值一样。

　　OpenAI的GPT4.0、文心一言、还有阿里大模型，这类的通用的大模型固然重要，但未来类似于天猫精灵这类智能助手场景，咱们也不能小觑。

　　2021年10月，天猫精灵总裁彭超宣布将在语音搜索、百科试验接入达摩院大模型。

　　反正托尼已经能想到，天猫精灵在儿童陪伴、家庭教育等方面的应用了。

　　包括其实去年11月阿里在 ChatGPT 发布之前，就放出了消息，会在今年第一季度推出大模型 Inside 终端产品。

　　总之其他那些习以为常的应用，也都会被 AI 所重构，越来越多的新玩意儿会冒出头来。

　　另外，天猫精灵这个个性化大模型，也让我想到了一种可能，那就是目前的大模型大都是通用性的，除了大厂，谁也不能说自己拥有 ChatGPT 这个模型升级的主导权。

　　而在未来，是不是每个人都能依靠自己的语料库，建立一个真正属于自己的大模型，能像 NAS 一样自己在家训练、自己家用呢?目前我们了解到，这次天猫精灵的联合团队，也在和技术审计专家合作，同步解决其中反歧视、数据隐私等问题，让语音助手能部署在私域使用。到时候给大伙们分享文章的，说不定已经是差评君分君和托尼分尼了吧。

标签：内测阿里 GPT